10/10/2018, 09:20

Lấy nội dung qua RSS

Mình đang làm đề tài về web, liên quan RSS Feed, mình có chút thắc mắc xin mọi người chỉ giúp. Khi mình parse 1 RSS thì mình chỉ thu được chủ đề (channel), và các tin trong chủ đề đó (item). Mình chỉ quan tâm cái item, giả sử trong đó nó có: title, description, link và pubDate, với link là link đến 1 bài báo trên web. Có cách nào để mình lấy được toàn bộ nội dung chính của bài báo đó thông qua RSS k?
nquocchis viết 11:29 ngày 10/10/2018
Qua RSS ko lấy đc nội dung, bạn theo link đó tiếp tục phân tích rồi trích ra nội dung
fairplay viết 11:32 ngày 10/10/2018
Muốn lấy nội dung bạn phải hiểu rõ về Regular Expression - Mình đã làm được hầu hết các site tin tức của VN rồi, mình nghĩ bạn cũng sẽ làm được.
sangit viết 11:34 ngày 10/10/2018
Mong các bạn nói cụ thể hơn đi, hoặc cho mình example để mình rõ hơn. Mình k rành cái này cho lắm.
nguyenthanhchau viết 11:35 ngày 10/10/2018
Vấn đề là bạn muốn dùng NN gì để làm cái này?
mình đã từng làm đề tài này bằng Java.NN nào cũng thế cả thôi. sử dụng kỹ thuật mò tìm (Webcrawler) hoặc 1 vài kỹ thuật khác, rồi sau đó lập bảng chỉ mục cho các RSS thu đc thôi. mỗi RSS link tới 1 trang có nội dung mà mình muốn tìm. nếu bạn muốn thì mình gửi source cho tham khảo .
yahoo: changkhothuychung_dh202@yahoo.com.vn
Bài liên quan
0