01/10/2018, 09:50

Cần giúp đỡ về Scraper

câu hỏi: lọc các tin tức trên web mà thầy đưa.
(thầy đưa là ile html)
và có code là như vậy.
thầy bảo thêm code vào. vậy cho mình hỏi cách làm như thế nào.

import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.Writer;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class main {

	public static void main(String[] args) throws Exception
	{
		String content ="";
		BufferedReader br = new BufferedReader(new FileReader("vnexpress.html"));
		String line;
		while((line = br.readLine())!=null)
		{
			content +=line;
		}
		Document doc = Jsoup.parse(content);
		Elements page_news = doc.getElementsByClass("list_news");
		for(Element list_news: page_news)
		{
			Elements news = list_news.children();
			for(Element li:news)
			{
				Element h3 = li.getElementsByClass("title_news").first();
				Element a =  h3.getElementsByTag("a").first();
				String title = a.text();
				Element news_lead = li.getElementsByClass("news_lead").first();
				
				String new_content = news_lead.text();
			}
		}
	}

}

Mi Móm viết 11:59 ngày 01/10/2018

có ai giúp mình bài này được k

khui khui viết 11:58 ngày 01/10/2018

bạn có thể tham khảo trang này nè https://jsoup.org/cookbook/

Bình luận về bài viết này

Chia sẻ tin đăng đến bạn bè

Gửi Messenger

Bài liên quan

Mi Móm

0 chủ đề

0 bài viết

Tác giả nổi bật

Từ khóa nổi bật

AngularJS Blog Bootstrap C / C++ Cấu trúc dữ liệu & Giải thuật Cơ sở dữ liệu Codeigniter Công cụ lập trình CSS CSS cơ bản CSS3 Học Excel HTML HTML cơ bản HTML5 Java Javascript jQuery Json Lập trình mobile Laravel Linux MongoDB MySQL NodeJS Oracle Pascal PHP PHP cơ bản PHP nâng cao Python React Native ReactJS Ruby SEO SQL Server Swift Visual Basic VueJS WordPress XML

Chủ đề nổi bật

0

Các chủ đề đang được quan tâm

phần mềm lập trình php | lập trình web php + mysql | khóa học lập trình php | tự học lập trình php | học php cơ bản thachpham | Thùng rác chính hãng giá rẻ- thùng rác hàng chất lượng- lh 0911082000 | MMOexp Monopoly Go: Tycoon Tips for Multiplier Success | Thùng rác công nghiệp, thùng rác chất lượng giá rẻ tại miền tây- thùng rác 120L 240L- lh 0911082000 | Code24h | Cho thuê phòng trọ hà nội | Cho thuê phòng trọ bình thạnh | Cho thuê phòng trọ | Cho thuê nhà trọ

Đăng ký

Đăng ký nhận thông báo

Các bài học thú vị sẽ được gửi đến inbox của bạn

HỖ TRỢ HỌC VIÊN

Các câu hỏi thường gặp
Điều khoản sử dụng
Chính sách và quy định
Chính sách bảo mật thanh toán
Hỗ trợ học viên: hotro@code24h.com
Báo lỗi bảo mật: security@code24h.com

VỀ CODE24H

HỢP TÁC VÀ LIÊN KẾT

KẾT NỐI VỚI CHÚNG TÔI

TẢI ỨNG DỤNG TRÊN ĐIỆN THOẠI