30/09/2018, 17:41

Lấy Title và Body của một trang báo trong android

Hi mọi người,
Hiện tại em đang làm một project cần lấy title và body của một trang báo về xử lý.
Em đã tìm hiểu và thử một số solution :

  • Custom WebViewClient
  • HttpClient
  • URLConnection
    Nhưng vẫn chưa lọc được Title và body của một trang báo về sử lý.
    Mong mọi người góp ý cho em xem có solution nào để xử lý việc này không ah?
    Em cảm ơn!
TTmagic viết 19:49 ngày 30/09/2018

Bạn tìm hiểu về jsoup xen sao

Nguyễn Hữu Nghĩa viết 19:48 ngày 30/09/2018

nếu bạn đã tìm hiểu + URLConnection thì tìm hiểu thêm Regex !

Tất cả bạn cần là JSoup…

Tuanjnfor viết 19:55 ngày 30/09/2018

Cám ơn mọi người, em đã load được body và title của trang web về máy:
Em sử dụng jsoup theo base code:

import java.io.IOException;
import java.util.logging.*;
import org.jsoup.*;
import org.jsoup.nodes.*;
import org.jsoup.select.*;

public class JavaApplication14 {

  public static void main(String[] args)  {
    try {
      String url = "https://tanmoy_mahathir.makes.org/thimble/146";
      Document doc = Jsoup.connect(url).get();
      Elements paragraphs = doc.select("p");
      for(Element p : paragraphs)
        System.out.println(p.text());
    } 
    catch (IOException ex) {
      Logger.getLogger(JavaApplication14.class.getName())
            .log(Level.SEVERE, null, ex);
    }
  }
}
Kien Nguyen viết 19:41 ngày 30/09/2018

Mình hỏi chút. Nếu trang báo đó sau khi đã load page xong mới dùng javascript để render dữ liệu thì có vẻ dùng jsoup trong trường hợp này vẫn không hiệu quả. Hoặc không lấy được content mình cần.

Bài liên quan
0