01/10/2018, 15:43

Làm thế nào để đọc thông tin của website dùng jsoup?

Chào mọi người!
Em muốn viết một chương trình lấy một thông tin website cụ thể như sau:
B1: Truy cập vào https://www.domain.com/
B2: Sau đó nhập thông tin bất kì rồi ấn tìm kiếm.
B3: Get source code của trang vừa tìm kiếm.
Em dùng ngôn ngữ java và dùng thư viện jsoup thì có thể lấy được source code được rồi. Nhưng bước 1 và bước 2 thì vẫn chưa làm được. Mong mọi người hướng dẫn hoặc gợi ý từ khóa cho em. Cảm ơn!

Phan Bá Hải viết 17:48 ngày 01/10/2018

jsoup chỉ có nhiệm vụ crawl data thôi chứ không thể thực hiện submit form
Nhưng https://domain.com, form search domain lại dùng GET method nên bạn có thể thêm giá trị vào query search
VD: https://www.domain.com/checkout?search=sakadream.me

Sau đó dùng jsoup để crawl lấy thông tin bạn cần

Hung viết 17:45 ngày 01/10/2018

Headless Browser

GitHub

dhamaniasad/HeadlessBrowsers

HeadlessBrowsers - A list of (almost) all headless web browsers in existence

Bài liên quan
0