01/10/2018, 15:43
Làm thế nào để đọc thông tin của website dùng jsoup?
Chào mọi người!
Em muốn viết một chương trình lấy một thông tin website cụ thể như sau:
B1: Truy cập vào https://www.domain.com/
B2: Sau đó nhập thông tin bất kì rồi ấn tìm kiếm.
B3: Get source code của trang vừa tìm kiếm.
Em dùng ngôn ngữ java và dùng thư viện jsoup thì có thể lấy được source code được rồi. Nhưng bước 1 và bước 2 thì vẫn chưa làm được. Mong mọi người hướng dẫn hoặc gợi ý từ khóa cho em. Cảm ơn!
Bài liên quan
jsoup chỉ có nhiệm vụ crawl data thôi chứ không thể thực hiện submit form
Nhưng https://domain.com, form search domain lại dùng GET method nên bạn có thể thêm giá trị vào query
search
VD: https://www.domain.com/checkout?search=sakadream.me
Sau đó dùng
jsoup
để crawl lấy thông tin bạn cầnHeadless Browser
GitHub
dhamaniasad/HeadlessBrowsers
HeadlessBrowsers - A list of (almost) all headless web browsers in existence