01/10/2018, 08:42

Hỏi về trích xuất dữ liệu từ Website

Các Anh/Chị cho e hỏi: E đã dùng python đăng nhập được vào web (như hình H1),

Carot viết 10:44 ngày 01/10/2018

Khi đã đăng nhập được vào thì mình chỉ cần để trỏ chuột vào các thẻ tương ứng, tự động nó sẽ xổ ra các báo cáo cho mình, muốn xem báo cáo nào mình chỉ cần click vào báo cáo đó. ở đây e muốn xem “Sổ kế toán - báo cáo tài chính” nằm trong thẻ “Báo cáo - Sổ kế toán” . E chạy thử code thì thấy mục “Sổ kế toán - báo cáo tài chính” chứa ở link: href /SoKeToanBaoCao/Index (như hình H2).

Carot viết 10:55 ngày 01/10/2018

E tìm hiểu trên google thấy viết code: driver. find_element_by_link_text(“2. Sổ kế toán - báo cáo tài chính [Alt + 4]”).click(), e làm theo nhưng mãi vẫn không click vào đó được để vào xem báo cáo. Nếu click được nó sẽ vào được giao diện như hình H3.

Carot viết 10:46 ngày 01/10/2018

E đã thử web zing.vn (vì web của e cần làm cũng giống web zing; ở chỗ: khi vào web có những thẻ tự động xổ xuống cho mình các mục để chọn) cụ thể: E muốn vào mục thời sự e code: driver. find_element_by_link_text(“Thời sự”).click(), xong đọc mục Giao thông trong Thời sự e lại code: driver. find_element_by_link_text(“Giao thông”).click() - và đã làm được, ở đây e thấy Thời sự và Giao thông đều chứa ở link: href hết. Còn với web e cần làm e thấy mục “Báo cáo - Sổ kế toán” ko có chứa ở cái link nào cả (như hình H4). Anh/Chị hướng dẫn e cách nào để vào xem báo cáo với ạ??!!! (do e là thành viên mới nên ko up được nhiều hình cùng 1 lúc nên phải chia nhỏ câu hỏi ra, mong các anh/chị đọc thông cảm)

D@dpool viết 10:49 ngày 01/10/2018

B tìm hiểu qua xpath nhé. Vd: b.find_element_by_xpath("//div[@class=‘report’]").click()

Carot viết 10:44 ngày 01/10/2018

("//div[@class=‘report’]").click()

Cảm ơn bạn đã gợi ý!

Bài liên quan
0