30/09/2018, 21:07

Tool liệt kê website

mình đang muốn xây dưng 1 tool để liệt kê các web site được gắn trên 1 trang web.mọi người có cách gì ko chỉ giúp mình với

Dung Nguyen viết 23:20 ngày 30/09/2018

Có thể dùng document.link của JS

Quyet Do viết 23:19 ngày 30/09/2018

bạn có biết trong python dùng gi ko?

Chế Tiệp Chân Khoa viết 23:20 ngày 30/09/2018

hình như là beautifulsoup , mà thấy khó học lắm

Dung Nguyen viết 23:23 ngày 30/09/2018

Nếu python thì thường dùng thư viện Beautifulsoup (thư viện phổ biến nhất để lấy và phân tích xml của một webpage).
Dùng thư viện đó scrap xml về rồi tìm các thẻ <a> rồi lấy giá trị của href.
Cụ thể ntn thì bạn tự tìm hiểu đi.

Dương Trần Đình viết 23:23 ngày 30/09/2018

Bạn gg với từ khoá parse html, trong java nó là jsoup, c# nó là htmlagility, tất nhiên chỉ là 2 cái trong vô số ( ý tưởng là đoc mã nguồn find tất cả các thẻ href, mình nghĩ là như vậy

Nguyen Minh Quan viết 23:10 ngày 30/09/2018

đây là 1 playlist hướng dẫn đầy đủ cách tạo tool bạn muốn bằng python

lx viết 23:13 ngày 30/09/2018

Bạn có thể xài scrapy cũng ổn. Mình chưa thử beautifulsoup nhưng mình nghĩ cả 2 tools này đều có thể thoả mãn yêu cầu của bạn.

Bài liên quan
0