30/09/2018, 21:07
Tool liệt kê website
mình đang muốn xây dưng 1 tool để liệt kê các web site được gắn trên 1 trang web.mọi người có cách gì ko chỉ giúp mình với
Bài liên quan
mình đang muốn xây dưng 1 tool để liệt kê các web site được gắn trên 1 trang web.mọi người có cách gì ko chỉ giúp mình với
Có thể dùng document.link của JS
bạn có biết trong python dùng gi ko?
hình như là beautifulsoup , mà thấy khó học lắm
Nếu python thì thường dùng thư viện Beautifulsoup (thư viện phổ biến nhất để lấy và phân tích xml của một webpage).
Dùng thư viện đó scrap xml về rồi tìm các thẻ
<a>
rồi lấy giá trị củahref
.Cụ thể ntn thì bạn tự tìm hiểu đi.
Bạn gg với từ khoá parse html, trong java nó là jsoup, c# nó là htmlagility, tất nhiên chỉ là 2 cái trong vô số ( ý tưởng là đoc mã nguồn find tất cả các thẻ href, mình nghĩ là như vậy
đây là 1 playlist hướng dẫn đầy đủ cách tạo tool bạn muốn bằng python
Bạn có thể xài scrapy cũng ổn. Mình chưa thử beautifulsoup nhưng mình nghĩ cả 2 tools này đều có thể thoả mãn yêu cầu của bạn.