10/10/2018, 13:30
Cần giúp đỡ cách lấy hết link trong 1 website
Mình cần lấy tất cả các link trong bài viết thì có thể dùng cách nào được nhỉ?
Mình đã thử sử dụng phần mềm tạo sitemap nhưng vẫn ko ăn thua.
Ai có cách nào chỉ mình với
vd website này nhé. http://hot.themxua.com
mình muốn lấy tất cả các link bài viết của website này phải làm thế nào?
Bình thường đối với các website có sitemap.xml thì mình có thể lấy hết.
Nhưng đối với site không có sitemap thì mình không biết lấy.
Mình tạo sitemap bằng phần mềm, hoặc web để lấy url thì cũng chỉ tạo được khoảng 100 - 500 link, ko thể lấy hết được.
Mình đã thử sử dụng phần mềm tạo sitemap nhưng vẫn ko ăn thua.
Ai có cách nào chỉ mình với
vd website này nhé. http://hot.themxua.com
mình muốn lấy tất cả các link bài viết của website này phải làm thế nào?
Bình thường đối với các website có sitemap.xml thì mình có thể lấy hết.
Nhưng đối với site không có sitemap thì mình không biết lấy.
Mình tạo sitemap bằng phần mềm, hoặc web để lấy url thì cũng chỉ tạo được khoảng 100 - 500 link, ko thể lấy hết được.
Bài liên quan
cậu muốn lấy 'link' nhưng 'link' ở đâu
link trong website cậu đang xây dựng
hay
link của web người khác
link bài viết của web người khác bác ạ.
ở web mình thì có lẽ đơn giản hơn rùi (
(viết luôn ở đây cho các bác giúp đỡ)
vd website này nhé. http://hot.themxua.com
mình muốn lấy tất cả các link bài viết của website này phải làm thế nào?
Bình thường đối với các website có sitemap.xml thì mình có thể lấy hết.
Nhưng đối với site không có sitemap thì mình không biết lấy.
Mình tạo sitemap bằng phần mềm, hoặc web để lấy url thì cũng chỉ tạo được khoảng 100 - 500 link, ko thể lấy hết được.
vẫn mong được các bro chỉ giáo
Tặng bạn cái này, http://www.mediafire.com/?1z5q8cokusal66a
Nó là bản standard alone sitemap builder null của cái site mà bạn vừa không hài lòng đó, bạn down về, sửa các cài đặt (có cài đặt mẫu của site mình trong đó) và upload lên host rồi chạy nhé. (user và pass nằm trong file config)
nó sẽ cho bạn full XML Sitemap ko bị giới hạn 500 nữa
Demo: http://cuahanghoangtho.com/sitemap
chúc vui khi tham gia ddth.com
<a href="abc.html">bài viết khác</a>
<a href="abc.html">bài viết khác 2</a>
...
</div>
1. đầu tiên bóc toàn bộ html.
2. dựa vào id="other-post" để bóc container "other-post". lúc này dùng 1 số hàm php để bóc dần dần , hoặc dùng DOM class cũng rất hiệu quả http://php.net/manual/en/class.domdocument.php