10/10/2018, 13:30

Cần giúp đỡ cách lấy hết link trong 1 website

Mình cần lấy tất cả các link trong bài viết thì có thể dùng cách nào được nhỉ?
Mình đã thử sử dụng phần mềm tạo sitemap nhưng vẫn ko ăn thua.
Ai có cách nào chỉ mình với

vd website này nhé. http://hot.themxua.com
mình muốn lấy tất cả các link bài viết của website này phải làm thế nào?
Bình thường đối với các website có sitemap.xml thì mình có thể lấy hết.
Nhưng đối với site không có sitemap thì mình không biết lấy.
Mình tạo sitemap bằng phần mềm, hoặc web để lấy url thì cũng chỉ tạo được khoảng 100 - 500 link, ko thể lấy hết được.
dokhacluan viết 15:34 ngày 10/10/2018
câu hỏi của cậu có vẽ chưa rõ ràng

cậu muốn lấy 'link' nhưng 'link' ở đâu

link trong website cậu đang xây dựng

hay

link của web người khác
pingping12 viết 15:41 ngày 10/10/2018
Được gửi bởi dokhacluan
câu hỏi của cậu có vẽ chưa rõ ràng

cậu muốn lấy 'link' nhưng 'link' ở đâu

link trong website cậu đang xây dựng

hay

link của web người khác
sorry bác.
link bài viết của web người khác bác ạ.
ở web mình thì có lẽ đơn giản hơn rùi (
pingping12 viết 15:32 ngày 10/10/2018
Được gửi bởi xanhbien_info
nếu web đó có cùng 1 dạng kiểu link thi có thể lấy đc.bạn send địa chỉ web mình xem, nếu đc mình gúp cho.
cảm ơn bạn. mình sẽ send cho bạn 1 website.
(viết luôn ở đây cho các bác giúp đỡ)
vd website này nhé. http://hot.themxua.com
mình muốn lấy tất cả các link bài viết của website này phải làm thế nào?
Bình thường đối với các website có sitemap.xml thì mình có thể lấy hết.
Nhưng đối với site không có sitemap thì mình không biết lấy.
Mình tạo sitemap bằng phần mềm, hoặc web để lấy url thì cũng chỉ tạo được khoảng 100 - 500 link, ko thể lấy hết được.
Micky Trần viết 15:38 ngày 10/10/2018
KHông hiểu bác chủ theat định làm gì nữa
pingping12 viết 15:41 ngày 10/10/2018
Được gửi bởi ngotuannghia
KHông hiểu bác chủ theat định làm gì nữa
em lấy hết link bài viết của 1 website sau đó cho vào tool. craw hết nó về làm data của mình
maychu.net viết 15:31 ngày 10/10/2018
Được gửi bởi pingping12
Mình cần lấy tất cả các link trong bài viết thì có thể dùng cách nào được nhỉ?
Mình đã thử sử dụng phần mềm tạo sitemap nhưng vẫn ko ăn thua.
Ai có cách nào chỉ mình với

vd website này nhé. http://hot.themxua.com
mình muốn lấy tất cả các link bài viết của website này phải làm thế nào?
Bình thường đối với các website có sitemap.xml thì mình có thể lấy hết.
Nhưng đối với site không có sitemap thì mình không biết lấy.
Mình tạo sitemap bằng phần mềm, hoặc web để lấy url thì cũng chỉ tạo được khoảng 100 - 500 link, ko thể lấy hết được.
Dùng công cụ này nè: http://www.xml-sitemaps.com/, chọn save dạng html hay xml đều được, đây là công cụ hữu ích cho anh em làm seo
pingping12 viết 15:36 ngày 10/10/2018
Được gửi bởi maychu.net
Dùng công cụ này nè: http://www.xml-sitemaps.com/, chọn save dạng html hay xml đều được, đây là công cụ hữu ích cho anh em làm seo
cảm ơn bạn, mình đã sử dụng, nhưng ko được hài lòng.
vẫn mong được các bro chỉ giáo
cavang125 viết 15:42 ngày 10/10/2018
Được gửi bởi pingping12
cảm ơn bạn, mình đã sử dụng, nhưng ko được hài lòng.
vẫn mong được các bro chỉ giáo

Tặng bạn cái này, http://www.mediafire.com/?1z5q8cokusal66a
Nó là bản standard alone sitemap builder null của cái site mà bạn vừa không hài lòng đó, bạn down về, sửa các cài đặt (có cài đặt mẫu của site mình trong đó) và upload lên host rồi chạy nhé. (user và pass nằm trong file config)

nó sẽ cho bạn full XML Sitemap ko bị giới hạn 500 nữa
Demo: http://cuahanghoangtho.com/sitemap
chúc vui khi tham gia ddth.com
ngoc_viet08 viết 15:38 ngày 10/10/2018
thường khi viết mã html. ta sẽ bỏ các link bài viết vào 1 số containter. ví dụ
<div id="other-post">
<a href="abc.html">bài viết khác</a>
<a href="abc.html">bài viết khác 2</a>
...
</div>
như vậy thì việc lấy đâu còn khó khăn.
1. đầu tiên bóc toàn bộ html.
2. dựa vào id="other-post" để bóc container "other-post". lúc này dùng 1 số hàm php để bóc dần dần , hoặc dùng DOM class cũng rất hiệu quả http://php.net/manual/en/class.domdocument.php
Bài liên quan
0