01/10/2018, 14:04

Lấy xpath từ trang Lazada

Em đang định crawl một số sản phẩm ở lazada sử dụng scrapy nhưng đang làm thì bị vướng ở chỗ get xpath. Em nêu vấn đề ra đây nhờ các bác xem xét giúp.

Em lấy ví dụ 1 link em định crawl: https://www.lazada.vn/ao-khoac-vest-form-dai-cao-cap-hana-fashion-10600481.html

Và em muốn crawl cái tiêu đề của nó:

inspect code của nó như sau:

Em chạy thử xpath trên tab console (chrome) thì được như sau:

Như vậy xpath em xác định là chuẩn rồi đúng không ạ?
Nhưng khi chạy trên Scrapy thì nó lại ra thế này. Tức là không có kết quả đấy ạ:

Sau đấy em thử lại theo các bước như thế này:

**Nhìn vào hình ảnh các bác hiểu chứ ạ? Tức là em phải thay id=prod_title bằng class=product-info-name thì mới ra kết quả.
Em quay lại tìm trong source cụm từ product-info-name thì không hề thấy có.
Như vậy là như thế nào ạ?!?!?!
Các bro vào giúp em vụ này với :((

Phat.Le viết 16:05 ngày 01/10/2018

h1 mỗi page chỉ có duy nhất 1 thẻ thôi nên xpath(’//h1’) là được rồi bác
mình cũng đang làm dự án về scrapy đây

Hà Temwin viết 16:10 ngày 01/10/2018

Em biết.
Nhưng thẻ H1 này là em lấy ví dụ thôi.
bác có crawl được trang lazada không?

Phat.Le viết 16:09 ngày 01/10/2018

Lazada thì chưa thử, mà cũng hay gặp mấy trường hợp giống bác. View source của pages xem cho chắc

Hà Temwin viết 16:10 ngày 01/10/2018

buồn cười là view source page nó vẫn không giải quyết được vấn đề.

Bác thử crawl một vài info trên lazada xem. Nó lạ lắm

Tập Sự viết 16:17 ngày 01/10/2018

Em viewsource và lấy theo id title vẫn đúng. Em crawl bằng nodejs

Bình luận về bài viết này

Chia sẻ tin đăng đến bạn bè

Gửi Messenger

Bài liên quan

Hà Temwin

0 chủ đề

0 bài viết

Tác giả nổi bật

Từ khóa nổi bật

AngularJS Blog Bootstrap C / C++ Cấu trúc dữ liệu & Giải thuật Cơ sở dữ liệu Codeigniter Công cụ lập trình CSS CSS cơ bản CSS3 Học Excel HTML HTML cơ bản HTML5 Java Javascript jQuery Json Lập trình mobile Laravel Linux MongoDB MySQL NodeJS Oracle Pascal PHP PHP cơ bản PHP nâng cao Python React Native ReactJS Ruby SEO SQL Server Swift Visual Basic VueJS WordPress XML

Chủ đề nổi bật

0

Các chủ đề đang được quan tâm

phần mềm lập trình php | lập trình web php + mysql | khóa học lập trình php | tự học lập trình php | học php cơ bản thachpham | Farm or Flip? The Two Roads to Riches in POE 3.29 Curse of the Allflame | U4GM Monopoly Go Juggle Jam: Is It Worth Playing | Stop Wasting Time on Trash Farms! S14's "Superior Lair Key" Bible: One Key, One Mythic Dream! | Code24h | Cho thuê phòng trọ hà nội | Cho thuê phòng trọ bình thạnh | Cho thuê phòng trọ | Cho thuê nhà trọ

Đăng ký

Đăng ký nhận thông báo

Các bài học thú vị sẽ được gửi đến inbox của bạn

HỖ TRỢ HỌC VIÊN

Các câu hỏi thường gặp
Điều khoản sử dụng
Chính sách và quy định
Chính sách bảo mật thanh toán
Hỗ trợ học viên: hotro@code24h.com
Báo lỗi bảo mật: security@code24h.com

VỀ CODE24H

HỢP TÁC VÀ LIÊN KẾT

KẾT NỐI VỚI CHÚNG TÔI

TẢI ỨNG DỤNG TRÊN ĐIỆN THOẠI