30/09/2018, 17:11

Lấy dữ liệu từ web

Có cách gì (hoặc là tool gì) để lấy thông tin (giả sử là các bài báo) trên 1 trang web về và lưu nó dưới dạng file text với số lượng lớn ko ạ? Em đang làm 1 bài tập mà yêu cầu cần 1 số lượng lớn file input (chừng 1000 file txt). Các anh chị có thể chỉ cho em/ cho em keyword để em tìm hiểu được ko ạ.

Mai Anh Dũng viết 19:19 ngày 30/09/2018

Bạn biết Python không? Nếu biết thì dùng scrapy

Ha Gia Phat viết 19:25 ngày 30/09/2018

em mới học năm nhất, chỉ biết C à anh ơi

Ha Gia Phat viết 19:13 ngày 30/09/2018

cơ mà hè này em định học thêm python

Sáng Béo viết 19:20 ngày 30/09/2018

php thì chắc là có PHP Simple HTML DOM.

Làm giàu, làm giàu, làm giàu..... viết 19:18 ngày 30/09/2018

c# có html agility pack dùng để trích xuất dữ liệu từ web.

Mai Anh Dũng viết 19:13 ngày 30/09/2018

Thử google với từ khóa “c crawler”

https://www.google.com.sg/search?q=c+crawler&ie=utf-8&oe=utf-8&gws_rd=cr&ei=KepfVe2bGZLguQTi94K4Cg

Đạt không dùng kiểu này bao giờ nên chỉ có thể giúp từ khóa thôi

Ha Gia Phat viết 19:25 ngày 30/09/2018

dạ thanks anh đạt

null viết 19:12 ngày 30/09/2018

Javascript thì dùng YQL.

htl@PyMI.vn viết 19:24 ngày 30/09/2018

NodeJS dùng request và cheerio

Bài liên quan
0