30/09/2018, 19:45
Hỏi về selenium webdriver python
Em đang học python về phần cạo dữ liệu, các anh cho em hỏi về selenium webdriver python, các anh đã sử dụng qua có thể giải thích cho em về thằng này . . . Em có đọc trên google nhưng cũng chưa hiểu lắm :D em cảm ơn nhiều
Bài liên quan
Em nên đọc trước đi, không hiểu chỗ nào lên đây hỏi mọi người sẽ giải đáp.
Như vậy em mới hiểu vấn đề được
Sơ qua:
Selenium là app dùng cho làm unit test hướng hành vi, nghĩa là giả lập thao tác click chuột, gõ bàn phím, … trên giao diện UI của webapp (giống AutoIT, ngôn ngữ thường được lựa chọn làm Auto cho các game kiếm hiệp). Các tester thay vì ngày nào cũng làm 1việc giống nhau là login, tạo user (trong app) thì có chuyển sang làm tự động (automation test).
WebDriver được thay thế RemoteControl vì 1 số ưu điểm:
Tuy nhiên, nhược điểm là mỗi 1 browser phải có 1 driver riêng, như FirefoxWebDriver, SafariWebDriver, … rồi có thể phải tweak riêng từng script cho từng browser (công gấp 2). SeleniumIDE giúp bạn record thao tác người dùng, chỉnh sửa / debug automation script, …
Selenium thường dùng cho tester viết script (automation test có HP Quick Test cũng rất hay, tuy nhiên mất phí, còn Selenium free). Cũng có 1 số dev họ viết để làm BDD (behavior driven development) ^^
Cảm ơn các anh đã hổ trợ em hết mình hiện tại thì em đang làm trên php, ông anh chuyên làm bên phân tích và cạo dữ liệu đi nghĩa vụ giờ phải bàn giao lại cho em, điều đâu tiên là em nghĩ tới python cũng có xem video của anh lê trần đạt và anh laptrinhio, ko bik các anh đã từng làm với mấy cái này có thể tư vấn cho em hướng tìm hiểu và công cụ hổ trợ cho công việc cạo dữ liệu … hiện tại thì em đang tìm hiểu beautifulsoup và scrapy
Em đang muốn bóc dữ liệu thì đơn giản chỉ cần dùng requests + beautifulsoup (+ fakeuseragent nếu cần thiết)
Lần đầu tiên nghe từ “cạo dữ liệu”, thấy hay dùng từ bóc tách hơn. Hi, mình nghĩ cứ dùng từ parser cho dễ hiểu.