30/09/2018, 20:01

Nhờ các bạn giúp đỡ về "data mining"

Mình đang làm đồ án về data mining và đang bí đoạn này ạ. Từ dữ liệu thô là các nhận xét về sản phẩm mình đã rút trích được nhiều câu riêng biệt và dán nhãn cho nó. Ví dụ có các câu này:

Tuổi_thọ_pinNP rấtR caoA ===>(tích cực)
GiáNP caoA quáR ===>(tiêu cực)
Màn_hìnhNP nhìnV rấtR đẹpA ===>(tích cực)

Giờ mình muốn máy nó tự nhận biết được và gán nhãn “tích cực” hay “tiêu cực” như trên (không phải người làm) cho từng câu dựa vào các từ đã được phân tích cú pháp thì dùng thuật toán gì ạ. Các bạn có thể cho mình từ khóa để search được không.

Never is too late! viết 22:03 ngày 30/09/2018

mình ko rõ nhưng hình như là thuật toán bayes thì phải

Itachi Citus viết 22:07 ngày 30/09/2018

Nó là sentiment analysis á bạn. Mà cái này bên NLP chứ nhỉ.
Ở tuần 3 á bạn:
https://class.coursera.org/nlp/lecture/145

Truong Tuan viết 22:09 ngày 30/09/2018

uhm đúng là nó là NLP về sentiment analysis, nhưng mình nghĩ chắc phải áp dụng các thuật toán máy học để làm.Nhưng ko biết các phương thức áp dụng lên tiếng anh có dùng được cho tiếng Việt không nữa vì mình đang làm về tiếng Việt, và cái mình cần là bộ từ điển có các trọng số bằng tiếng Việt (cái này mình search miết mà ko ra ) , để mình tha khảo video của bạn cái đã, thanks bạn nha

Bài liên quan
0