01/10/2018, 09:21

Liên quan đến NLP, AI, ML

Hiện em có một bài toán như sau, liên quan đến NLP, AI, ML mà chưa biết xử lý theo hướng nào, tìm hiểu tài liệu nào, sử dụng thuật toán nào cho tối ưu. Vậy trong page có pro nào trong lĩnh vực này, soi đường chỉ lối cho e chút với ạ, e cảm ơn nhiều nhiều
Bài toán: Nhận đầu vào là một hay nhiều file truyện, trả lời xem truyện đó có phải là truyện kiếm hiệp hay ko? (sử dụng AI, NLP, ML). TRả lời “Yes” hoặc “No”. Sau đó phải đưa ra cả độ tin cậy(confident) của hệ thống.

Luân Hồ viết 11:35 ngày 01/10/2018

Bài toán này thuộc dạng binary classiffion , mình nghĩ có thể dùng decision tree đẻ đưa ra quyết định có phải là truyện kiếm hiệp hay không . Trong python có thư viện sklearn hỗ trợ decistion tree . Bạn có thể tham khảo ví dụ về hoa iris để hiểu hơn . Việc thu thập dữ liệu , và tiền xử lý dữ liệu cũng rất quan trọng , nó quyết định đến perfomance của việc dự đoán .
Còn việc đưa ra độ tin cậy thì mình không biết.

Nguyễn Văn Tâm viết 11:31 ngày 01/10/2018

Về các thuật toán cơ bản thì mình nghĩ bạn thử dùng SVM hoặc LogisticRegression xem. Với Deep Learning thì thử mạng RNN xem sao. Bài toán này có lẽ không khó vì truyện kiếm hiệp thì câu từ rất đặc trưng. Các thuật toán hầu hết đều sử dụng hàm softmax cho đầu ra với bài toán phân lớp nên có cả xác suất với từng lớp rồi, chỉ việc lấy ra thôi.

Nguyễn Thị Ly viết 11:27 ngày 01/10/2018

Cảm ơn tiền bối đã đưa ra chỉ dẫn

Nguyễn Thị Ly viết 11:34 ngày 01/10/2018

Cảm ơn tiền bối đã chỉ dẫn

Minh Hoàng viết 11:36 ngày 01/10/2018

cứ thử language model trước đi đã

Nguyễn Văn Tâm viết 11:26 ngày 01/10/2018

Chúc bạn thành công. Không có gì lên hỏi tiếp

Bài liên quan
0