12/08/2018, 14:57

Recommender Systems

I. Giới thiệu Ngày nay, với sự bùng nổ của internet, thay vì phải ra đường, bạn đơn giản chỉ cần ở nhà, lướt web, và chỉ với vài cú click chuột, cả thế giới đã mở ra trước mắt bạn. Bạn muốn mua gì, xem gì, ăn gì,... tất cả đều có trên internet. Vậy nhưng đó mới chỉ là lợi thế cạnh tranh đặc ...

I. Giới thiệu

Ngày nay, với sự bùng nổ của internet, thay vì phải ra đường, bạn đơn giản chỉ cần ở nhà, lướt web, và chỉ với vài cú click chuột, cả thế giới đã mở ra trước mắt bạn. Bạn muốn mua gì, xem gì, ăn gì,... tất cả đều có trên internet. Vậy nhưng đó mới chỉ là lợi thế cạnh tranh đặc trưng của nó, nên chẳng có gì khó hiểu. Sức mạnh của công nghệ nằm ở chỗ thậm chí nó thậm chí còn suy nghĩ hộ bạn. Lướt qua bất kỳ trang thương mại điện tử, hoặc các trang mạng xã hội, đôi lần bạn phải trầm trồ, ngạc nhiên khi không hiểu sao website đó có thể đề xuất cho bạn một món hàng, một mối quan hệ cực kỳ chính xác. Mặc dù chỉ là những gợi ý đơn giản, nhưng nằm sau đó là cả một hệ thống với những giải thuật phức tạp và tập dữ liệu khổng lồ, và hẳn hàng trăm cuốn sách, tạp chí, bài báo viết về nó, Recommender System - Hệ tư vấn.

Recommender Systems (RSs) là những công cụ và kỹ thuật nhằm cung cấp đề xuất về một item cho người dùng. Những đề xuất này liên quan đến những quy trình ra quyết định khác nhau, chẳng hạn nên mua hàng gì, nghe nhạc gì hoặc đọc tin tức ở đâu.

"Item" là thuật ngữ chung nhằm ám chỉ cái mà hệ thống đề xuất với người dùng. RSs chủ yếu hướng đến những cá nhân thiếu kinh nghiệm hoặc thẩm quyền để đánh giá tiềm năng của một số "item" mà chẳng hạn, một website có thể cung cấp. Trường hợp nếu là một hệ tư vấn sách thì nó sẽ hỗ trợ người dùng chọn lựa một cuốn sách để đọc. Rõ ràng, có khá nhiều lý do tại sao những website này lại muốn sử dụng RS:

  • Gia tăng doanh số bán hàng: Đây có lẽ là lý do quan trọng nhất cho những trang thương mại điện tử, đơn giản là họ sẽ bán thêm được hàng so với những trang mà không sử dụng RS. RS đề xuất càng chính xác với nhu cầu người dùng thì website càng bán được nhiều hàng.
  • Thỏa mãn nhu cầu khách hàng: Một RS được thiết kế và cài đặt tốt sẽ cải thiện trải nghiệm người dùng. Người dùng sẽ thấy rằng hệ tư vấn này rất thú vị, chính xác, và cùng với một UI được thiết kế hợp lý, khách hàng sẽ muốn quay lại website.
  • Nắm được nhu cầu khách hàng: Một chức năng quan trọng khác của RS là cho phép ta thu thập được phản hồi của khách hàng. Nếu khách hàng không thích những thứ mà bạn đề xuất, bạn vẫn có thể thu thập lại được những thông tin này và tái sử dụng nó để cải thiện độ chính xác của RS.

II. Một số kỹ thuật sử dụng trong recommender system

Để cài đặt chức năng chính của RS, xác định một item hữu ích cho user nào đấy, một RS phải dự đoán xem liệu item đấy có đáng để đưa vào gợi ý hay không. Có 6 kiểu tiếp cận bài toán gợi ý, bao gồm:

  • Content-based: hệ thống sẽ học để gợi ý những item mà tương tự với những cái mà user đã thích trong quá khứ. Độ tương tự giữa các item được tính dựa trên những đặc trưng kết hợp với những item được so sánh. Chẳng hạn, nếu user rate điểm cao cho một bộ phim thuộc thể loại hài hước, thì hệ thống có thể học để gợi ý những bộ phim khác thuộc thể loại này.

  • Collaborative filtering (CF - lọc cộng tác): cách cài đặt đơn giản nhất cho hướng tiếp cận này là gợi ý cho user những item mà những user khác có cùng sở thích đã thích trong quá khứ. Độ tương tự về sở thích của 2 user được tính toán dựa trên mức độ tương tự về lịch sử rating của 2 user. Lọc cộng tác được xem là kỹ thuật phổ biến và được sử dụng nhiều nhất trong RS.

  • Demographic: đúng như tên gọi, kiểu hệ thống này sẽ gợi ý item dựa nhân khẩu học của user. Giả thuyết cho rằng những thị trường khác nhau nên được gợi ý những item khác nhau. Chẳng hạn, user sẽ được điều hướng tới những website khác nhau dựa trên ngôn ngữ và địa lý. Hoặc là việc gợi ý có thể thay đổi dựa trên tuổi của user. Mặc dù cách tiếp cận này khá phổ biến trong mảng tiếp thị truyền thống, nhưng có rất ít nghiên cứu khoa học về kỹ thuật này.

  • Knowledge-based: hệ thống sẽ gợi ý item dựa trên miền kiến thức cụ thể rằng những đặc điểm nào của item đáp ứng được nhu cầu và thị hiếu của user, cuối cùng là item đó có hữu ích cho user hay không. Hệ thống này có khuynh hướng hoạt động tốt hơn các hệ thống khác khi bắt đầu triển khai, nhưng nếu không được trang bị các thành phần hỗ trợ học thì nó có thể bị vượt qua bởi các phương pháp khác mà có thể khai thác lịch sử tương tác giữa user và item (như lọc cộng tác chẳng hạn).

  • Community-based: gợi ý item dựa trên sở thích của bạn bè của user. Kiểu như câu "Hãy nói cho tôi biết bạn bè của bạn, tôi sẽ nói cho bạn biết bạn là ai"             </div>
            
            <div class=

0