09/10/2018, 23:34
Tìm kiềm tiếng Việt
Chào các bạn,
Mình đang phải xử lý về tìm kiếm tiếng Việt, tức là có thể tìm kiếm có dấu và không dấu. Ví dụ:
Tìm keyword: non có thể cho ra kết quả có từ nón, nôn...
Hiện tại mình có 2 cách xử lý
- Khi truy vấn để tìm kiếm chuyển dữ liệu thành không dấu và tìm kiếm
- Khi lưu dữ liệu vào database(dữ liệu này không lớn lắm), ta thêm 1 field để lưu dữ liệu đấy nhưng là không dấu. Nếu làm theo cách này thì việc tìm kiếm sẽ trở nên rất đơn giản.
Các bạn, có ý tuởng gì, hoặc là đã xử lý vấn đề này rồi xin cho mình biết được không?
Cảm ơn các bạn.
Mình đang phải xử lý về tìm kiếm tiếng Việt, tức là có thể tìm kiếm có dấu và không dấu. Ví dụ:
Tìm keyword: non có thể cho ra kết quả có từ nón, nôn...
Hiện tại mình có 2 cách xử lý
- Khi truy vấn để tìm kiếm chuyển dữ liệu thành không dấu và tìm kiếm
- Khi lưu dữ liệu vào database(dữ liệu này không lớn lắm), ta thêm 1 field để lưu dữ liệu đấy nhưng là không dấu. Nếu làm theo cách này thì việc tìm kiếm sẽ trở nên rất đơn giản.
Các bạn, có ý tuởng gì, hoặc là đã xử lý vấn đề này rồi xin cho mình biết được không?
Cảm ơn các bạn.
Bài liên quan
http://forums.searchenginewatch.com/...read.php?t=258
Có lẽ để đơn giản thì nên tạo 1 bảng dữ liệu chứa các chữ rồi sau đó so sánh để lấy ra
CoDau ___ KhongDau
à ___ a
á ___ a
...
Stemming không giải quyết được gì trong trường hợp này.