06/04/2021, 14:50

Hàm MATCH và AGAINST trong MySQL - MySQL nâng cao

Trong bài học này mình sẽ giới thiệu thuật ngữ Natural Language Full-Text Searches, bằng cách sử dụng hai hàm MATCH() and AGAINST() trong MySQL. Trong kỹ thuật tìm kiếm Full Text Search, MySQL tìm kiếm các hàng hoặc tài liệu có liên quan đến truy vấn ngôn ngữ tự nhiên của văn bản một cách tự do. ...

Trong bài học này mình sẽ giới thiệu thuật ngữ Natural Language Full-Text Searches, bằng cách sử dụng hai hàm MATCH() and AGAINST() trong MySQL.

Trong kỹ thuật tìm kiếm Full Text Search, MySQL tìm kiếm các hàng hoặc tài liệu có liên quan đến truy vấn ngôn ngữ tự nhiên của văn bản một cách tự do. MySQL tính toán mức độ liên quan dựa trên các yếu tố khác nhau bao gồm số lượng từ trong tài liệu, số lượng từ duy nhất trong tài liệu, tổng số từ trong collection và số lượng tài liệu (hàng) có chứa một từ cụ thể.

Để thực hiện tìm kiếm toàn văn bản bằng tìm kiếm tự nhiên ta sử dụng các hàm MATCH()AGAINST(). Hàm MATCH () chỉ định cột nơi bạn muốn tìm kiếm và hàm AGAINST() xác định biểu thức tìm kiếm sẽ được sử dụng.

1. Cách sử dụng hàm MATCH () và AGAINST ()

Trước khi bắt đầu thì ta hãy tạo một table có cấu trúc như sau:

products png

Sau đó mình tạo Index Full Text Search cho cột productLine.

ALTER TABLE products 
ADD FULLTEXT(productline);

Tiếp theo, để truy vấn tìm kiếm cho cột này bằng kỹ thuật Full Text Search thì ta sử dụng hai hàm trên như sau:

SELECT 
    productName, 
    productLine 
FROM products 
WHERE 
    MATCH(productLine) 
    AGAINST('Classic');

Kết quả trả về là những record mà cột productLine có xuất hiện từ Classic.

MySQL Natural Language Full Text Search png

Để tìm theo hai từ Classic hoặc Vintage thì ta sẽ ngăn cách nó bằng dấu phẩy.

SELECT 
	productName, 
    productLine 
FROM products 
WHERE 
	MATCH(productline) 
    AGAINST('Classic,Vintage')
ORDER BY productName;

Kết quả:

MySQL Natural Language Full Text Search example png

Hàm AGAINST() theo mặc định sẽ nằm ở chế độ IN NATURAL LANGUAGE MODE, đầy là các chế độ mà ta sẽ được học ở bài tiếp theo.

Bạn có thể xác định chế độ này một cách tường minh bằng cách thêm từ khóa IN NATURAL LANGUAGE MODE vào tham số thứ hai của hàm.

SELECT 
	productName, 
    productLine 
FROM products 
WHERE 
	MATCH(productline) 
	AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE)

Theo mặc định, MySQL thực hiện tìm kiếm theo kiểu không phân biệt chữ hoa chữ thường. Tuy nhiên bạn có thể sử dụng tìm kiếm kiểu binary collation cho cột index thì sẽ phân biệt được.

2. Sắp xếp kết quả trả về dựa vào mức độ liên quan

Một tính năng rất quan trọng trong việc xử lý tìm kiếm đó là sắp xếp kết quả trả về theo thứ tự: tài liệu nào giống nhiều nhất thì nằm trên cùng, giống ít nhất thì nằm dưới cùng.

Khi bạn sử dụng hàm MATCH() ở lệnh WHERE thì MySQL sẽ trả về giá trị có mức độ liên quan lên đầu tiên.

Hãy xem ví dụ dưới đây để hiểu rõ hơn. Mình đã tạo một Index Full Text Search cho field productName.

ALTER TABLE products 
ADD FULLTEXT(productName);

Tiếp theo mình muốn truy vấn tìm kiếm trên field này, bằng hai từ khóa Ford hoặc 1932 hoặc có cả hai.

SELECT 
	productName, 
    productLine 
FROM products 
WHERE 
	MATCH(productName) 
    AGAINST('1932,Ford');

Kết quả xuât hiện như sau:

MySQL Natural Language Full text search Sort The Result set By Relevance png

Những kết quả xuất hiện cả hai từ cùng lúc sẽ được ưu tiên đặt trên cùng, tiếp theo là những record chỉ xuất hiện 1 từ.

Tóm lai, bạn cần lưu ý những vấn đề sau khi làm việc với full text search trong MySQL:

  • Độ dài tối thiểu cho từ cần tìm là 4. Ví dụ bạn tìm từ "và" hoặc "tôi" thì mặc định MySQL sẽ xác định đó là những từ vô nghĩa. Vì trong tiếng Anh những từ có 3 chữ cái đều là vô nghĩa. Tuy nhiên bạn có thể mở file /etc/mysql/my.cnf và tìm đến dòng ft_min_word_len = 3 chỉnh lại số mong muốn.
  • Có một số từ Stop Words sẽ bị bỏ qua nằm trong file storage/myisam/ft_static.c. Bạn muốn thay đổi thì hãy vào file đó nhé.

Như vậy là mình đã hướng dẫn xong cách sử dụng hai hàm MATCH và AGAINST để truy vấn Full Text Search trong MySQL. Chúc các bạn thực hiện thành công, hẹn gặp lại ở bài tiếp theo.

Bùi Văn Nam

27 chủ đề

7090 bài viết

Cùng chủ đề
0