07/09/2018, 11:05

Tìm hiểu về B-Tree và Hash index trong MySQL

MySQL cung cấp 3 kiểu index khác nhau cho data đó là B-Tree , Hash và R-Tree index. Hiểu rõ về các kiểu index này sẽ giúp chúng ta tạo ra các loại index trong bảng một cách hiệu quả hơn. Do R-Tree được sử dụng cho các loại dữ liệu không gian spacial data và thường ít khi gặp phải nên bài ...

MySQL cung cấp 3 kiểu index khác nhau cho data đó là B-Tree, HashR-Tree index. Hiểu rõ về các kiểu index này sẽ giúp chúng ta tạo ra các loại index trong bảng một cách hiệu quả hơn. Do R-Tree được sử dụng cho các loại dữ liệu không gian spacial data và thường ít khi gặp phải nên bài viết này chúng ta sẽ tập chung so sánh 2 loại index là B-TreeHash:

B-Tree Index

B-Tree index có các đặc điểm sau:

  • Dữ liệu index trong B-Treeđược tổ chức và lưu trữ theo dạng tree, tức là có root, branch, leaf. Giá trị của các node được tổ chức tăng dần từ trái qua phải.
    • B-Tree index được sử dụng trong các biểu thức so sánh dạng: =, >, >=, <, <=, BETWEEN và LIKE.
  • Khi truy vấn dữ liệu thì việc tìm kiếm trong B-Tree là 1 quá trình đệ quy, bắt đầu từ root node và tìm kiếm tới branch và leaf, đến khi tìm được tất cả dữ liệu - thỏa mãn với điều kiện truy vấn thì mới dùng lại.
  • B-Tree index được sử dụng cho những column trong bảng khi muốn tìm kiếm 1 giá trị nằm trong khoảng nào đó. Ví dụ: tìm kiếm những sinh viên có điểm Toán từ 5-9

Hash Index

Hash index có các đặc điểm sau:

  • Hash index có một vài đặc điểm khác biệt so với Btree index.
  • Dữ liệu index được tổ chức theo dạng Key - Value được liên kết với nhau.
  • Khác với B-Tree, thì Hash index chỉ nên sử dụng trong các biểu thức toán tử là = và . Không sử dụng cho toán từ tìm kiếm 1 khoảng giá trị như > hay < .
  • Không thể tối ưu hóa toán tử ORDER BY bằng việc sử dụng Hash index bởi vì nó không thể tìm kiếm được phần từ tiếp theo trong Order.
  • Toàn bộ nội dung của Key được sử dụng để tìm kiếm giá trị records, khác với B-Tree một phần của node cũng có thể được sử dụng để tìm kiếm.
  • Hash có tốc độ nhanh hơn kiểu Btree.

Việc chọn index theo kiểu B-Tree hay Hash ngoài yếu tố về mục đích sử dụng index thì nó còn phụ thuộc vào việc Storage Engine có hỗ trợ loại index đó hay không. Ví dụ MyISAM, InnoDB hay Archive chỉ hỗ trợ B-Tree, trong khi MyISAM lại hỗ trợ cho cả 2.

0