[SQLSERVER] Truy vấn dữ liệu không tồn tại trong bảng khác sử dụng NOT IN, NOT EXISTS, EXCEPT, LEFT OUTER JOIN
Bài viết hôm nay, mình sẽ hướng dẫn các bạn cách truy vấn tìm dữ liệu có ở bảng này nhưng không tồn tại trong bảng kia, sử dụng NOT IN, NOT EXISTS, EXCEPT, LEFT OUTER JOIN trong Sqlserver. VD: Mình có hai bảng dữ liệu. Một bảng là danh sách ...
Bài viết hôm nay, mình sẽ hướng dẫn các bạn cách truy vấn tìm dữ liệu có ở bảng này nhưng không tồn tại trong bảng kia, sử dụng NOT IN, NOT EXISTS, EXCEPT, LEFT OUTER JOIN trong Sqlserver.
VD: Mình có hai bảng dữ liệu.
Một bảng là danh sách sinh viên học lớp SQL SERVER
Và một bảng danh sách sinh viên học lớp MYSQL.
Trong những sinh viên này, có những sinh viên học cả hai lớp và những sinh viên chỉ học một lớp.
Và câu hỏi đặt ra, là chúng ta muốn tìm ra những sinh viên nào học SQL SERVER mà không có học MYSQL.
Demo bây giờ các bạn tạo dữ liệu hai bảng tableA và tableB với hai câu lệnh bên dưới:
- SQL tạo dữ liệu TableA
CREATE TABLE dbo.tableA ( id VARCHAR(10) NOT NULL, ngaythang date NOT NULL ) DECLARE @RowCount INT DECLARE @RowString VARCHAR(10) DECLARE @Random INT DECLARE @Upper INT DECLARE @Lower INT DECLARE @InsertDate DATETIME SET @Lower = -730 SET @Upper = -1 SET @RowCount = 0 begin tran WHILE @RowCount < 150000 BEGIN SET @RowString = CAST(@RowCount AS VARCHAR(10)) SELECT @Random = ROUND(((@Upper - @Lower -1) * RAND() + @Lower), 0) SET @InsertDate = DATEADD(dd, @Random, GETDATE()) INSERT INTO tableA (id ,ngaythang) VALUES (REPLICATE('0', 10 - DATALENGTH(@RowString)) + @RowString , @InsertDate ) SET @RowCount = @RowCount + 1 END commit
- SQL tạo dữ liệu TableB
CREATE TABLE dbo.tableB ( id VARCHAR(10) NOT NULL, ngaythang date NOT NULL ) DECLARE @RowCount INT DECLARE @RowString VARCHAR(10) DECLARE @Random INT DECLARE @Upper INT DECLARE @Lower INT DECLARE @InsertDate DATETIME SET @Lower = -730 SET @Upper = -1 SET @RowCount = 0 begin tran WHILE @RowCount < 80000 BEGIN SET @RowString = CAST(@RowCount AS VARCHAR(10)) SELECT @Random = ROUND(((@Upper - @Lower -1) * RAND() + @Lower), 0) SET @InsertDate = DATEADD(dd, @Random, GETDATE()) INSERT INTO tableB (id ,ngaythang) VALUES (REPLICATE('0', 10 - DATALENGTH(@RowString)) + @RowString , @InsertDate ) SET @RowCount = @RowCount + 1 END commit
Vậy sau khi tạo dữ liệu xong, chúng ta có được
TableA : 150000 record.
TableB: 80000 record.
Bây giờ, mình sẽ truy vấn để lấy ra 70000 record của dữ liệu tableA không tồn tại trong tableB.
Viết câu lệnh này, chúng ta sẽ có 4 cách để thực hiện:
1. Đầu tiên sử dụng câu lệnh NOT IN
SET STATISTICS TIME ON; SELECT ID FROM tableA WHERE ID NOT IN (SELECT ID FROM tableB) SET STATISTICS TIME OFF;
2. Sử dụng câu lệnh NOT EXISTS
SET STATISTICS TIME ON; SELECT ID FROM tableA WHERE NOT EXISTS (SELECT ID FROM tableB WHERE tableA.ID = tableB.ID) SET STATISTICS TIME OFF;
3. Sử dụng câu lệnh LEFT OUTER JOIN
SET STATISTICS TIME ON; SELECT tableA.ID FROM tableA LEFT OUTER JOIN tableB ON tableA.ID = tableB.ID WHERE tableB.ID IS NULL SET STATISTICS TIME OFF;
4. Sử dụng câu lệnh EXCEPT
SET STATISTICS TIME ON; SELECT ID FROM tableA EXCEPT SELECT ID FROM tableB SET STATISTICS TIME OFF;
=> Tất cả 4 câu lệnh trên đều trả về cho chúng ta một kết quả giống nhau là tìm ra dữ liệu 70000 record không tồn tại.
Để kiểm tra tốc độ truy vấn của các câu sqlserver, các bạn sử dụng câu lệnh
SET STATISTICS TIME ON;
//query sqlserver
SET STATISTICS TIME OFF;
và dưới đây là kết quả khi thực hiện 4 câu lệnh trên:
--- NOT IN
(70000 row(s) affected)
SQL Server Execution Times:
CPU time = 78 ms, elapsed time = 90 ms.
--- NOT EXIST
(70000 row(s) affected)
SQL Server Execution Times:
CPU time = 94 ms, elapsed time = 167 ms.
--- LEFT OUT JOIN
(70000 row(s) affected)
SQL Server Execution Times:
CPU time = 110 ms, elapsed time = 349 ms.
--- EXCEPT
(70000 row(s) affected)
SQL Server Execution Times:
CPU time = 203 ms, elapsed time = 301 ms.
Trong 4 câu lệnh này, mình khuyên các bạn nên sử dụng câu lệnh NOT EXIST và LEFT OUT JOIN.
Còn lý do tại sao, tùy tình huống các bạn có thể sử dụng 4 câu lệnh trên để tìm ra kết quả tốt nhất
HAPPY CODING