02/10/2018, 00:19

[SQLSERVER] Truy vấn dữ liệu không tồn tại trong bảng khác sử dụng NOT IN, NOT EXISTS, EXCEPT, LEFT OUTER JOIN

Bài viết hôm nay, mình sẽ hướng dẫn các bạn cách truy vấn tìm dữ liệu có ở bảng này nhưng không tồn tại trong bảng kia, sử dụng NOT IN, NOT EXISTS, EXCEPT, LEFT OUTER JOIN trong Sqlserver. VD: Mình có hai bảng dữ liệu. Một bảng là danh sách ...

Bài viết hôm nay, mình sẽ hướng dẫn các bạn cách truy vấn tìm dữ liệu có ở bảng này nhưng không tồn tại trong bảng kia, sử dụng NOT IN, NOT EXISTS, EXCEPT, LEFT OUTER JOIN trong Sqlserver.

VD: Mình có hai bảng dữ liệu.

Một bảng là danh sách sinh viên học lớp SQL SERVER

Và một bảng danh sách sinh viên học lớp  MYSQL.

Trong những sinh viên này, có những sinh viên học cả hai lớp và những sinh viên chỉ học một lớp.

Và câu hỏi đặt ra, là chúng ta muốn tìm ra những sinh viên nào học SQL SERVER mà không có học MYSQL.

not in sqlserver

Demo bây giờ các bạn tạo dữ liệu hai bảng tableA và tableB với hai câu lệnh bên dưới:

- SQL tạo dữ liệu TableA


CREATE TABLE dbo.tableA
(
    id VARCHAR(10) NOT NULL,
    ngaythang date NOT NULL 
)

DECLARE @RowCount INT
DECLARE @RowString VARCHAR(10)
DECLARE @Random INT
DECLARE @Upper INT
DECLARE @Lower INT
DECLARE @InsertDate DATETIME
 
SET @Lower = -730
SET @Upper = -1
SET @RowCount = 0
begin tran
WHILE @RowCount < 150000
BEGIN
    SET @RowString = CAST(@RowCount AS VARCHAR(10))
    SELECT @Random = ROUND(((@Upper - @Lower -1) * RAND() + @Lower), 0)
    SET @InsertDate = DATEADD(dd, @Random, GETDATE())
     
    INSERT INTO tableA
        (id
        ,ngaythang)
    VALUES
        (REPLICATE('0', 10 - DATALENGTH(@RowString)) + @RowString
        , @InsertDate
       )
 
    SET @RowCount = @RowCount + 1
END
 
commit

- SQL tạo dữ liệu TableB


CREATE TABLE dbo.tableB
(
    id VARCHAR(10) NOT NULL,
    ngaythang date NOT NULL 
)

DECLARE @RowCount INT
DECLARE @RowString VARCHAR(10)
DECLARE @Random INT
DECLARE @Upper INT
DECLARE @Lower INT
DECLARE @InsertDate DATETIME
 
SET @Lower = -730
SET @Upper = -1
SET @RowCount = 0
begin tran
WHILE @RowCount < 80000
BEGIN
    SET @RowString = CAST(@RowCount AS VARCHAR(10))
    SELECT @Random = ROUND(((@Upper - @Lower -1) * RAND() + @Lower), 0)
    SET @InsertDate = DATEADD(dd, @Random, GETDATE())
     
    INSERT INTO tableB
        (id
        ,ngaythang)
    VALUES
        (REPLICATE('0', 10 - DATALENGTH(@RowString)) + @RowString
        , @InsertDate
       )
 
    SET @RowCount = @RowCount + 1
END
 
commit

Vậy sau khi tạo dữ liệu xong, chúng ta có được

TableA : 150000 record.

TableB: 80000 record.

Bây giờ, mình sẽ truy vấn để lấy ra 70000 record của dữ liệu tableA không tồn tại trong tableB.

Viết câu lệnh này, chúng ta sẽ có 4 cách để thực hiện:

1. Đầu tiên sử dụng câu lệnh NOT IN 

SET STATISTICS TIME ON;  
SELECT ID FROM tableA
WHERE ID NOT IN (SELECT ID FROM tableB)
SET STATISTICS TIME OFF;

2. Sử dụng câu lệnh NOT EXISTS

SET STATISTICS TIME ON;  
SELECT ID FROM tableA
WHERE NOT EXISTS 
(SELECT ID FROM tableB WHERE tableA.ID = tableB.ID)
SET STATISTICS TIME OFF;

3. Sử dụng câu lệnh LEFT OUTER JOIN

SET STATISTICS TIME ON;
SELECT tableA.ID FROM tableA
LEFT OUTER JOIN tableB ON tableA.ID = tableB.ID
WHERE tableB.ID IS NULL
SET STATISTICS TIME OFF;

4. Sử dụng câu lệnh EXCEPT

SET STATISTICS TIME ON;
SELECT ID FROM tableA
EXCEPT
SELECT ID FROM tableB
SET STATISTICS TIME OFF;

=> Tất cả 4 câu lệnh trên đều trả về cho chúng ta một kết quả giống nhau là tìm ra dữ liệu 70000 record không tồn tại.

Để kiểm tra tốc độ truy vấn của các câu sqlserver, các bạn sử dụng câu lệnh

 SET STATISTICS TIME ON;

//query sqlserver

SET STATISTICS TIME OFF;

và dưới đây là kết quả khi thực hiện 4 câu lệnh trên:

--- NOT IN
(70000 row(s) affected)

 SQL Server Execution Times:
   CPU time = 78 ms,  elapsed time = 90 ms.

--- NOT EXIST

(70000 row(s) affected)

 SQL Server Execution Times:
   CPU time = 94 ms,  elapsed time = 167 ms.

--- LEFT OUT JOIN

(70000 row(s) affected)

 SQL Server Execution Times:
   CPU time = 110 ms,  elapsed time = 349 ms.

--- EXCEPT

(70000 row(s) affected)

 SQL Server Execution Times:
   CPU time = 203 ms,  elapsed time = 301 ms.

Trong 4 câu lệnh này, mình khuyên các bạn nên sử dụng câu lệnh NOT EXIST và LEFT OUT JOIN.

Còn lý do tại sao, tùy tình huống các bạn có thể sử dụng 4 câu lệnh trên để tìm ra kết quả tốt nhất

HAPPY CODING heart

Tags: not innot existsexceptleft outer join
0