Permintaan maaf sebelumnya untuk pertanyaan yang sangat rinci. Saya telah memasukkan pertanyaan untuk menghasilkan set data lengkap untuk mereproduksi masalah, dan saya menjalankan SQL Server 2012 pada mesin 32-core. Namun, saya tidak berpikir ini khusus untuk SQL Server 2012, dan saya telah memaksa MAXDOP 10 untuk contoh khusus ini.
Saya memiliki dua tabel yang dipartisi menggunakan skema partisi yang sama. Ketika bergabung bersama mereka pada kolom yang digunakan untuk mempartisi, saya perhatikan bahwa SQL Server tidak dapat mengoptimalkan gabungan paralel sebanyak yang diharapkan dan dengan demikian memilih untuk menggunakan HASH JOIN. Dalam kasus khusus ini, saya dapat secara manual mensimulasikan paralel GABUNG paralel yang jauh lebih optimal dengan memecah kueri menjadi 10 rentang terpisah berdasarkan fungsi partisi dan menjalankan masing-masing kueri secara bersamaan di SSMS. Menggunakan WAITFOR untuk menjalankan semuanya pada waktu yang bersamaan, hasilnya adalah semua kueri selesai dalam ~ 40% dari total waktu yang digunakan oleh paralel asli HASH JOIN.
Apakah ada cara untuk mendapatkan SQL Server untuk membuat optimasi ini sendiri dalam kasus tabel yang dipartisi secara setara? Saya mengerti bahwa SQL Server umumnya dapat mengeluarkan banyak overhead untuk membuat paralel GABUNG GABUNGAN, tetapi sepertinya ada metode sharding yang sangat alami dengan overhead minimal dalam kasus ini. Mungkin ini hanya kasus khusus bahwa pengoptimal belum cukup pintar untuk mengenali?
Berikut adalah SQL untuk mengatur kumpulan data yang disederhanakan untuk mereproduksi masalah ini:
/* Create the first test data table */
CREATE TABLE test_transaction_properties
( transactionID INT NOT NULL IDENTITY(1,1)
, prop1 INT NULL
, prop2 FLOAT NULL
)
/* Populate table with pseudo-random data (the specific data doesn't matter too much for this example) */
;WITH E1(N) AS (
SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
)
, E2(N) AS (SELECT 1 FROM E1 a CROSS JOIN E1 b)
, E4(N) AS (SELECT 1 FROM E2 a CROSS JOIN E2 b)
, E8(N) AS (SELECT 1 FROM E4 a CROSS JOIN E4 b)
INSERT INTO test_transaction_properties WITH (TABLOCK) (prop1, prop2)
SELECT TOP 10000000 (ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) % 5) + 1 AS prop1
, ABS(CAST(CAST(NEWID() AS VARBINARY) AS INT)) * rand() AS prop2
FROM E8
/* Create the second test data table */
CREATE TABLE test_transaction_item_detail
( transactionID INT NOT NULL
, productID INT NOT NULL
, sales FLOAT NULL
, units INT NULL
)
/* Populate the second table such that each transaction has one or more items
(again, the specific data doesn't matter too much for this example) */
INSERT INTO test_transaction_item_detail WITH (TABLOCK) (transactionID, productID, sales, units)
SELECT t.transactionID, p.productID, 100 AS sales, 1 AS units
FROM test_transaction_properties t
JOIN (
SELECT 1 as productRank, 1 as productId
UNION ALL SELECT 2 as productRank, 12 as productId
UNION ALL SELECT 3 as productRank, 123 as productId
UNION ALL SELECT 4 as productRank, 1234 as productId
UNION ALL SELECT 5 as productRank, 12345 as productId
) p
ON p.productRank <= t.prop1
/* Divides the transactions evenly into 10 partitions */
CREATE PARTITION FUNCTION [pf_test_transactionId] (INT)
AS RANGE RIGHT
FOR VALUES
(1,1000001,2000001,3000001,4000001,5000001,6000001,7000001,8000001,9000001)
CREATE PARTITION SCHEME [ps_test_transactionId]
AS PARTITION [pf_test_transactionId]
ALL TO ( [PRIMARY] )
/* Apply the same partition scheme to both test data tables */
ALTER TABLE test_transaction_properties
ADD CONSTRAINT PK_test_transaction_properties
PRIMARY KEY (transactionID)
ON ps_test_transactionId (transactionID)
ALTER TABLE test_transaction_item_detail
ADD CONSTRAINT PK_test_transaction_item_detail
PRIMARY KEY (transactionID, productID)
ON ps_test_transactionId (transactionID)
Sekarang kami akhirnya siap mereproduksi kueri yang tidak optimal!
/* This query produces a HASH JOIN using 20 threads without the MAXDOP hint,
and the same behavior holds in that case.
For simplicity here, I have limited it to 10 threads. */
SELECT COUNT(*)
FROM test_transaction_item_detail i
JOIN test_transaction_properties t
ON t.transactionID = i.transactionID
OPTION (MAXDOP 10)
Namun, menggunakan satu utas untuk memproses setiap partisi (contoh untuk partisi pertama di bawah) akan menghasilkan rencana yang jauh lebih efisien. Saya menguji ini dengan menjalankan kueri seperti di bawah ini untuk masing-masing dari 10 partisi tepat pada saat yang sama, dan semua 10 selesai hanya dalam 1 detik:
SELECT COUNT(*)
FROM test_transaction_item_detail i
INNER MERGE JOIN test_transaction_properties t
ON t.transactionID = i.transactionID
WHERE t.transactionID BETWEEN 1 AND 1000000
OPTION (MAXDOP 1)