Contoh SQL Server Pembaruan Statistik melewatkan RANGE_HI

10

Saya mencoba memahami cara kerja pengambilan sampel Statistik dan apakah perilaku di bawah ini diharapkan pada pembaruan statistik sampel.

Kami memiliki tabel besar yang dipartisi berdasarkan tanggal dengan beberapa miliar baris. Tanggal partisi adalah tanggal bisnis sebelumnya dan juga merupakan kunci naik. Kami hanya memuat data ke tabel ini untuk hari sebelumnya.

Pemuatan data berjalan dalam semalam, jadi pada hari Jumat 8 April kami memuat data untuk tanggal 7.

Setelah setiap kali berjalan kami memperbarui statistik, meskipun mengambil sampel, bukan a FULLSCAN.

Mungkin saya naif, tapi saya berharap SQL Server mengidentifikasi kunci tertinggi dan kunci terendah dalam jangkauan untuk memastikan mendapat sampel rentang akurat. Menurut artikel ini :

Untuk bucket pertama, batas bawah adalah nilai terkecil dari kolom tempat histogram dihasilkan.

Namun, itu tidak menyebutkan ember terakhir / nilai terbesar.

Dengan pemutakhiran Statistik sampel pada pagi hari tanggal 8, sampel kehilangan nilai tertinggi dalam tabel (tanggal 7).

Karena kami melakukan banyak pencarian data pada hari sebelumnya, ini menghasilkan estimasi kardinalitas yang tidak akurat dan sejumlah waktu kueri habis.

Haruskah SQL Server tidak mengidentifikasi nilai tertinggi untuk kunci itu dan menggunakannya sebagai maksimum RANGE_HI_KEY? Atau ini hanya salah satu batas pembaruan tanpa menggunakan FULLSCAN?

Versi SQL Server 2012 SP2-CU7. Saat ini kami tidak dapat memutakhirkan karena perubahan OPENQUERYperilaku di SP3 yang mengumpulkan angka dalam kueri server tertaut antara SQL Server dan Oracle.

sql-server sql-server-2012 statistics

— Mark Sinkinson
sumber

11

Haruskah SQL Server tidak mengidentifikasi nilai tertinggi untuk kunci itu dan menggunakannya sebagai maksimum RANGE_HI_KEY? Atau ini hanya salah satu batas pembaruan tanpa menggunakan FULLSCAN?

Ini adalah batasan dari implementasi statistik sampel saat ini. Seperti berdiri, sampel menggunakan pengumpulan statistik TABLESAMPLE SYSTEM, yang menggunakan pemindaian alokasi-perintah dan memilih halaman dari pemindaian untuk sampel. Hanya halaman yang dipilih yang berkontribusi pada histogram.

Karena pemindaian adalah urutan-urutan (bukan urutan-indeks), tidak ada cara untuk memberikan preferensi ke halaman pertama dan terakhir dalam urutan utama.

Untuk informasi lebih lanjut, lihat pertanyaan terkait ini:

Bagaimana cara kerja pengambilan sampel saat memperbarui statistik?

dan artikel saya, Pemindaian Alokasi

Untuk solusinya, lihat Statistik pada Kolom Naik oleh Fabiano Amorim

— Paul White 9
sumber

2

Tebakan cepat: aktifkan tanda jejak 4139.

Anda sudah menjalankan SP2-CU1 jadi ini seharusnya bekerja

Perhatikan pedoman tentang TF 2389 dan 2390 juga dan juga lihat http://sql-sasquatch.blogspot.com.mt/2013/06/mssql-plan-guides-to-address-ascending.html

(Catatan, saya belum benar-benar menemukan masalah ini dan belum menyelam sedalam itu)

— gbn
sumber