Các ví dụ được hiển thị bên dưới sử cách đọc kèo bóng đáng các bảng trongPostgreSQLCơ sở dữ liệu kiểm tra hồi quy. Các đầu ra được hiển thị được lấy từ phiên bản 8.3. Hành vi của các phiên bản sớm hơn (hoặc muộn hơn) có thể khác nhau. Cũng lưu ý rằng vìPhân tích
Sử cách đọc kèo bóng đáng lấy mẫu ngẫu nhiên trong khi tạo ra số liệu thống kê, kết quả sẽ thay đổi một chút sau bất kỳ mới nàoPhân tích
.
Hãy bắt đầu với một truy vấn rất đơn giản:
Giải thích chọn * từ TENK1; Kế hoạch truy vấn --------------------------------------------------------------------- SEQ SCAN trên TENK1 (chi phí = 0,00..458.00 cách đọc kèo bóng đá = 10000 chiều rộng = 244)
Cách người lập kế hoạch xác định cách đọc kèo bóng đá chất củaTENK1
được bao phủ trongPhần 14.2, nhưng được lặp lại ở đây để hoàn thiện. Số lượng trang và cách đọc kèo bóng đá được tra cứu trongpg_ class
:
11179_11316
Những con số này hiện tại là lần cuốiVACUUM
hoặcPhân tích
Trên bàn. Sau đó, người lập kế hoạch lấy số lượng trang hiện tại thực tế trong bảng (đây là một hoạt động rẻ tiền, không yêu cầu quét bảng). Nếu điều đó khác vớiRelpages
sau đóReltuples
được chia tỷ lệ tương ứng để đạt được ước cách đọc kèo bóng đá số lượng hàng hiện tại. Trong ví dụ trên, giá trị củaRelpages
được cập nhật để ước cách đọc kèo bóng đá giống nhưReltuples
.
Hãy chuyển sang một ví dụ với điều kiện phạm vi trongWHERE
mệnh đề:
Giải thích Chọn * từ Tenk1 trong đó độc đáo1 <1000; Kế hoạch truy vấn ----------------------------------------------------------------------- ------------- Quét heap bitmap trên TENK1 (chi phí = 24,06..394.64 cách đọc kèo bóng đá = 1007 chiều rộng = 244) RECHECK COND: (độc đáo1 <1000) - Quét chỉ mục bitmap trên TENK1_UNIQUE1 (chi phí = 0,00..23,80 cách đọc kèo bóng đá = 1007 chiều rộng = 0) Index Cond: (độc đáo1 <1000)
Người lập kế hoạch kiểm traWHERE
Điều kiện mệnh đề và tìm kiếm chức năng chọn lọc cho toán tử<
inPG_OPERATOR
. Cái này được giữ trong cộtOprrest
và mục nhập trong trường hợp này làScalarltsel
. TheScalarltsel
Hàm lấy biểu đồ chođộc đáo1
từpg_statistic
. Đối với các truy vấn thủ công, sẽ thuận tiện hơn để xem xét đơn giản hơnpg_stats
Xem:
Chọn Biểu đồ_Bound từ PG_Stats Trong đó tablename = 'tenk1' và attname = 'độc đáo1'; Biểu đồ_bound ------------------------------------------------------------------ 0,993,1997,3050,4040,5036.5957,7057,8029,9016,9995
Tiếp theo phần của biểu đồ bị chiếm bởi<1000Hồiđược thực hiện. Đây là cách đọc kèo bóng đá chọn lọc. Biểu đồ chia phạm vi thành các thùng tần số bằng nhau, vì vậy tất cả những gì chúng ta phải làm là xác định vị trí của thùng mà giá trị của chúng ta ở và đếmPhầncủa nó vàtất cảtrong số những cái trước. Giá trị 1000 rõ ràng trong thùng thứ hai (993 Từ1997). Giả sử phân phối tuyến cách đọc kèo bóng đá của các giá trị bên trong mỗi nhóm, chúng ta có thể cách đọc kèo bóng đá toán độ chọn lọc là:
chọn lọc = (1 + (1000 - xô [2] .min)/(xô [2] .max - xô [2] .min))/num_buckets = (1 + (1000 - 993)/(1997 - 993))/10 = 0.100697
nghĩa là, một nhóm toàn bộ cộng với một phần tuyến cách đọc kèo bóng đá của phần thứ hai, chia cho số lượng thùng. Số lượng hàng ước cách đọc kèo bóng đá hiện có thể được cách đọc kèo bóng đá là sản phẩm của cách đọc kèo bóng đá chọn lọc và cách đọc kèo bóng đá toán củaTENK1
:
cách đọc kèo bóng đá = rel_cardinality * chọn lọc = 10000 * 0.100697 = 1007 (làm tròn)
Tiếp theo hãy xem xét một ví dụ với điều kiện bình đẳng trongWHERE
mệnh đề:
Giải thích Chọn * từ Tenk1 trong đó StringU1 = 'craaaa'; Kế hoạch truy vấn ---------------------------------------------------------------------- SEQ SCAN trên TENK1 (chi phí = 0,00..483.00 cách đọc kèo bóng đá = 30 chiều rộng = 244) Bộ lọc: (StringU1 = 'craaaa' :: name)
Một lần nữa người lập kế hoạch kiểm traWHERE
Điều kiện mệnh đề và tìm kiếm chức năng chọn lọc cho=
, đó làeqsel
. Đối với ước cách đọc kèo bóng đá bình đẳng, biểu đồ không hữu ích; Thay vào đó là danh sáchGiá trị phổ biến nhất(MCVS) được sử dụng để xác định cách đọc kèo bóng đá chọn lọc. Chúng ta hãy xem các MCV, với một số cột bổ sung sẽ hữu ích sau:
15507_15867
kể từcraaaa
Xuất hiện trong danh sách MCV, cách đọc kèo bóng đá chọn lọc chỉ là mục nhập tương ứng trong danh sách các tần số phổ biến nhất (MCFs):
chọn lọc = MCF [3] = 0,003
Như trước đây, số lượng hàng ước cách đọc kèo bóng đá chỉ là sản phẩm của điều này với cách đọc kèo bóng đá chất củaTENK1
:
cách đọc kèo bóng đá = 10000 * 0,003 = 30
Bây giờ hãy xem xét cùng một truy vấn, nhưng với một hằng số không có trongMCVDanh sách:
Giải thích Chọn * từ Tenk1 trong đó StringU1 = 'XXX'; Kế hoạch truy vấn ---------------------------------------------------------------------- SEQ SCAN trên TENK1 (chi phí = 0,00..483.00 cách đọc kèo bóng đá = 15 chiều rộng = 244) Bộ lọc: (StringU1 = 'xxx' :: name)
Đây là một vấn đề khá khác: Cách ước cách đọc kèo bóng đá độ chọn lọc khi giá trị làkhôngtrongMCVDanh sách. Cách tiếp cận là sử cách đọc kèo bóng đáng thực tế là giá trị không có trong danh sách, kết hợp với kiến thức về tần số cho tất cả cácMCVS:
chọn lọc = (1 - sum (mvf))/(num_distince - num_mcv) = (1 - (0,00333333 + 0,003 + 0,003 + 0,003 + 0,003 + 0,003 + 0,003 + 0,003 + 0,003 + 0,003))/(676 - 10) = 0,0014559
nghĩa là thêm tất cả các tần số choMCVS và trừ chúng khỏi một, sau đó chia cho số lượngkhácGiá trị riêng biệt. Số tiền này để giả định rằng tỷ lệ của cột không phải là bất kỳ MCV nào được phân phối đều trong số tất cả các giá trị riêng biệt khác. Lưu ý rằng không có giá trị null nên chúng tôi không phải lo lắng về những giá trị đó (nếu không chúng tôi cũng sẽ trừ phần null từ tử số). Số lượng hàng ước cách đọc kèo bóng đá sau đó được cách đọc kèo bóng đá như bình thường:
cách đọc kèo bóng đá = 10000 * 0,0014559 = 15 (làm tròn)
Ví dụ trcách đọc kèo bóng đá vớiđộc đáo1 <1000
là một sự đơn giản hóa quá mức của những gìScalarltsel
Thực sự; Bây giờ chúng ta đã thấy một ví dụ về việc sử cách đọc kèo bóng đáng MCV, chúng ta có thể điền vào một số chi tiết hơn. Ví dụ là chính xác theo như nó đã đi, bởi vì vìđộc đáo1
là một cột duy nhất mà nó không có MCV (rõ ràng, không có giá trị nào là phổ biến hơn bất kỳ giá trị nào khác). Đối với một cột không duy nhất, thông thường sẽ có cả biểu đồ và danh sách MCV vàBiểu đồ không bao gồm phần quần thể cột được đại diện bởi MCVS. Chúng tôi làm mọi thứ theo cách này bởi vì nó cho phép ước cách đọc kèo bóng đá chính xác hơn. Trong tình huống nàyScalarltsel
Áp cách đọc kèo bóng đáng trực tiếp điều kiện (ví dụ:<1000Hồi) cho mỗi giá trị của danh sách MCV và thêm tần số của MCV mà điều kiện là đúng. Điều này đưa ra một ước cách đọc kèo bóng đá chính xác về cách đọc kèo bóng đá chọn lọc trong phần của bảng là MCV. Biểu đồ sau đó được sử dụng theo cách tương tự như trên để ước cách đọc kèo bóng đá độ chọn lọc trong phần của bảng không phải là MCV và sau đó hai số được kết hợp để ước cách đọc kèo bóng đá độ chọn lọc tổng thể. Ví dụ, xem xét
Giải thích Chọn * từ Tenk1 trong đó StringU1 <'IAAAAA'; Kế hoạch truy vấn -------------------------------------------------------------------- SEQ SCAN trên TENK1 (chi phí = 0,00..483.00 cách đọc kèo bóng đá = 3077 chiều rộng = 244) Bộ lọc: (StringU1 <'IAAAAA' :: name)
Chúng ta đã thấy thông tin MCV choStringU1
, Và đây là biểu đồ của nó:
Chọn Biểu đồ_bound từ PG_Stats Trong đó tablename = 'tenk1' và attname = 'StringU1'; Biểu đồ_bound ----------------------------------------------------------------------- ------------- Aaaaaa, cqaaaa, fraaaa, ibaaaa, kraaaa, nfaaaa, psaaaa, sgaaaa, vaaaaa, xlaaaa, zzaaaa
Kiểm tra danh sách MCV, chúng tôi thấy rằng điều kiệnStringU1 <'IAAAAA'
được thỏa mãn bởi sáu mục đầu tiên chứ không phải bốn mục cuối cùng, vì vậy cách đọc kèo bóng đá chọn lọc trong phần MCV của dân số là
electivity = sum (MVFS có liên quan) = 0,00333333 + 0,003 + 0,003 + 0,003 + 0,003 + 0,003 = 0,01833333
Tóm tắt tất cả các MCF cũng cho chúng ta biết rằng tổng số dân số được đại diện bởi MCV là 0,03033333, và do đó, tỷ lệ được biểu thị bằng biểu đồ là 0,9696667 (một lần nữa, không có null nào, chúng ta sẽ không loại trừ chúng ở đây). Chúng ta có thể thấy rằng giá trịIAAAAA
rơi gần ở cuối nhóm biểu đồ thứ ba. Sử dụng một số giả định khá nhảm nhí về tần suất của các ký tự khác nhau, người lập kế hoạch đến ước cách đọc kèo bóng đá 0,298387 cho phần quần thể biểu đồ nhỏ hơnIAAAAA
. Sau đó, chúng tôi kết hợp các ước cách đọc kèo bóng đá cho quần thể MCV và không phải MCV:
chọn lọc = mcv_selectivity + Biểu đồ_selectivity * Biểu đồ = 0,01833333 + 0.298387 * 0.96966667 = 0,307669 cách đọc kèo bóng đá = 10000 * 0.307669 = 3077 (làm tròn tắt)
Trong ví dụ cụ thể này, hiệu chỉnh từ danh sách MCV khá nhỏ, bởi vì phân phối cột thực sự khá phẳng (các số liệu thống kê cho thấy các giá trị cụ thể này là phổ biến hơn so với các giá trị khác chủ yếu là do lỗi lấy mẫu). Trong một trường hợp điển hình hơn trong đó một số giá trị phổ biến hơn đáng kể so với các giá trị khác, quá trình phức tạp này mang lại sự cải thiện hữu ích về độ chính xác vì cách đọc kèo bóng đá chọn lọc cho các giá trị phổ biến nhất được tìm thấy chính xác.
Bây giờ chúng ta hãy xem xét một trường hợp có nhiều hơn một điều kiện trongWHERE
mệnh đề:
Giải thích Chọn * từ Tenk1 trong đó độc đáo1 <1000 và StringU1 = 'xxx'; Kế hoạch truy vấn ----------------------------------------------------------------------- ------------- Quét heap bitmap trên TENK1 (chi phí = 23,80..396.91 cách đọc kèo bóng đá = 1 chiều rộng = 244) RECHECK COND: (độc đáo1 <1000) Bộ lọc: (StringU1 = 'xxx' :: name) - Quét chỉ mục bitmap trên TENK1_UNIQUE1 (chi phí = 0,00..23,80 cách đọc kèo bóng đá = 1007 chiều rộng = 0) Index Cond: (độc đáo1 <1000)
Người lập kế hoạch giả định rằng hai điều kiện độc lập, để các cách đọc kèo bóng đá chọn riêng lẻ của các mệnh đề có thể được nhân với nhau:
chọn lọc = chọn lọc (độc đáo1 <1000) * chọn lọc (StringU1 = 'xxx') = 0,100697 * 0,0014559 = 0,0001466 cách đọc kèo bóng đá = 10000 * 0.0001466 = 1 (làm tròn tắt)
Lưu ý rằng số lượng hàng được ước cách đọc kèo bóng đá sẽ được trả về từ quét chỉ số bitmap chỉ phản ánh điều kiện được sử dụng với chỉ mục; Điều này rất quan trọng vì nó ảnh hưởng đến ước cách đọc kèo bóng đá chi phí cho các đống tiếp theo.
Cuối cùng chúng tôi sẽ kiểm tra một truy vấn liên quan đến tham gia:
Giải thích Chọn * Từ Tenk1 T1, Tenk2 T2 Trong đó t1.Unique1 <50 và t1.Unique2 = t2.unique2; Kế hoạch truy vấn ----------------------------------------------------------------------- ----------------------- Vòng lặp lồng nhau (chi phí = 4,64..456,23 cách đọc kèo bóng đá = 50 chiều rộng = 488) - Quét heap bitmap trên tenk1 t1 (chi phí = 4,64..142,17 cách đọc kèo bóng đá = 50 chiều rộng = 244) RECHECK COND: (Độc đáo1 <50) - Quét chỉ số bitmap trên TENK1_UNIQUE1 (chi phí = 0,00..4,63 cách đọc kèo bóng đá = 50 chiều rộng = 0) Index Cond: (độc đáo1 <50) - Quét chỉ mục bằng TENK2_UNIQUE2 trên TENK2 T2 (chi phí = 0,00..6.27 cách đọc kèo bóng đá = 1 chiều rộng = 244) INDEX cond: (độc đáo2 = t1.unique2)
Hạn chế đối vớiTENK1
, độc đáo1 <50
, được đánh giá trcách đọc kèo bóng đá khi nối vòng lồng. Điều này được xử lý tương tự với ví dụ phạm vi trcách đọc kèo bóng đá đó. Lần này giá trị 50 rơi vào thùng đầu tiên củađộc đáo1
Biểu đồ:
chọn lọc = (0 + (50 - xô [1] .min)/(xô [1] .max - xô [1] .min))/num_buckets = (0 + (50 - 0)/(993 - 0))/10 = 0,005035 cách đọc kèo bóng đá = 10000 * 0,005035 = 50 (làm tròn)
Hạn chế cho sự tham gia làt2.Unique2 = t1.unique2
. Người vận hành chỉ là quen thuộc của chúng tôi=
Tuy nhiên, hàm chọn lọc được lấy từOprjoin
Cột củapg_operator
và làeqjoinsel
. eqjoinsel
tìm kiếm thông tin thống kê cho cả haitenk2
vàTENK1
:
25029_25352
Trong trường hợp này không cóMCVThông tin chođộc đáo2
Bởi vì tất cả các giá trị dường như là duy nhất, vì vậy chúng tôi sử cách đọc kèo bóng đáng một thuật toán chỉ dựa vào số lượng các giá trị riêng biệt cho cả hai mối quan hệ cùng với các phân số null của chúng:
25689_25855
Đây là, trừ phần null từ một cho mỗi mối quan hệ và chia cho tối đa số lượng các giá trị riêng biệt. Số lượng hàng mà sự tham gia có khả năng phát ra được cách đọc kèo bóng đá bằng cách đọc kèo bóng đá toán của sản phẩm Cartesian của hai đầu vào, nhân với độ chọn lọc:
cách đọc kèo bóng đá = (outer_cardinality * Inside_cardinality) * chọn lọc = (50 * 10000) * 0,0001 = 50
Đã có danh sách MCV cho hai cột,eqjoinsel
Đã sử dụng so sánh trực tiếp các danh sách MCV để xác định độ chọn lọc nối trong phần quần thể cột được đại diện bởi MCV. Ước cách đọc kèo bóng đá cho phần còn lại của quần thể theo cùng một cách tiếp cận được hiển thị ở đây.
Lưu ý rằng chúng tôi đã hiển thịInside_cardinality
Như 10000, nghĩa là kích thcách đọc kèo bóng đá không biến đổi củaTENK2
. Nó có thể xuất hiện từ việc kiểm traGiải thích
26864_27030tenk2
. Nhưng đây không phải là trường hợp: Kích thước quan hệ tham gia được ước cách đọc kèo bóng đá trước khi bất kỳ kế hoạch tham gia cụ thể nào được xem xét. Nếu mọi thứ đang hoạt động tốt thì hai cách ước cách đọc kèo bóng đá kích thước tham gia sẽ tạo ra cùng một câu trả lời, nhưng do lỗi vòng và các yếu tố khác, đôi khi chúng phân kỳ đáng kể.
Đối với những người quan tâm đến các chi tiết khác, ước cách đọc kèo bóng đá kích thước của một bảng (trước bất kỳWHERE
mệnh đề) được thực hiện trongsrc/phụ trợ/tối ưu hóa/util/plancat.c
. Logic chung cho mệnh đề chọn lọc trongSRC/phụ trợ/tối ưu hóa/path/clausesel.c
. Các chức năng chọn lọc dành riêng cho toán tử chủ yếu được tìm thấy trong.
Nếu bạn thấy bất cứ điều gì trong tài liệu không chính xác, không khớp Kinh nghiệm của bạn với cách đọc kèo bóng đá năng cụ thể hoặc yêu cầu làm rõ thêm, Vui lòng sử dụngMẫu nàyĐể báo cáo vấn đề tài liệu.