Test Q-Dixona: Identyfikowanie wartości odstających


Test Q-Dixona


Test Q-Dixona jest testem statystycznym służącym do identyfikowania wartości odstających w seriach danych. Ze względu na prostotę stosowania tego testu, test Q-Dixona jest testem częściej stosowanym niż test Grubbsa, który również może być wykorzystywany do wykrywania wartości odstających/ wartości obarczonych błędem grubym.
Laboratoria badawcze najczęściej sięgają po test Q-Dixona podczas analizy danych walidacyjnych. Laboratoria, które prowadzą ocenę statystyczną kart kontrolnych (na zakończenie danej karty), czasami stosują test Q-Dixona do wskazywania na zakończonej karcie kontrolnej tych sprawdzeń (kropek), które podczas wykonywania badania mogły podlegać pewnym “dodatkowym” czynnikom, a nie tym wyłącznie “losowym”.

Czy kończąc kartę kontrolną należy identyfikować wartości odstające?


Odpowiadając na to pytanie powinniśmy wyjść od wymagań normy PN-ISO 8258+AC1 Karty kontrolne Shewharta. W punkcie 6.3 normy znajduje się zapis który wskazuje, że podczas analizy statystycznej karty rozstępu (prowadzonej zazwyczaj równolegle tj. dla tych samych danych wejściowych co karta wartości średnich), należy “wyłączyć z obliczeń wszystkie podzbiory będące pod wpływem przyczyny wyznaczalnej…” i dopiero później “wykreślić średni rozstęp (nowy) wraz z granicami kontrolnymi”. Chociaż przywołany zapis odnosi się do karty rozstępu i wydawałoby się, że niekoniecznie ma on związek z kartą wartości średnich (lub kartą pojedynczych obserwacji), to musimy jeszcze zwrócić uwagę na zapis z punktu 6.4: “Jeśli jakiekolwiek podzbiory zostały odrzucone na karcie R z powodu stwierdzenia przyczyny wyznaczalnej, należy je także wykluczyć z karty X. Poprawione wartości R i X należy zastosować do ponownego obliczenia granic kontrolnych…”. Wielu praktyków stosujących karty kontrolne, przed przystąpieniem do wykonania testów statystycznych (testu F-Snedecora, testu t-Studenta lub testu C Cochrana i Coxa), odrzuca z karty: punkty które nie zmieściły się w granicach działania oraz punkty, które zostały wskazane przez test Q-Dixona jako wartości odstające.

Przeprowadzanie testu Q-Dixona


Wykonanie testu sprowadza się do obliczenia dwóch parametrów Q1 i Qn, oraz ich porównania z wartością krytyczną odczytaną z tablicy statystycznej testu Q-Dixona. W przypadku, gdy któryś z obliczonych parametrów przekracza wartość krytyczną Qkr, to wynik na podstawie, którego został obliczony parametr (xn lub x1) zostaje uznany jako obarczony błędem grubym.

Procedura, którą należy zastosować podczas wykonywania testu:

Krok 1. Uszereguj wyniki pomiarów w ciąg niemalejący (każdy kolejny wyraz ciągu ma być większy lub równy wyrazowi poprzedniemu)

Krok 2. Oblicz parametry Q1 i Qn zgodnie z poniższymi wzorami

Przy 3 – 7 danych:

Przy 8 – 12 danych:

Przy > 12 danych:


Wskazane powyżej wzory obliczeniowe wykorzystywane są w tzw. zaktualizowanej procedurze testowej Q-Dixona. Wykorzystując to podejście (opisane m.in. w pozycji „Zapewnianie jakości analiz chemicznych” opracowanej pod przewodnictwem dr Marka Dobeckiego, czy wskazywane w licznych materiałach prof. dr hab. inż. Piotra Konieczki), możliwe jest wykonanie testu na seriach danych które zawierają również więcej niż 10 elementów (n>10). W “klasycznej” odmianie testu Q-Dixona, dopuszczalne jest jedynie testowanie serii danych o licznościach mniejszych lub równych 10.

Wzór do obliczenia parametru Q zgodnie z klasyczną wersją testu Q-Dixona, (tylko dla 1 – 10 danych):



Krok 3. Porównaj obliczone wartości parametrów Q1 i Qn z wartością krytyczną Qkr, odczytaną z tablicy wartości krytycznych testu Q-Dixona

Tabele testu Q-Dixona

Należy pamiętać o tym, że w zależności od zastosowanego podejścia (aktualizowana procedura testu Q-Dixona, klasyczny test Q-Dixona) należy wartości krytyczne odczytać z odpowiedniej tablicy statystycznej (patrz: Tablice testu Q-Dixona).

Liczba stopni swobody

Liczba stopni swobody dla testu Q-Dixona równa jest ilości wyrazów w ciągu, co oznacza, że gdy testowaliśmy serię danych o liczności 25 elementów, wartość krytyczną Qkr odczytujemy dla wersu oznaczonego f=25 (lub n=25).

Poziom istotności

Wartości krytyczne są prezentowane zazwyczaj dla poziomu istotności a=0,90; a=0,95 lub a=0,99 (co odpowiada poziomowi 90%, 95% lub 99% pewności dla poprawności podejmowanych decyzji). Im większy % P, czyli im większa pewność wniosku
odrzucającego wynik i tym mniejsze ryzyko (100 – % P) błędnej decyzji.
Im większy % P, tym wartości krytyczne mają większą wartość i tym rzadziej będziemy odrzucali wartości odstające.
To osoba wykonująca test decyduje na jakim poziomie pewności chce podejmować decyzję o odrzuceniu wartości odstającej. Zazwyczaj wybierany jest jednak poziom istotności a=0,95. 

Krok 4. Wnioskowanie

Jeśli, któryś z parametrów (Q1 lub Qn) przekracza wartość krytyczną Qkr, to wynik na podstawie, którego został obliczony (xn lub x1) należy odrzucić jako obarczony błędem grubym.


Ile razy można wykonywać test Q-Dixona na danej serii pomiarowej?


Przyjmuje się, że przy zastosowaniu zaktualizowanych wzorów testu DIxona, serię danych można poddawać wielokrotnemu testowaniu, aż do ujawnienia wszystkich wartości odbiegających (wówczas test wykonuje się powtórnie dla n – 1 = n’ pozostałych wartości). Można również wykonać test tylko jeden raz.

Stosując z kolei klasyczną procedurę testowania testem Q-Dixona (serie o 10 lub mniejszej ilości elementów, inny wzór, inne wartości krytyczne testu…), serię testuje się tylko jeden raz.


Czy “usuwanie” z karty kontrolnej punktów (nawet za pomocą testu statystycznego) jest na pewno poprawne…?


Usunięcie z karty kontrolnej punktu (lub punktów), który zmieścił się oryginalnie w granicach działania karty jest dopuszczalne – usunięcie “odstającego” punktu przyczyni się wręcz do zaostrzenia kontroli procesu na kolejnej karcie, gdyż w ten sposób zmniejszy się odchylenie standardowe karty i ze zmniejszonym odchyleniem standardowym zostaną wykreślone węższe granice nowej karty. Podeprzemy się tutaj “wyjaśnieniem” jakie daje w tym zakresie norma ISO 8258 Karty kontrolne Shewharta w punkcie 6.4:

“Wyłączenie podzbiorów wykazujących rozregulowania nie oznacza prostego „wyrzucenia złych danych”. Przez wyłączenie punktów reprezentujących możliwe do określenia przyczyny wyznaczalne, mamy lepsze przybliżenie tego, co kryje się w tle zmienności losowej. Daje to najwłaściwsze podstawy do obliczania granic kontrolnych stosowanych do wykrywania w najbardziej efektywny sposób przyszłych wystąpień przyczyn wyznaczalnych zmienności.”





Strona domyślnie nie używa ciasteczek (cookies). Możesz zaakceptować cookies, aby umożliwić poprawne działanie wybranych funkcjonalności serwisu. Więcej informacji

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close