Трансформации на Бокс-Кокс

Трансформациите на Бокс-Кокс се използват за трансформиране на случайни величини с различно от нормалното разпределение в нормално. Това е възможно за много, но не всички разпределения. Да предположим, че са зададени наблюдения  , , които не са с нормално разпределение. Трансформацията на Бокс-Кокс е:

          за

   или             за   

В QstatLab може да се задава файл с N данни, които не са с нормално разпределение. Проверката за нормалност на данните става с помощта на критерия на Андесън-Дарлинг. Този критерий изчислява вероятността р (в програмата е означена като АD р). Ако р > 0.05 се приема, че разпределението е нормално. Когато р < 0.05 може да се приложи трансформацията на Бокс-Кокс. Има две програми, през които може да се стигне до трансформацията на Бокс-Кокс:

·        Проверка за нормалност на разпределението ()

·        Хистограми ()

За да се активират програмите трябва да е набрана колона с данни. Например,нека са зададени N = 16 наблюдения, за които е зададена и горна толерансна граница USL = 0,6. Хистограмата е (данните се намират във файл BoxCox-Normality.qsl в директоря Primeri в директорията, в която е инсталирана програмата):

Разпределението очевидно не е нормално. Проверката за нормалност по критерия на Андерсън-Дарлинг също показва, че те не са с нормално разпределение (р = 0,002168<0,5)

 

 

За да се приложи трансформацията се маркира полето пред надписа Box-Cox. Това активира т.н. Box-Cox калкулатор. С негова помощ може да се извърши една от следните операции:

Ø  Автоматичен избор на λ (чрез кликване на „Аutо“)  или ръчен (чрез задаване от клавиатурата в полето за λ)

Ø  Трансформиране на което и да е число (или масив) с избраната трансформация

Ø  Обратна трансформация (връщане от трансформирано число в оригинално). За целта се задава число и се получава трансформираната стойност

Ø  Прехвърляне на трансформираните числа в избрана колона на таблицата

Например, ако в таблицата са записани дадените по-горе данни, а за число се запише 0,6, а след това се кликне Auto се получава следния резултат:

 

 

Вижда се, че оптималното λ = -4,6288, а за трансформираните данни критерият на Андерсън-Дарлинг показва р = 0,7851. Поради това трансформираното разпределение може да се смята за нормално. Горната толерансна граница след трансформацията със същата стойност за λ става USL (λ=-4,6288) = 0,191509.

Ако се кликне бутона „В таблицата“ трансформираните данни се прехвърлят в таблицата и могат да се използват например за построяване на хистограма.

 

 

Същата трансформация може да се направи и ако се извика програмата за хистограми. Тогава се маркира „Трансформация на Box-Cox и след това „Auto”. Може също да се нанесе граничната стойност (в примера USL = 0,6) в графата „Число“ и се появява трансформираната стойност в графата „Трансформирано“. То може да се премести в полето за долна или горна толерансна граница чрез бутоните „Горна“ или „Долна“:

Като се кликне „Обща“ се появява хистограмата с трансформираните данни:

Хистограми

Проверка за нормалност

Обратно към Статистически методи