Регресионен анализ

Необходими данни

За да се използва регресионният анализ са необходими данни от експеримент (планиран или непланиран) и получените от тези експерименти стойности на целевата функция. Всяка променлива, както и измереният резултат се записват в отделни колони. Всички колони трябва да са от тип 'Данни' (виж видове данни). Ако има повече от един показател на качеството, цялата процедура на регресионния анализ се повтаря по отделно за всеки от показателите. 

Следва пример на данни за регресионен анализ - 6 променливи и една колона с резултати:

Обща процедура

0. След въвеждането на входовете (p1 - p6 в горния пример) и изхода (y4), използвайте Диаграми и методи/Регресионен анализ за започване на изчисленията. Разглежданият пример се базира на данни, записани във файл   10-Regression analysis.qsl, даден в директорията с примерите. Като входове са избрани p1, p2, p3, p4, p5, p6 а изходът е y4.

1. След активиране на модула, трябва най-напред да изберем структурата на модела, който бихме искали да използваме при анализа. Възможно е да се изберат участващите коефициенти индивидуално или да се използват предварително дефинирани шаблони чрез кликване на десния бутон на мишката върху надписа 'Избери', както е показано на графиката по-долу. Примерът използва шаблона 1ва и 2ра степен + b0.

Възможно е да се използва автоматизирана процедура за избор, като стъпкова регресия, или процедури за включване или изключване на коефициенти в модела.Ако искате да използвате това, изберете 'Автоматичен подбор на регресори' след кликване на бутона 'Настройки'. В този случай също трябва да изберете началният модел от който да започнете.

2. След избора на участващите коефициенти моделът ще се изчислява автоматично и ще дава обширен статистически анализ на регресионния модел.

Означения:

t - стойност на разпределението на Стюдънт, използвана за проверка на значимостта на коефициентите

- критична стойност на разпределението на Стюдънт при ниво на значимост и брой на степените на свобода (двустранен критерий за проверка на хипотезата)

р - вероятност регресионният коефициент да е незначим при зададените ниво на значимост и степени на свобода.

Коефициентът е незначим, ако или ако .

Остатъчно СКО - остатъчно средноквадратично отклонение

R-sq - коефициент на детерминация (квадрат на коефициента на множествена корелация)

Radj-sq - коригиран коефициент на детерминация

F - стойност на разпределението на Фишер, използвана за проверка на значимостта на коефициента на множествена корелация

- критична стойност на разпределението на Фишер при ниво на значимост и брой на степените на свобода и .

P - вероятност коефициентът на моножествена корелация да е незначим при зададените ниво на значимост и степени на свобода.

Коефициентът на множествена корелация е незначим ако или  

y - измерена стойност на отклика

yp - предсказана стойност на отклика

y-yp - остатък

R-sq (pred) - коефициент на детерминация за предсказаната стойност

VIF - фактор на инфлация на разсейването

3. Можете да добавяте или изваждате коефициенти, за да получите модел, съдържащ най-подходящите регресори, като запазвате значимите коефициенти. Окончателният модел може да се запише във файл, който може по-късно да се използва като шаблон с различни данни, да се запише във файл или просто да бъде пренесен в електронната таблица (бутон 'Пренеси в таблицата'), за да се използва за оптимизация или други дейности. Възможно е също да се покаже различна графична информация, за улесняване на анализа. За целта се натиска бутона 'Графичен анализ' и се избира графика от следното меню:

При графичния анализ на остатъците може да се работи с обикновени или стандартизирани остатъци.

В разглеждания пример се забелязва следното:

От нормалната или полунормалната графика на ефектите се вижда кои ефекти са незначими и могат да се пренебрегнат. Ако се извадят всички незначими коефициенти от модела чрез бутона за изтриване на коефициентите ('Изтрий') ще получим нов модел:

Този модел е със значително подобрени PRESS, R-sq (pred) и VIF.

 Други възможности на регресионния анализ

При натискане на бутона 'Настройки' се появява следното:

При маркиране на 'Автоматичен подбор на регресори' се появява следното меню, от което може да се избере стъпкова регресия, прав подбор на регресори или обратна елиминация на регресори:

Например, ако се включи стъпкова регресия при Alpha вкл = Alpha изкл = 0.1 за разглеждания по-горе пример се получава следния краен резултат:

Този резултат съвпада с получения чрез ръчно изключване на регресори, който е даден по-горе. Cp е статистиката на Mallows.

Виж също:

            Упражнения по оптимизация, моделиране и робастно проектиране

Обратно към въвеждане на данни