Однофакторный дисперсионный анализ

Из множества факторов, влияющих на рассеяние выходной величины у, выбирается один, который, по мнению исследователя, имеет наибольшее влияние на это рассеяние [3]. Остальные факторы служат фоном (ошибкой эксперимента). Чтобы выявить эффект исследуемого фактора, его делят на несколько четко различимых уровней, а остальные факторы рандомизируют. Число экспериментов при этом может быть случайным или определенным по специальной методике из условия минимальной различимости эффектов. Продолжительность экспериментальных исследований должна быть достаточной для того, чтобы учесть все факторы, влияющие на рассеяние выходной величины, по результатам наблюдений и с учетом рандомизации строится таблица наблюдений и первоначальной обработки результатов эксперимента (таб.1), причем следует особо отметить то обстоятельство, что число наблюдений по разным уровням исследуемого фактора может быть разным. По данным таблицы вычисляются оценки дисперсии, связанные с изменением уровней исследуемого фактора - дисперсия между выборками S2А, и ошибки эксперимента, то есть дисперсия внутри выборки S2от.

Таблица 1 - Схема определения дисперсий

Источник дисперсии

Сумма квадратов

Число степеней свободы

Дисперсия

Между выборками

Таким образом, сумма квадратов отклонений и общее число степеней свободы делятся на две составляющие. Одна составляющая основана на дисперсии частных средних вокруг общего среднего х, а другая - на дисперсиях внутри выборок.

Разбиение суммы квадратов

Для выборки n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия функции суммы квадратов (отклонений), обозначаемая, для краткости, SS.

Группа 1

Группа 2

Наблюдение 1 Наблюдение 2 Наблюдение 3

2 3 1

6 7 5

Среднее Сумма квадратов (СК)

2 2

6 2

Общее среднее Общая сумма квадратов

4 28

 

Средние двух групп существенно различны (2 и 6 соответственно). Сумма квадратов отклонений внутри каждой группы равна 2. Складывая их, получаем 4. Если теперь повторить эти вычисления без учета групповой принадлежности, то есть, если вычислить SS исходя из общего среднего этих двух выборок, то получим величину 28. Иными словами, дисперсия (сумма квадратов), основанная на внутригрупповой изменчивости, приводит к гораздо меньшим значениям, чем при вычислении на основе общей изменчивости (относительно общего среднего). Причина этого, очевидно, заключается в существенной разнице между средними значениями, и это различие между средними и объясняет существующее различие между суммами квадратов. В самом деле, если использовать для анализа этих данных модуль Дисперсионный анализ, то будет получена следующая таблица, называемая таблицей дисперсионного анализа:

ГЛАВНЫЙ ЭФФЕКТ

SS

ст.св.

MS

F

p

Эффект Ошибка

24.0 4.0

1 4

24.0 1.0

24.0

0.08

Перейти на страницу:
1 2