8.2.1. Пример расчета межгрупповых сумм квадратов
Вернемся к примеру из подпараграфа 8.1.3. Полные модельные данные представлены в таблице, где в каждой клетке по три результата испытуемых.
Начинающий преподаватель | Преподаватель со средним опытом | Преподаватель с большим опытом | |
Низкая мотивация студента | 1 | 3 | 4 |
2 | 4 | 6 | |
3 | 5 | 8 | |
Средняя мотивация студента | 3 | 7 | 13 |
4 | 9 | 14 | |
5 | 11 | 15 | |
Высокая мотивация студента | 10 | 13 | 15 |
12 | 14 | 16 | |
14 | 15 | 17 |
Далее мы оставляем в таблице только числа без заголовков строк и столбцов. Как и в случае однофакторного анализа, сначала вычитаем общее среднее (которое здесь нас не интересует), равное 9, и раскладываем оставшуюся таблицу в сумму модели и ошибки:
−8 | −6 | −5 | = | −7 | −5 | −3 | + | −1 | −1 | −2 |
−7 | −5 | −3 | −7 | −5 | −3 | 0 | −0 | 0 | ||
−6 | −4 | −1 | −7 | −5 | −3 | 1 | 1 | 2 | ||
−6 | −2 | 4 | −5 | 0 | 5 | −1 | −2 | −1 | ||
−5 | 0 | 5 | −5 | 0 | 5 | 0 | 0 | 0 | ||
−4 | 2 | 6 | −5 | 0 | 5 | 1 | 2 | 1 | ||
1 | 4 | 6 | 3 | 5 | 7 | −2 | −1 | −1 | ||
3 | 5 | 7 | 3 | 5 | 7 | 0 | 0 | 0 | ||
5 | 6 | 8 | 3 | 5 | 7 | 2 | 1 | 1 |
В первой таблице правой части вместо индивидуальных показателей ставится среднее по соответствующей клетке, во второй таблице правой части — разница между индивидуальным значением и средним по соответствующей клетке (т.е. средним по данной группе). Соответствующее равенство сумм квадратов \( 684=648+36 (S_{m+e}=S_{model}+S_{error}) \). Правая таблица (таблица ошибки) дает нам сумму квадратов остатка, которая пойдет в знаменатели F-отношений, а среднюю таблицу раскладываем в три таблицы, характеризующие разные аспекты вклада факторов.
−7 | −5 | −3 | = | −3 | 0 | 3 | + | −5 | −5 | −5 | + | 1 | 0 | −1 |
−7 | −5 | −3 | −3 | 0 | 3 | −5 | −5 | −5 | 1 | 0 | −1 | |||
−7 | −5 | −3 | −3 | 0 | 3 | −5 | −5 | −5 | 1 | 0 | −1 | |||
−5 | 0 | 5 | −3 | 0 | 3 | 0 | 0 | 0 | −2 | 0 | 2 | |||
−5 | 0 | 5 | −3 | 0 | 3 | 0 | 0 | 0 | −2 | 0 | 2 | |||
−5 | 0 | 5 | −3 | 0 | 3 | 0 | 0 | 0 | −2 | 0 | 2 | |||
3 | 5 | 7 | −3 | 0 | 3 | 5 | 5 | 5 | 1 | 0 | −1 | |||
3 | 5 | 7 | −3 | 0 | 3 | 5 | 5 | 5 | 1 | 0 | −1 | |||
3 | 5 | 7 | −3 | 0 | 3 | 5 | 5 | 5 | 1 | 0 | −1 |
Разложение сумм квадратов для этих таблиц \( 648=162+450+36 (S_{model}=S_{f1}+S_{f2}+S_{f1*f2}) \).
Первая таблица в правой части равенства, описывающего это разложение, это таблица вклада фактора опыта преподавателя, содержащая средние по столбцам разлагаемой таблицы. Чтобы ее построить, рассчитываются средние по каждому столбцу (для каждого опыта преподавания) и ставятся в этот столбец. Эта таблица нужна для расчета основного эффекта опыта преподавания.
Следующее слагаемое — таблица вклада фактора мотивации студента — содержит средние по строкам. Для нее рассчитываются средние по каждой строке (для каждого уровня мотивации) и ставятся в эту строку. На основе этой таблицы рассчитывается основной эффект фактора мотивации студентов.
Третья таблица взаимодействия факторов содержит числа, которые нужны для равенства правой и левой частей. Например, −7 в верхнем левом углу левой таблицы разлагается на −3 первой таблицы, −5 второй таблицы и дополняющую 1 третьей таблицы в правой части. Эта таблица используется для расчета эффекта взаимодействия. Она может выглядеть довольно сложно. Единственное условие для проверки — суммы по всем строкам и по всем столбцам должны быть равны нулю.
Как и в примечании подпараграфа 7.1.2, можно заметить, что если каждую, состоящую из 27 элементов таблицу представить 27-мерным вектором, то получится векторное равенство, причем попарные скалярные произведения векторов в правой части все равны нулю, что означает, что они ортогональны. При разложении вектора по ортогональным направлениям квадрат длины гипотенузы равен сумме квадратов обобщенных катетов (теорема Пифагора в многомерном случае), а это и есть наше разложение сумм квадратов.
Именно слагаемые в правой части и будут характеризовать значимости влияния соответствующих факторов и их взаимодействия, попадая в числитель соответствующего F-отношения. Число степеней свободы в каждом случае (только для задачи 3*3) равно соответственно, 2, 2 и 4 (подробнее чуть ниже). В знаменателе всех трех дробей будет стоять сумма квадратов таблицы ошибки, деленная на число степеней свободы, которое равно \( (3-1)*9=18 \). Непростая теорема математической статистики говорит, что вклады каждой из трех таблиц могут оцениваться независимо, каждая по отношению к своей нулевой гипотезе о равенстве средних.
Для действия на средние отдельно опыта преподавателя
\[ F_{18}^2=\frac{162/2}{36/18}=40.5, p<0.000001 \].
Для действия на средние отдельно мотивации студентов
\[ F_{18}^2=\frac{450/2}{36/18}=112.5, p<0.000001 \].
Для влияния взаимодействия факторов
\[ F_{18}^4=\frac{36/4}{36/18}=4.5, p=0.011. \]
(p во всех трех случаях измеряет вес хвоста соответствующего распределения Фишера, который отсекается данным значением F).
Сопоставление сумм квадратов показывает, что факторы дают каждый в отдельности весьма существенный вклад в уровень знаний студентов (мотивация более важна, чем опыт преподавателя). Взаимодействие факторов дает менее существенный вклад, но психологический смысл этого взаимодействия более интересен, чем вполне предсказуемый вклад факторов.
8.2.2. Расчеты степеней свободы
Как распределяются степени свободы по трем таблицам, очень просто разъяснить на примере. Пусть первый фактор в наборе данных имеет три уровня, а второй четыре уровня. Для расчета нам понадобится таблица:
Общее среднее | Фактор 1 | Фактор 1 |
Фактор 2 | взаимодействие | взаимодействие |
Фактор 2 | взаимодействие | взаимодействие |
Фактор 2 | взаимодействие | взаимодействие |
Пересчитывая клетки, получаем для первого фактора 2 степени свободы, для второго — 3 степени свободы и для взаимодействия — 6 степеней свободы.