Назначение метода
Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака под влиянием изменяющихся условий или градаций какого-либо фактора. В данном варианте метода влиянию каждой из градаций фактора подвергаются разные выборки испытуемых. Градаций фактора должно быть не менее трех4.
4.Градаций может быть и две, но в этом случае мы не сможем установить нелинейных зависимостей и более разумным представляется использование более простых критериев (см. темы 3 и 4).
Непараметрическим вариантом этого вида анализа является критерий Н Крускала-Уоллиса.
Описание метода
Работу начинаем с того, что представляем полученные данные в виде столбцов индивидуальных значений. Каждый из столбцов соответствует тому или иному из изучаемых условий (см. Табл. 7.2).
После этого нам нужно просуммировать индивидуальные значения по столбцам и суммы возвести в квадрат.
Суть метода состоит в том, чтобы сопоставить сумму этих возведенных в квадрат сумм с суммой квадратов всех значений, полученных во всем эксперименте.
Гипотезы
H0: Различия между градациями фактора (разными условиями) являются не более выраженными, чем случайные различия внутри каждой группы.
H1: Различия между градациями фактора (разными условиями) являются более выраженными, чем случайные различия внутри каждой группы.
Графическое представление метода для несвязанных выборок
На Рис. 7.2 показана кривая изменения объема воспроизведения слов при разной скорости их предъявления (см. Пример). Метод дисперсионного анализа позволяет определить, что перевешивает - тенденция, выраженная этой кривой, или вариативность признака внутри групп, которая на графике схематически изображена в виде диапазонов изменения признака от минимального значения к максимальному значению в каждой группе.
Рис. 7.2. Кривая изменения объема воспроизведения при повышении скорости предъявления слов; по каждому условию показаны диапазоны изменения признака (по данным Greene J.. D'Olivera M, 1989)
Ограничения метода однофакторного дисперсионного анализа для несвязанных выборок
1. Однофакторный дисперсионный анализ требует не менее трех градаций фактора и не менее двух испытуемых в каждой градации.
2. Должно соблюдаться правило равенства дисперсий в каждой ячейке дисперсионного комплекса. Условие равенства дисперсий выполняется при использовании предлагаемой схемы расчета за счет выравнивания количества наблюдений в каждом из условий (градаций). Правомерность этого методического приема была обоснована Г.Шеффе (1980).
3. Результативный признак должен быть нормально распределен в исследуемой выборке.
Правда, обычно не указывается, идет ли речь о распределении признака во всей обследованной выборке или в той ее части, которая составляет дисперсионный комплекс.
Характерно, что зарубежные руководства, в общем, ссылаясь на необходимость нормального распределения данных для дисперсионного анализа, при рассмотрении конкретных схем и примеров к этому вопросу уже не возвращаются и никаких данных о распределении признака в выборке в целом или в тон ее части, которая составляет дисперсионный комплекс, не приводят (см. McCall R., 1970; Welkowitz J., Ewen R.B., Cohen J., 1982; Greene J., D'Olivera M-, 1989).
Рассмотрим схему дисперсионного однофакторного анализа для несвязанных выборок, предлагаемую в руководстве J.Greene, M.D'Olivera (1989) с использованием примера этих авторов.
Пример
Три различные группы из шести испытуемых получили списки из десяти слов. Первой группе слова предъявлялись с низкой скоростью -1 слово в 5 секунд, второй группе со средней скоростью - 1 слово в 2 секунды, и третьей группе с большой скоростью - 1 слово в секунду. Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты представлены в Табл. 7.2.
Таблица 7.2.
Количество воспроизведенных слов
(по: J.Greene, M.D'Olivera, 1989,p.99)
№ испытуемого |
Группа 1: низкая скорость |
Группа 2: средняя скорость |
Группа 3: высокая скорость |
1 |
8 |
7 |
4 |
2 |
7 |
8 |
5 |
3 |
9 |
5 |
3 |
4 |
5 |
4 |
6 |
5 |
6 |
6 |
2 |
6 |
8 |
7 |
4 |
Суммы |
43 |
37 |
24 |
Средние |
7,17 |
6,17 |
4,00 |
Общая сумма |
104 |
|
|
Поскольку сопоставляются разные группы, любые различия в показателях между разными условиями предъявления слов - это в то же время различия между группами испытуемых. Однако всякие различия между испытуемыми внутри каждой группы объясняются какими-то другими, не относящимися к делу переменными, будь то индивидуальные различия между отдельными испытуемыми или неконтролируемые факторы, заставляющие их реагировать различным образом. Критерий F позволяет проверить гипотезы:
Но: Различия в объеме воспроизведения слов между группами являются не более выраженными, чем случайные различия внутри каждой группы.
Н1: Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы.
Используя экспериментальные значения, представленные в Табл. 7.2, установим некоторые величины, которые будут необходимы для расчета критерия F.
Таблица 7.3.
Расчет основных величин для однофакторного дисперсионного анализа
Обозначение |
Расшифровка обозначения |
Экспериментальные значения |
Tc |
Суммы индивидуальных значений по каждому из условия |
43; 37; 24 |
∑(T2c) |
Сумма квадратов суммарных значений по каждому из условий |
∑(T2c)=432+372+242 |
C |
Количество условий (градаций фактора) |
c=3 |
n |
Количество испытуемых в каждой группе (в каждом из условий) |
n=6 |
N |
Общее количество индивидуальных значений |
N=18 |
(∑xi)2 |
Квадрат общей суммы индивидуальных значений |
(∑xi)2 =1042 |
|
Константа, которую нужно вычесть из каждой суммы квадратов |
= |
xi |
Каждое индивидуальное значение |
|
∑(xi2) |
Сумма квадратов индивидуальных значений |
Отметим разницу между (∑xi2), в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и (∑xi)2, где индивидуальные значения сначала суммируются для получения общей суммы, а потом уже эта сумма возводится в квадрат.
Последовательность расчетов представлена в Табл. 7.4.
Часто встречающееся в этой и последующих таблицах обозначение SS - сокращение от "суммы квадратов" (sum of squares). Это сокращение чаще всего используется в переводных источниках (см., например: Гласе Дж., Стенли Дж., 1976).
SSфакт означает вариативность признака, обусловленную действием исследуемого фактора; SSобщ - общую вариативность признака; SSсл -вариативность, обусловленную неучтенными факторами, "случайную" или "остаточную" вариативность.
MS - "средний квадрат", или математическое ожидание суммы квадратов, усредненная величина соответствующих SS.
df - число степеней свободы, которое при рассмотрении непараметрических критериев мы обозначили греческой буквой V.
Таблица 7.4
Последовательность операций в однофакторном дисперсионном анализе для несвязанных выборок
Примечание (см.Приложение 1).
Вывод: Н0 отклоняется. Принимается H1. Различия в объеме воспроизведения слов между группами являются более выраженными, чем случайные различия внутри каждой группы (р<0,01). Итак, скорость предъявления слов влияет на объем их воспроизведения5.
Вернемся к графику на Рис. 7.2. Мы видим, что, скорее всего, значимость различий объясняется тем, что показатель воспроизведения при самой высокой скорости предъявления слов (условие 3) гораздо ниже соответствующих показателей при средней и низкой скорости.
5 Г.В. Суходольским (1972) предложена формула расчета дисперсионного отношения, которая позволяет получить более строгий результат: Fэмп = (n*MSфакт+MSсл)/MSсл
где n - среднее количество наблюдений в каждой градации.
В данном случае Fэмп =6,942 (p<О,01). Эта величина действительно ниже, чем в цитируемом примере. Однако для первого знакомства с дисперсионным анализом исследователям, обрабатывающим свои данные самостоятельно, в практических целях достаточно использовать приведенный алгоритм расчетов, используемый и в большинстве других руководств (Плохинский Н.А., 1960; Венецкий И.Г., Кильдишев Г.С., 1968; Ивантер Э.В., Коросов А.В.; 1992, Kurtz A.K., Mayo S.T, 1979 и др.).
Поможем написать любую работу на аналогичную тему