5.3. Практикум. Доверительный интервал

Расчет доверительного интервала в SPSS

Пример 5.3(1). Рассмотрим простой пример, демонстрирующий, как можно рассчитать доверительный интервал для среднего в SPSS. В файле HeightTomsk.sav содержатся модельные данные измерения роста у 100 жителей города Томск, измеренного в сантиметрах (см. пример в подпараграфе 5.1.1). Рассчитать точечную оценку среднего, доверительный интервал и значимости относительно данной гипотезы в SPSS можно, используя T-критерий для одной выборки. Для расчета нужно вызвать диалоговое окно — Анализ — Сравнение средних — Одновыборочный t-критерий (Analyze — Compare MeansOneSample Ttest), перенесем интересующую нас переменную в окно «Проверяемые переменные» (Test Variable(s)). Результаты такого анализа приведены в таблицах 5.3(2). и 5.3(3).

 

Таблица 5.3(2). Статистики для одновыборочного t-критерия

Статистики для одновыборочного t-критерия
N Среднее Стд. отклонение Стд. ошибка среднего
height 100 177.0050 4.00157 0.40016

 

Таблица 5.3(3). Одновыборочный t-критерий (сравнение с 0)

Одновыборочный t-критерий
Проверяемое значение = 0
t ст. св. Зн. (2-сторонняя) Разность средних 95% доверительный интервал разности средних
Нижняя граница Верхняя граница
height 442 99 0.00 177.005 176.2 177.799

 

В первой из них мы находим среднее значение роста, стандартное отклонение и стандартную ошибку, во второй — доверительный интервал для среднего (по умолчанию 95-процентный, но можно заменить его «номинал» на любой другой во вкладке Параметры (Options).

В столбце Значимость (Sig) мы находим в этой таблице значимость результата по отношению к гипотезе «средний рост равен нулю» — еще раз откройте вкладку и найдите поле с маркировкой Проверяемое значение (Test Value). Если мы хотим узнать значимость другой гипотезы, нуль надо заменить. Поставим в поле число 178, соответствующее обсуждавшейся в подпараграфе 5.1.3 гипотезе о среднем росте в популяции. В таблице 5.3(4) показана значимость нашей гипотезы, несколько отличная от рассчитанной в подпараграфе 5.1.3. В таблице результат более точный, поскольку использовалось распределение Стьюдента, а не нормальное, как делали мы в указанном подпврвграфе.

К сожалению, доверительный интервал также поменял свое представление (но не существо). Столбцы подписаны Доверительный интервал разности средних (Confidence Interval of the Difference), если мы прибавим к 178 обозначенные в качестве нижней границы — 1.79, мы и получим 176.21 таблицы 5.3(3). Аналогично для верхней границы.

Таким образом, таблица 5.3(2) лучше представляет доверительный интервал среднего значения переменной, а таблица 5.3(3) — значимость и саму t-статистику. Можно выводить обе таблицы или пересчитывать доверительный интервал используя результаты таблицы 5.3(4).

Таблица 5.3(4). Одновыборочный t-критерий (сравнение с 178)

Одновыборочный t-критерий
Проверяемое значение = 178
T ст.св. Значимость (2-сторонняя) Разность средних 95% доверительный интервал разности средних
Нижняя граница Верхняя граница
height -2.48 99 .015 -.995 -1.7890 -.2010

 

Упражнение 5.3(5). Предположите, как изменится доверительный интервал при увеличении степени доверия до 99% и при уменьшении до 90%. В каком случае интервал будет более узким, а в каком — широким? Проведите расчеты и проверьте свои соображения.

Пример 5.3(6). В подпараграфе 5.1.3 обсуждался смысл доверительного интервала при сравнении выборочного среднего с каким-либо теоретическим значением. Допустим, что мы хотим проверить предположение, что интеллект поступивших на психологический факультет первокурсников отличается от среднего по стране [1]. Для этого мы измерили с помощью стандартного теста IQ интеллект 30 случайно выбранных студентов.

Упражнение 5.3(7). Модельные данные содержатся в файле IqPsy.sav. Известно, что средний балл IQ в генеральной совокупности составляет 100 баллов.

Проведите расчет одновыборочного t-критерия. Найдите значимость результата относительно гипотезы о том, что средний балл IQ у психологов равен 100 баллам. Постройте 95-процентный доверительный интервал. Сравните его с 99-процентным и 90-процентным доверительными интервалами, внеся изменения во вкладке Параметры (Options).

Пример 5.3(8). Пусть результат, полученный в примере 5.3(7) не убедил нас, как исследователей. Для более точной оценки мы проводим опрос большей выборки, всех поступивших на первый курс, и получаем данные о 150 респондентам. И, допустим, что среднее и стандартное отклонение в расширенной выборке оказались почти такими же, как в маленькой. Предположите, что происходит с доверительным интервалом. Будет ли меняться соответствующий уровень значимости, и если да, то как?

Упражнение 5.3(9). В файле IqPsy150.sav содержатся такие результаты. Проведите анализ, аналогичный описанному в примере 5.3(7), и сделайте вывод, какую гипотезу можно принять при наличии таких данных.

Значимость по новой выборке равна 0.011. Войдет ли 100 в 99-процентный доверительный интервал? Как будет меняться значимость при увеличении уровня доверия для интервала до 99%?

Пример 5.3(10). Средний балл ЕГЭ по математике в 2016 году составил 4.14 балла по пятибалльной системе (https://4ege.ru/materials_podgotovka/52846-itogi-ege-2016.html).

Упражнение 5.3(11). В файле egeMath.sav содержатся модельные данные результатов такого экзамена для 1000 учеников из 10 разных школ по 100 человек в каждой. Первая переменная Math содержит оценки, а вторая, School — условный код школы, от 1 до 10. Используя функцию разбиения файла по переменной (см. пример 2.3(5)), рассчитайте 95%-й доверительный интервал средней оценки для каждой из школ. Ориентируясь на него, оцените, есть ли случаи и в каких из школ, когда в доверительный интервал среднего балла по школе не попадает известное нам популяционное среднее. Проинтерпретируйте результат.

Прочитайте (или перечитайте) подпараграф 5.2.3. Еще раз проинтерпретируйте результат, учитывая точный смысл доверительного интервала для среднего.

Отменив разбиение по школам, рассчитайте доверительный интервал среднего по всей выборке в 1000 человек. Насколько он соответствует данным по популяции? Отследите, как меняются стандартное отклонение и стандартная ошибка среднего в маленьких и объединенной выборках?

[свернуть]
Расчет доверительного интервала в Jamovi

Пример 5.3(1)j. Рассмотрим простой пример, демонстрирующий, как можно рассчитать доверительный интервал для среднего в Jamovi. В файле HeightTomsk.sav содержатся модельные данные измерения роста у 100 жителей города Томск, измеренного в сантиметрах (см. пример в подпараграфе 5.1.1). Рассчитать точечную оценку среднего, доверительный интервал и значимости относительно данной гипотезы в Jamovi можно, используя T-критерий для одной выборки. Для расчета нужно вызвать диалоговое окно — АnalysesTtests— OneSample T-test, перенесем интересующую нас переменную в окно Dependent Variables. В панели настроек надо выбрать (поставить галочки) Students, Mean difference, Confedence interval, Descriptives. Результаты такого анализа приведены в таблицах 5.3(2).

Таблица 5.3(2)j. Статистики для одновыборочного t-критерия

One Sample T-Test
95% Confidence Interval
    Statistic df p Mean difference Lower Upper
height Student’s t 442 99.0 < .001 177 176 178

 

Descriptives
  N Mean Median SD SE
height 100 177 177 4.00 0.400

 

В первой таблице мы находим доверительный интервал для среднего (по умолчанию 95-процентный, но можно заменить его «номинал» на любой другой в панели настроек, во второй — среднее значение роста, медиану, стандартное отклонение и стандартную ошибку.

В столбце p мы находим в этой таблице значимость результата по отношению к гипотезе «средний рост равен нулю» — еще раз взгляните на панель настроек и найдите поле с маркировкой Test Value. Если мы хотим узнать значимость другой гипотезы, нуль надо заменить. Поставим в поле число 178, соответствующее обсуждавшейся в подпараграфе 5.1.3. гипотезе о среднем росте в популяции. В таблице 5.3(3)j показана значимость нашей гипотезы, несколько отличная от рассчитанной в подпараграфе 5.1.3.. В таблице результат более точный, поскольку использовалось распределение Стьюдента, а не нормальное, как делали мы в указанном подпараграфе.

Таблица 5.3(3)j. Одновыборочный t-критерий (сравнение с 178)

One Sample T-Test
95% Confidence Interval
    Statistic df p Mean difference Lower Upper
height Student’s t -2.49 99 0.015 -0.995 -1.79 -0.201
Note. Hₐ population mean ≠ 178

К сожалению, доверительный интервал также поменял свое представление (но не существо). Столбцы подписаны Confidence Interval of the Difference, если мы прибавим к 178 обозначенные в качестве нижней границы — 1.79, мы и получим 176.21, округленные до 176 в таблице 5.3(2)j. Аналогично для верхней границы.

Таким образом, таблица 5.3(2) лучше представляет доверительный интервал среднего значения переменной, а таблица 5.3(3)j — значимость и саму t-статистику. Можно выводить обе таблицы или пересчитывать доверительный интервал используя результаты таблицы 5.3(3)j.

 Упражнение 5.3(5)j. Предположите, как изменится доверительный интервал при увеличении степени доверия до 99% и при уменьшении до 90%. В каком случае интервал будет более узким, а в каком — широким? Проведите расчеты и проверьте свои соображения.

Пример 5.3(6)j. В подпараграфе 5.1.3 обсуждался смысл доверительного интервала при сравнении выборочного среднего с каким-либо теоретическим значением. Допустим, что мы хотим проверить предположение, что интеллект поступивших на психологический факультет первокурсников отличается от среднего по стране[1]. Для этого мы измерили с помощью стандартного теста IQ интеллект 30 случайно выбранных студентов.

Упражнение 5.3(7)j. Модельные данные содержатся в файле IqPsy.sav. Известно, что средний балл IQ в генеральной совокупности составляет 100 баллов.

Проведите расчет одновыборочного t-критерия. Найдите значимость результата относительно гипотезы о том, что средний балл IQ у психологов равен 100 баллам. Постройте 95-процентный доверительный интервал. Сравните его с 99-процентным и 90-процентным доверительными интервалами, внеся изменения в панели параметров вкладке.

Пример 5.3(8)j. Пусть результат, полученный в примере 5.3(7)j не убедил нас, как исследователей. Для более точной оценки мы проводим опрос большей выборки, всех поступивших на первый курс, и получаем данные о 150 респондентам. И, допустим, что среднее и стандартное отклонение в расширенной выборке оказались почти такими же, как в маленькой. Предположите, что происходит с доверительным интервалом. Будет ли меняться соответствующий уровень значимости, и если да, то как?

Упражнение 5.3(9)j. В файле  IqPsy150.sav содержатся такие результаты. Проведите анализ, аналогичный описанному в примере 5.3(7)j, и сделайте вывод, какую гипотезу можно принять при наличии таких данных.

Значимость по новой выборке равна 0.011. Войдет ли 100 в 99-процентный доверительный интервал? Как будет меняться значимость при увеличении уровня доверия для интервала до 99%?

[свернуть]
Расчет доверительного интервала в R

Пример 5.3(1)r. Рассмотрим простой пример, демонстрирующий, как можно рассчитать доверительный интервал для среднего в R. В файле HeightTomsk.sav  в переменной height содержатся модельные данные измерения роста у 100 жителей города Томск, измеренного в сантиметрах (см. пример в подпараграфе 5.1.1). Рассчитать точечную оценку среднего, доверительный интервал и значимости относительно данной гипотезы можно, используя T-критерий для одной выборки. В R для этого используется функция t.test. Если загрузить данные в таблицу data_height и вызвать функцию t.test, указав единственный обязательный аргумент x – переменную height:

library(foreign)
data_height <- read.spss("HeightTomsk.sav", to.data.frame = T, reencode = "utf8")
t.test(x = data_height$height)

то мы получим следующий результат:

One Sample t-test
data:  data_height$height
t = 442.34, df = 99, p-value < 2.2e-16
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
 176.211 177.799
sample estimates:
mean of x
  177.005

Начнём рассматривать вывод с конца. В последней строке рассчитана точечная оценка среднего анализируемой переменной (mean of x), выше – 95-процентный доверительный интервал для среднего – [176.211 177.799]. При желании установленный по умолчанию 95% уровень доверия можно изменить с помощью аргумента conf.level, присвоив ему требуемый уровень доверия как долю (например, conf.level = .99 для 99% доверительного интервала).

Выше, в первой строке указана статистика одновыборочного t-критерия с соответствующими степенями свободы (df – degree of freedom) и значимость (p-value) результата по отношению к гипотезе «средний рост равен нулю». Она в данном случае очень близка к нулю: математическая запись 2.2e-16 означает, что число 2.2 надо умножить на 10-16 степени, что даёт 0.000000000000000022. Если мы хотим узнать значимость другой гипотезы, то в функции t.test надо указать, с каким значением мы сравниваем анализируемую переменную, используя дополнительный аргумент mu. Приравняем его к числу 178, соответствующее обсуждавшейся в подпараграфе 5.1.3 гипотезе о среднем росте в популяции:

t.test(x = data_height$height, mu = 178)

Упражнение 5.3(2)r. Прежде, чем посмотреть результат, возвратитесь к полученному ранее результату и решите, можно ли сказать, что выборочное среднее на уровне p<0.05 отличается от значения 178?

Наведите курсор, чтобы посмотреть ответ

Упражнение 5.3(3)r. Какова будет верхняя граница доверительного интервала, если уровень доверия будет установлен на значении 1-0.01457=0.98543?

Наведите курсор, чтобы посмотреть ответ

Упражнение 5.3(4)rПредположите, как изменится доверительный интервал при увеличении степени доверия до 99% и при уменьшении до 90%. В каком случае интервал будет более узким, а в каком — широким? Проведите расчеты и проверьте свои соображения.

Пример 5.3(5)r. В подпараграфе 5.1.3 обсуждался смысл доверительного интервала при сравнении выборочного среднего с каким-либо теоретическим значением. Допустим, что мы хотим проверить предположение, что интеллект поступивших на психологический факультет первокурсников отличается от среднего по стране[1]. Для этого мы измерили с помощью стандартного теста IQ интеллект 30 случайно выбранных студентов.

Упражнение 5.3(6)r. Модельные данные содержатся в файле IqPsy.sav. Известно, что средний балл IQ в генеральной совокупности составляет 100 баллов.

Проведите расчет одновыборочного t-критерия. Найдите значимость результата относительно гипотезы о том, что средний балл IQ у психологов равен 100 баллам. Постройте 95-процентный доверительный интервал. Сравните его с 99-процентным и 90-процентным доверительными интервалами, используя аргумент conf.level.

Пример 5.3(7)r. Пусть результат, полученный в упражнении 5.3(6)r не убедил нас, как исследователей. Для более точной оценки мы проводим опрос большей выборки, всех поступивших на первый курс, и получаем данные о 150 респондентам. И, допустим, что среднее и стандартное отклонение в расширенной выборке оказались почти такими же, как в маленькой. Предположите, что происходит с доверительным интервалом. Будет ли меняться соответствующий уровень значимости, и если да, то как?

Упражнение 5.3(8)r. В файле IqPsy150.sav содержатся такие результаты. Проведите анализ, аналогичный описанному в упражнении 5.3(6)r, и сделайте вывод, какую гипотезу можно принять при наличии таких данных.

Значимость по новой выборке равна 0.011. Войдет ли 100 в 99-процентный доверительный интервал? Как будет меняться значимость при увеличении уровня доверия для интервала до 99%?

Пример 5.3(9)r[2]. Средний балл ЕГЭ по математике в 2016 году составил 4.14 балла по пятибалльной системе (https://4ege.ru/materials_podgotovka/52846-itogi-ege-2016.html). В файле egeMath.sav содержатся модельные данные результатов такого экзамена для 1000 учеников из 10 разных школ по 100 человек в каждой. Первая переменная Math содержит оценки, а вторая, School — условный код школы, от 1 до 10. Допустим, мы хотим проанализировать результаты ЕГЭ для каждой школы, оценив средний балл и доверительный интервал. Это в R можно реализовать несколькими способами. Можно последовательно отбирать каждую школу и анализировать её отдельно, например, для оценки среднего балла для первой школы можно отбирать оценки, относящиеся только к этой школе с помощью выражения data_egeMath$Math[data_egeMath$School == 1]и использовать этот набор данных в функции t.test, добавив аргумент mu = 4.14, чтобы сравнить, отличается ли результаты в данной школе от полученного по всей стране:

res_school1 <- data_egeMath$Math[data_egeMath$School == 1]
t.test(res_school1, mu = 4.14)

В результаты мы получи следующий результат:

One Sample t-test
data:  res_school1
t = 0.49457, df = 99, p-value = 0.622
alternative hypothesis: true mean is not equal to 4.14
95 percent confidence interval:
4.019518 4.340482
sample estimates:
mean of x
4.18

Как видно, средняя оценка в школе 1 равна 4.18, доверительный интервал [4.019518 4.340482] включает в себя 4.14, поэтому читателя недолжно удивлять, что и значимость результата p=0.622 далека от нуля и в силу этого мы не имеем оснований говорить о том, что отклонение от общего среднего по стране носит неслучайный характер. Аналогично можно отбирать данные для всех остальных школ и анализировать их отдельно.

Другой, более автоматизированный вариант – это использование функции split, разбивающей таблицу данных на части по заданной переменной. Первым аргументом функции должна быть указан объект разбиения (в нашем случае переменная Math), а вторым – вектор, содержащий маркеры групп (в нашем случае – переменная School). Соответственно, если выполнить команду

data_EgeMath_split <- split(data_egeMath$Math, data_egeMath$School)

то в результате будет создан список, состоящий из 10 векторов оценок, отдельных для каждой школы. Далее, чтобы провести анализ средних с помощью одновыборочного t-критерия, можно использовать функцию lapply, которая применяет заданную функцию ко всем элементам списка. Синтаксис этой функции таков: первый аргумент – это анализируемый список (в нашем случае – data_EgeMath_split), второй аргумент – функция. Например, команда lapply(data_EgeMath_split, mean)позволит рассчитать среднее для каждой школы (результат будет представлять собой список из 10 элементов – средних). Аналогично можно рассчитать t-критерий, однако если мы хотим задать дополнительные параметры для анализа (изменить уровень доверия для интервала или сравнить среднее с произвольной константой, дополнительные аргументы для функции t-test надо давать после указания на неё через запятую. Для сравнения среднего балла в каждой школе с 4.14 надо использовать следующую конструкцию:

lapply(data_EgeMath_split, t.test, mu = 4.14)

В результате будут выведены расчет по каждой из школ:

$`1`
One Sample t-test
data:  X[[i]]
t = 0.49457, df = 99, p-value = 0.622
alternative hypothesis: true mean is not equal to 4.14
95 percent confidence interval:
4.019518 4.340482
sample estimates:
mean of x
4.18

$`2`
One Sample t-test
data:  X[[i]]
t = -1.7969, df = 99, p-value = 0.07541
alternative hypothesis: true mean is not equal to 4.14
95 percent confidence interval:
3.82436 4.15564
sample estimates:
mean of x
3.99

$`3`
One Sample t-test
data:  X[[i]]
t = -0.56262, df = 99, p-value = 0.575
alternative hypothesis: true mean is not equal to 4.14
95 percent confidence interval:
3.913661 4.266339
sample estimates:
mean of x
4.09

и т. д.

Эти два варианта не исчерпывают возможные способы анализа подвыборок, но мы ограничиваемся ими как базовыми[3].

Упражнение 5.3.10r. Любым из двух описанных способов рассчитайте средние и доверительные интервалы для всех десяти школ и, ориентируясь на них, оцените, есть ли случаи и в каких из школ, когда в доверительный интервал среднего балла по школе не попадает известное нам популяционное среднее. Проинтерпретируйте результат.

Прочитайте (или перечитайте) подпараграф 5.2.3. Еще раз проинтерпретируйте результат, учитывая точный смысл доверительного интервала для среднего.

Используя исходные данные без разбиения, рассчитайте доверительный интервал среднего по всей выборке в 1000 человек. Насколько он соответствует данным по популяции? Отследите, как меняются стандартное отклонение и стандартная ошибка среднего в маленьких и объединенной выборках?

[свернуть]

[1] Логично предположить, что он выше среднего, но мы в данном случае специально формулируем неопределенную гипотезу (они называются ненаправленными), то есть допускаем оба варианта, что IQ поступивших может быть и выше, и ниже популяционного среднего.
[2] Скрипт с командами этого примера можно скачать здесь.

[3] Заметим дополнительно, что ещё одним удобным способом такого разбиения является использование специального оператора %>% (он называется pipe) из библиотеки dplyr, но это требует отдельного изучения специального подхода к организации анализа и соответствующего синтаксиса, см., например, https://dplyr.tidyverse.org/articles/dplyr.html. Приведем возможный вариант расчета этим способом:

library(dplyr)

res <- data_egeMath %>%
group_by(School) %>%
summarise(res = list(t.test(Math)))

res$res

 

>> следующий параграф>>

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.