ANALYSIS OF ONE AND TWO INDEPENDENT SAMPLES USING STATA SOFTWARE: PARAMETRIC TESTS



Cite item

Full Text

Abstract

In this paper we present theoretical principles of the use of one- and two-samples Student’s t-tests. Practical examples are presented with detailed explanations of the use of formulas as well as with step-by-step algorithm on how to use STATA software for comparisons of means in one- and two independent samples with subsequent interpretation of the outputs.

Full Text

Предыдущие статьи практикума информировали о том, какими бывают эмпирические данные, как нужно представлять количественные и качественные данные, а также в общем о пакете прикладных статистических программ STATA. Начиная с этой статьи, мы будем говорить об аналитической статистике, то есть будем проверять статистические гипотезы. Если исследовательскую гипотезу мы формулируем на этапе планирования исследования, то статистическую - при обработке собранных данных. Статистическая гипотеза бывает альтернативная (Н1) и нулевая (Н0) [5]. Нулевая статистическая гипотеза предполагает, что две генеральные средние (р1 и р2), то есть средние арифметические для двух генеральных совокупностей, не отличаются друг от друга. Альтернативная гипотеза соответственно заключается в том, что генеральные средние различаются. Для того чтобы принять решение об отклонении нулевой статистической гипотезы, ориентируются на достигнутый уровень статистической значимости (р). Общепринятым, но не единственным критическим уровнем значимости, с которым сравнивают достигнутый уровень значимости, является 0,05. Это говорит о том, что исследователь допускает 5 % вероятность ошибки 1 типа, то есть нахождения различий там, где их на самом деле нет. Следовательно, если достигнутый уровень значимости меньше 0,05 (р < 0,05), то Н0 отклоняется, и наоборот, если достигнутый уровень значимости больше 0,05 (р > 0,05), то Н0 принимается. Статистические критерии можно разделить на односторонние/двусторонние и параметрические/непараметрические. Односторонние статистические критерии - это критерии, в которых альтернативная гипотеза определяет направление интересующего исследователя влияния вмешательства (р1 < р2 или р1 > р2), а двусторонние - когда направление не определено, а важно наличие различий между средними (р1 ф р2) [4]. В научно-исследовательской практике намного чаще используются двусторонние статистические критерии. В данной статье мы рассмотрим параметрические критерии, которые применяются в случае сравнения средних арифметических для одной или двух несвязанных групп. Параметрические критерии называются параметрическими, так как оперируют параметрами распределения - средней арифметической и стандартным отклонением. Однако эти параметры корректно описывают только нормальное (Гауссово) распределение, в связи с чем проверка условия на нормальность распределения является обязательной. Одновыборочный критерий Стьюдента применяется в случае, когда среднее арифметическое выборочной совокупности сравнивается со средним значением для некоторой генеральной совокупности или некоторой эталонной величиной. Представлены теоретические основы применения одновыборочного и двухвыборочного критериев Стьюдента, практические рекомендации для применения вышеуказанных критериев с использованием пакета прикладных статистических программ STATA. В работе использованы практические примеры расчетов с помощью формул, а также алгоритм действий для использования пакета STATA с последующей интерпретацией результатов. Ключевые слова: одновыборочный критерий Стьюдента, двухвыборочный критерий Стьюдента, параметрические критерии, средние арифметические 57 Практикум Экология человека 2014.03 Условия применения: количественный признак; нормальное распределение признака в генеральной совокупности, из которой отобрана выборка; независимость наблюдений. Алгоритм расчета одновыборочного критерия Стьюдента X - До t = ■ л/Й, где X - среднее значение; р0 - эталонная величина; s - стандартное отклонение; n - число наблюдений. Далее по таблице t-распределения с учетом количества степеней свободы (df = n - 1) сравнивается значение эмпирического уровня значимости с критическим значением. Рассмотрим пример. В одном из неблагоприятных районов города Л. у подростков изучали возраст инициации табакокурения (табл. 1). Можно ли утверждать, что в данном районе возраст начала употребления табака меньше, чем по городу в целом? Средний возраст начала табакокурения в городе Л. составил 14,0 лет. Таблица 1 Возраст начала табакокурения, годы № 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Возраст, х 14 13 13 16 16 10 15 12 14 13 13 16 15 17 13 10 15 1. Рассчитаем среднее арифметическое 2. Рассчитаем стандартное отклонение 3. р0 = 14,0 n = 17 4. Подставляем в формулу X -ІЛ о t = • Vn = -0,3624 (далее учитывается значение t-критерия без учета знака) 5. df = n - 1 = 16 6. По табл. 2 сравниваем значение эмпирическое с критическим (табличным) [3, 6] Таблица 2 Критические значения t-распределения df р-уровень 0,2 0,1 0,05 0,02 0,01 0,001 1 3,08 6,31 12,71 31,82 63,66 318,3 2 1,89 2,92 4,30 6,96 9,92 22,33 3 1,64 2,35 3,18 4,54 5,84 10,21 4 1,53 2,13 2,78 3,75 4,60 7,17 15 1,34 1,75 2,13 2,60 2,95 3,73 16 1,34 1,75 2,12 2,58 2,92 3,69 7. t „п5 = 2,12 t = 0,3624. Следовательно, кр при р = 0,05 ’ эмп ’ ’ принимается нулевая гипотеза (р > 0,05), так как t > t . Рассмотрим пример использования одновыборочного критерия Стьюдента в программе STATA [8, 9]. Возьмем тот же самый пример. В одном из неблагоприятных районов города Л. у подростков изучали возраст инициации табакокурения (переменная age) (рис. 1). Рис. 1. Окно STATA Data Editor для примера использования одновыборочного критерия Стьюдента Прежде чем приступить к расчету параметрического критерия, проверим условие нормального распределения количественного признака age с помощью статистического критерия Shapiro-Wilk (рис. 2). swilk аде shapiro-wilk w test for normal data vari аЫ е obs W V Z prob>z аде 17 О.93444 1.385 О. 649 0.25801 Рис. 2. Результаты проверки распределения переменной age Полученный уровень статистической значимости (р = 0,258) позволяет нам принять нулевую гипотезу, свидетельствующую о том, что количественный признак переменной age имеет нормальное распределение. Для применения одновыборочного критерия Стьюдента в STATA следует зайти в диалоговое окно One-sample mean-comparison test, которое открывается при помощи меню Statistics > Summaries, tables, and tests > Classical test of hypotheses > One-sample mean-comparison test (рис. 3). Появляется диалоговое окно под названием ttest-Mean-comparison test. Во вкладке Main в окошке Variable name выбирается изучаемая переменная age (возраст); в окошке Hypothesized mean вводим эталонную величину и нажимаем Ok (рис. 4). Результаты сравнения выборочной совокупности с эталонной величиной представлены на рис. 5. 58 Экология человека 2014.03 Практикум : Stata/SE 11.0-[Results] I Statistics'] User Window Help Summaries, tables, and tests Рис. 3. Алгоритм поиска одновыборочного критерия Стьюдента в программе STATA Linear models and related Binary outcomes Ordinal outcomes Categorical outcomes Count outcomes Exact statistics Endogenous covariates Sample-selection models Multilevel mbced-eftects models Generalized linear models Nonparametric analysis Time series Multivariate time series State-space models Longitudinal/panel data Рис. 4. Диалоговое окно One-sample mean-comparison test . ttest age = 14 one-sample t test Variable Obs Mean Std. Err. std. Dev. [95% Conf. Interval ] age 17 13.82353 .4868513 2.007339 12.79145 14.85561 mean = mean(age) Ho: mean = 14 Ha: mean < 14 Pr(T < t) = 0.3609 t = -0.3625 degrees of freedom = 16 Ha: mean ! = 14 Pr(|T| > |tI) = 0.7217 Ha: mean > 14 Pr(T > t) = 0.6391 Рис. 5. Результат сравнения возраста инициации табакокурения в одном из неблагоприятных районов города Л. со средним возрастом начала употребления табака в городе Л. (с помощью одновыборочного критерия Стьюдента) В таблице рис. 5 представлено количество наблюдений в группе (obs), среднее арифметическое (mean), ошибка среднего (std. err.), стандартное отклонение (std. dev.), 95 % доверительный интервал (95 % conf. interval). Под таблицей дается значение t-критерия (t = -0,3625), количество степеней свободы (df = 16), а также значения р-уровней для одностороннего статистического критерия и двустороннего. Значение уровня статистической значимости для двустороннего критерия составило 0,7217, что не позволяет отклонить нулевую гипотезу. Следовательно, возраст начала табакокурения в неблагоприятном районе города Л. не отличается от среднего возраста инициации употребления табака в городе Л. в целом. Двухвыборочный критерий Стьюдента (или критерий Стьюдента для несвязанных выборок, или непарный критерий Стьюдента) применяется тогда, когда необходимо сравнить средние величины в двух независимых группах [1, 2, 7]. Summary and descriptive statistics Tables Classical tests of hypotheses Nonparametric tests of hypotheses Distributional plots and tests Multivariate test of means, covariances, and normality One-sample mean-comparison test Mean-comparison test, paired data Two-sample mean-comparison test Two-group mean-comparison test One-sample mean-comparison calculator Two-sample mean-comparison calculator Binomial probability test Binomial probability test calculator One-sample proportion test Two-sample proportion test Two-group proportion test One-sample proportion calculator Two-sample proportion calculator One-sample variance-compsrison test Условия применения: количественный признак; две независимые группы; независимые наблюдения в каждой из групп; нормальное распределение изучаемого признака в генеральных совокупностях, из которых отобраны группы; равенство дисперсий изучаемого признака в генеральных совокупностях, из которых отобраны группы. Две независимые группы - это две разные группы, которые сравниваются по одному или нескольким признакам, причем одно и то же наблюдение не может быть отнесено к более чем одной группе; например, группа «мальчиков» и группа «девочек» сравниваются по массе тела при рождении или группа «поликлиника № 1» и группа «поликлиника № 2» сравниваются по количеству пациентов за неделю. Алгоритм расчета критерия Стьюдента для несвязанных групп t = -х2 5об где X - среднее значение признака в первой группе; Х2 - среднее значение признака во второй группе; 8об - объединенное стандартное отклонение; n-число наблюдений в первой группе; n2- число наблюдений во второй группе. где n - число наблюдений в первой группе; n2 -число наблюдений во второй группе; sj- стандартное отклонение признака в первой группе; s2 - стандартное отклонение признака во второй группе df=(nl - 1) + (n2 - 1), где df - количество степеней свободы; nl - число наблюдений в первой группе; n2 - число наблюдений во второй группе. Далее по таблице t-распределения с учетом количества степеней свободы сравниваем эмпирический и критический уровни значимости [3, 6]. Рассмотрим пример. Изучался возраст возникновения язвенной болезни (ЯБ) у мужчин и женщин (табл. 3). Можно ли утверждать, что у мужчин ЯБ диагностируется в более молодом возрасте, чем у женщин? 59 Практикум Экология человека 2014.03 Таблица 3 Возраст возникновения язвенной болезни, годы № 1 2 3 4 5 6 7 8 9 Женщины 23 28 19 30 27 25 20 35 Мужчины 21 25 25 19 32 19 28 27 27 1. Рассчитаем среднее арифметическое и стандартное отклонение для каждой группы X = 24,78; s = 4,38; п = 8 м ’ ’ м ’ ’ м X = 24,78; s = 4,38; п = 8 ж ’ ’ ж ’ ’ ж 2. Рассчитаем объединенное стандартное отклонение 3. Рассчитаем значение t-критерия и количество степеней свободы df = (8 - 1) + (9 - 1) = 15 4. По табл. 2 сравниваем значение эмпирическое с критическим (табличным) 5. t ... = 2,13 t = 0,463. Следовательно, кр при р = 0,05 ’ эмп ’ ’ принимается нулевая гипотеза (р > 0,05), так как t > t . кр эмп Рассмотрим пример использования критерия Стьюдента для несвязанных выборок в программе STATA [8, 9]. Возьмем тот же самый пример. Изучался возраст возникновения язвенной болезни (переменная age) у мужчин (значение переменной gender - male) и женщин (значение переменной gender - female) (рис. 6). Рис. 6. Окно STATA Data Editor для примера использования критерия Стьюдента для несвязанных выборок Прежде чем применять параметрический критерий Стьюдента для несвязанных выборок, нам необходимо проверить условия нормального распределения количественного признака (рис. 7) и равенства дисперсий (рис. 8). -> gender = male shapiro-wilk w test for normal data variable I obs w v z Prob>z age j 9 O.93117 1. Oil O. 019 O.49260 -> gender = female Shapiro-wilk w test for normal data variable 1 obs w v z prob>z age j 8 O.97188 0.392 -1.355 O.91233 Рис. 7. Результат проверки условия нормального распределения переменной возраст (age) для каждой группы отдельно (группы мужчин = male и группы женщин = female) Как в группе мужчин, так и в группе женщин переменная «возраст начала ЯБ» (age) распределена нормально (р = 0,493 и р = 0,912 соответственно). Условие равенства дисперсий можно проверить по следующему алгоритму Statistics > Summaries, tables, and tests > Classical tests of hypotheses > Two-group variance-comparison test. Результаты свидетельствуют о том, что данное условие соблюдается, так как уровень статистической значимости составил 0,6016, что больше 0,05 (рис. 8). Variance ratio test Group obs Mean std. Err. std. Dev. [95% conf. interval ] male 9 24.77778 1.460382 4.381146 21.41013 28.14543 female 8 25-875 1.875 5. 303301 21.44133 30. 30867 combi ned 17 25.29412 1.143282 4.713872 22.87047 27.71777 ratio = sd(male) / sd(female) f = 0.6S25 ho: ratio = 1 degrees of freedom = 8, 7 на: ratio < 1 на: ratio != 1 на: ratio > 1 Pr(f < f) = 0.3008 2*Pr(F < f) = 0.6016 Pr(f > f) = 0.6992 Рис. 8. Результат проверки условия равенства дисперсий Чтобы выбрать критерий Стьюдента для несвязанных выборок, необходимо зайти Statistics > Summaries, tables, and tests - Classical tests of hypotheses > Two-group mean-comparison test (см. рис. 3). Во вкладке Main в окошке Variable name выбирается изучаемая переменная age (возраст); в ttest - Two-group mean-comparison test - □ В Main j by/if/in 1 Variable name: Group variable name: |age 0| 1 gender |_vj| |ИЯ v J Confidence level □ Unequal variances 1 1 Welch's approximation ©ON d OK 1 1 Cancel 1 1 Submit Рис. 9. Диалоговое окно критерия Стьюдента для несвязанных выборок 60 Экология человека 2014.03 Практикум окошке Grouping variable name - группирующая переменная gender (пол) и Ok (рис. 9). В случае, когда дисперсии не равны, необходимо поставить галочку □ Unequal variances. Результаты сравнения групп представлены на рис. 10. Two-sample t test with equal variances Group Obs Mean std. Err. std. Dev. [95% corrf. interval ] mal e 9 24.77778 1.460382 4.381146 21.41013 28.14543 f emale 8 25.875 1.875 5.3033Q1 21.44133 30.30867 combined 17 25.29412 1.143282 4.713872 22.87047 27.71777 diff -1.097222 2.348624 -6.103197 3.908752 diff = mean(male) - mean(female) t = -0.4672 ho: diff = 0 degrees of freedom = 15 на: diff < О на: diff != О на: diff > 0 Pr(T < t) = 0.3235 Pr(|T| > |t|) = 0.6471 Pr(T > t) = 0.6765 Рис. 10. Результат сравнения возраста начала язвенной болезни (переменная age) у мужчин (переменная male) и женщин (переменная female) В таблице рис. 10 представлено количество наблюдений в каждой группе (obs), средние арифметические (mean), ошибки среднего (std. err.), стандартные отклонения (std. dev.), 95 % доверительные интервалы (95 % conf. interval). Под таблицей дается значение t-критерия (t = -0,4672), количество степеней свободы (df = 15), а также достигнутые уровни значимости для односторонней и двусторонней статистических гипотез. Значение достигнутого уровня статистической значимости для двустороннего критерия составило 0,647, что не позволяет отклонить нулевую гипотезу. Следовательно, можно сделать вывод о том, что возраст возникновения ЯБ у мужчин и женщин не различается. Представляя результаты применения критерия Стьюдента для несвязанных выборок, рекомендуется указывать значение t-критерия и абсолютную величину достигнутого уровня значимости (р). Пример такого представления в табл. 4. Таблица 4 Особенности возраста начала язвенной болезни у мужчин и женщин, М (SD) Признак Пол t р Мужчины Женщины Возраст начала язвенной болезни, годы 24,8 (4,38) 25,9 (5,30) -0,467 0,647 В следующем выпуске мы рассмотрим применение непараметрических критериев для сравнения одной и двух независимых выборок.
×

About the authors

O A Kharkova

A M Grjibovski

Email: angr@fhi.no

References

  1. Гланц С. Медико-биологическая статистика / пер. с англ. М.: Практика, 1998. 459 с.
  2. Гржибовский А.М. Анализ количественных данных для двух независимых групп // Экология человека. 2008. № 2. С. 54-61.
  3. Статистический анализ эмпирических исследований [Электронный ресурс]. URL: http://statexpert.org (дата обращения 06.01.2014).
  4. Статистический словарь. Качественная клиническая практика [Электронный ресурс]. URL: http://www.clinvest.ru/ (дата обращения 06.01.2014).
  5. Титкова Л.С. Математические методы в психологии. Владивосток: Изд-во Дальневосточного университета, 2002. 85 с.
  6. Электронный учебник по статистике StatSoft [Электронный ресурс]. URL: http://statsoft.ru/ (дата обращения 20.02.2014).
  7. Field A. Discovering statistics using SPSS. 2-nd edition. London: SAGE Publication, 2005. 781 p.
  8. Hamilton L.C. Statistics with STATA: Updated for Version 10. USA, 2009. 400 p.
  9. Stata: Release 12. Statistical Software. College Station, TX: StataCorp LP, 2011.

Supplementary files

Supplementary Files
Action
1. JATS XML

Copyright (c) 2014 Ekologiya cheloveka (Human Ecology)



СМИ зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор).
Регистрационный номер и дата принятия решения о регистрации СМИ: серия ПИ № ФС 77 - 78166 от 20.03.2020.


This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies