![]() |
|
|
Медико-биологическая статистикаот среднего, поэтому их разность еще больше отклоняется от среднего, чем они сами. Продолжим рассматривать рис. 4.3. Все пары извлекали из одной совокупности. Ее дисперсия равна 1. В таком случае дисперсия разностей будет 2 2 2 GХ-У — СУ ^ + СУу =1 + 1=2. Стандартное отклонение есть квадратный корень из дисперсии. Поэтому стандартное отклонение разностей равно V2, то есть больше стандартного отклонения исходной совокупности примерно на 40%, как и получилось в нашем примере. Чтобы оценить дисперсию разности членов двух совокупностей по выборочным данным, нужно в приведенной выше формуле заменить дисперсии их выборочными оценками: 2 _ 2 2 SX-Y = SX + SYЭтой формулой можно воспользоваться и для оценки стандартной ошибки разности выборочных средних. В самом деле, стандартная ошибка выборочного среднего — это стандартное отклонение совокупности средних значений всех выборок объемом п. Поэтому Тем самым, искомая стандартная ошибка разности средних ь мы можем вычислить отношение t. КРИТИЧЕСКОЕ ЗНАЧЕНИЕ t Напомним, что мы рассматриваем отношение Разность выборочных средних Стандартная ошибка разности выборочных средних Воспользовавшись результатом предыдущего раздела, имеем Если ошибку среднего выразить через выборочное стандартное отклонение, получим другую запись этой формулы: где п — объем выборки. Если обе выборки извлечены из одной совокупности, то выборочные дисперсии s\ и s\ — это оценки одной и той же дис-Персии а . Поэтому их можно заменить на объединенную оценку дисперсии. Для выборок равного объема объединенная оценка дисперсии вычисляется как 2 2 2 _ Sf +S2 Значение /, полученное на основе объединенной оценки: X \ — Хt = 2 2 S S + п п Если объем выборок одинаков, оба способа вычисления / дадут одинаковый результат. Однако если объем выборок разный, то это не так. Вскоре мы увидим, почему важно вычислять объединенную оценку дисперсии, а пока посмотрим, какие значения / мы будем получать, извлекая случайные пары выборок из одной и той же нормально распределенной совокупности. Так как выборочные средние обычно близки к среднему по совокупности, значение / будет близко к нулю. Однако иногда мы все же будем получать большие по абсолютной величине значения / (вспомним опыты с F в предыдущей главе). Чтобы понять, какую величину / следует считать достаточно «большой», чтобы отвергнуть нулевую гипотезу, проведем мысленный эксперимент, подобный тому, что мы делали в предыдущей главе. Вернемся к испытаниям предполагаемого диуретика. Допустим, что в действительности препарат не оказывает диуретического действия. Тогда и контрольную группу, которая получает плацебо, и экспериментальную, которая получает препарат, можно считать случайными выборками из одной совокупности. Пусть это будет совокупность из 200 человек, представленная на рис. 4.4А. Члены контрольной и экспериментальной групп различаются штриховкой. В нижней части рисунка данные по этим двум выборкам показаны так, как их видит исследователь. Взглянув на эти данные, трудно подумать, что препарат — диуретик. Полученное по этим выборкам значение / равно -0,2. Разумеется, с не меньшим успехом можно было бы извлечь любую другую пару выборок, что и сделано на рис. 4.4Б. Как и следовало ожидать, две новые выборки отличаются как друг от друга, так и от извлеченных ранее (рис. 4.4А). Интересно, что на этот раз нам «повезло» — средний диурез довольно сильно различается. Соответствующее значение t равно -2,1. На рис. 4.4В изображена еще одна пара выборок. Они отличаются друг от друга и от выборок с рис. 4.4А и 4.4Б. Значение г для них равно 0. Разных пар выборок можно извлечь более 1027. На рис. 4.5А приведено распределение значений /, вычисленных по 200 парам выборок. По нему уже можно судить о распределении /. Оно симметрично относительно нуля, поскольку любую из пары выборок можно счесть «первой». Как мы и предполагали, чаще всего значения t близки к нулю; значения, меньшие -2 и большие +2, встречаются редко. На рис. 4.5Б видно, что в 10 случаях из 200 (в 5% всех случаев) / меньше -2,1 или больше+2,1. Иначе говоря, если обе выборки извлечены из одной совокупности, вероятность того, что значение Суточный диурез, мл Рис. 4.4. Испытания предполагаемого диуретика. А. В действительности препарат не обладает диуретическим действием, поэтому обе группы — просто две случайные выборки из совокупности, показанной в верхней части рисунка. Члены совокупности, которым посчастливилось принять участие в исследовании, помечены штриховкой. В нижней части рисунка данные показаны такими, какими их видит исследователь. Вряд ли он решит, что препарат — диуретик: средний диурез в группах различается очень незначительно. Б. Исследователю могла бы попасться и такая пара выборок. В этом случае он наверняка счел бы препарат диуретиком. В. Еще две выборки из той же совокупности. t лежит вне интервала от -2,1 до +2,1, составляет 5%. Продолжая извлекать пары выборок, мы увидим, что распределение принимает форму гладкой кривой, показанной на рис. 4.5В. Теперь 5% крайних значений соответствуют закрашенным областям графика левее -2,1 и правее +2,1. Итак, мы нашли, что если две выборки извлечены из одной и той же совокупности, то вероятность получить значение /, большее +2,1 или меньшее -2,1, составляет всего 5%. Следовательно, если значение t находится вне Рис. 4.5. А. Из совокупности, показанной на рис. 4.4, извлекли 200 пар случайных выборок по 10 членов в каждой, для каждой пары рассчитали значение t и нанесли его на график. Значения t для трех пар выборок с рис. 4.4 помечены черным. Большая часть значений сгруппирована вокруг нуля, однако некоторые значения по абсолютной величине превышают 1,5 и даже 2. Б. Число значений, по абсолютной величине превышающих 2,1, составляет 5%. В. Продолжая извлекать пары выборок, в конце концов мы получим гладкую кривую. 5% наибольших (по абсолютной величине) значений образуют две заштрихованные области (сумма заштрихованных площадей как раз и составляет 5% всей площади под кривой). Следовательно, «большие» значения t начинаются там, где начинается заштрихованная область, то есть с t = ±2,1. Вероятность получить столь высокое значение t, извлекая случайные выборки из одной совокупности, не превышает 5%. Г. Описанный способ выбора критического значения t предопределяет возможность ошибки: в 5% случаев мы будем находить различия там, где их нет. Чтобы снизить вероятность ошибочного заключения, мы можем выбрать более высокое критическое значение. Например, чтобы площадь заштрихованной области составляла 1% от общей площади под кривой, критическое значение должно составлять 2,878. интервала от -2,1 до +2,1, нулевую гипотезу следует отклонить, а наблюдаемые различия признать статистически значимыми. Обратите внимание, что таким образом мы выявляем отличия экспериментальной группы от контрольной как в меньшую, так и в большую сторону — именно поэтому мы отвергаем нулевую гипотезу как при / < -2,1, так и при / > +2,1. Этот вариант критерия Стьюдента называется двусторонним; именно его обычно и используют. Существует и односторонний вариант критерия Стьюдента. Используется он гораздо реже, и в дальнейшем, говоря о критерии Стьюдента, мы будем иметь в виду двусторонний вариант. Вернемся к рис. 4.4Б. На нем показаны две случайные выборки из одной и той же совокупности, при этом t = -2,2. Как мы только что выяснили, нам следует отвергнуть нулевую гипотезу и признать исследуемый препарат диуретиком, что, самой собой, неверно. Хотя все расчеты были выполнены правильно, вывод ошибочен. Увы, такие случаи возможны. Разберемся подробнее. Если значение / меньше -2,1 или больше +2,1, то при уровне значимости 0,05 мы сочтем различия статистически значимыми. Это означает, что если бы наши группы представляли собой две случайные выборки из одной и той же совокупности, то вероятность получить наблюдаемые различия (или более сильные) равна 0,05. Следовательно, ошибочный вывод о существовании различий мы будем делать в 5% случаев. Один из таких случаев и показан на рис. 4.4Б. Чтобы застраховаться от подобных ошибок, можно принять уровень значимости не 0,05, а, скажем, 0,01. Тогда, как видно из рис. 4.5Г, мы должны отвергать нулевую гипотезу при t < -2,88 или t > +2,88. Теперь-то рис. 4.4Б нас не проведет — мы не признаем подобные различия статистически значимыми. Однако, во-первых, ошибочные выводы о существовании различий все же не исключены, просто их вероятность снизилась до 1%, и, во-вторых, вероятность не найти различий там, где они есть, теперь повысилась. О последней проблеме подробнее мы поговорим в гл. 6. Критические значения t (подобно критическим значениям F, они сведены в таблицу) зависят не только от уровня значимости, но и от числа степеней свободы v. Если объем обеих выбоСРАВНЕНИЕ ДВУХ ГРУПП: КРИТЕРИЙ СТЬЮДЕНТА 95 Таблица 4.1. Окончание Уровень значимости J. Н. Zar. Biostatistical analysis (2 ed.). Prentice-Hall, Englewood Cliffs, N. J., 1984. рок — n, то число степеней свободы для критерия Стьюдента равно 2 (п -1). Чем больше объем выборок, тем меньше критическое значение t. Это и понятно — чем больше выборка, тем менее выборочные оценки зависят от случайных отклонений и тем точнее представляют исходную совокупность. ВЫБОРКИ ПРОИЗВОЛЬНОГО ОБЪЕМА Критерий Стьюдента легко обобщается на случай, когда выборки содержат неодинаковое число членов. Напомним, что по определению Х] - Х2 t = /4.+ 4, где s% и — стандартные ошибки средних для двух выборок. Если объем первой выборки равен щ, а объем второй — п2, то Л „2 2 s\ 2 s2 SY = И4 = ' А| «1 Хг П2 где s] и s2 — стандартные отклонения выборок. Перепишем определение t, используя выборочные стандартные отклонения: Объединенная оценка дисперсии для выборок объема и, и п2 равна ^2 =(rh-\)S2 +(«2-1)522 П\ + п2 - 2 я, «2 Тогда _ X, - Х2 Это определение / для выборок произвольного объема. Число степеней свободы v = «, +п2 -2. Заметим, что если объемы выбор |
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 |
Скачать книгу "Медико-биологическая статистика" (7.41Mb) |
[каталог] [статьи] [доска объявлений] [обратная связь] |