![]() |
|
|
Медико-биологическая статистикайную выборку из 10 особей. В выборку попало 5 зеленых и 5 розовых марсиан, на рисунке они помечены черным. Б. В таком виде данные предстанут перед исследователем, который не может наблюдать всю совокупность и вынужден судить о ней по выборке. Оценка доли розовых марсиан р = 5 /10 = 0,5. Предположим, что из всех 200 марсиан случайным образом выбрали 10. Распределение розовых и зеленых марсиан во всей совокупности, неизвестное исследователям, изображено в верхней части рис. 5.4. Закрашенные кружки соответствуют марсианам, попавшим в выборку. В нижней части рис. 5.4 показана информация, которой располагал бы исследователь, получивший такую выборку. Как видим, в выборке розовые и зеленые марсиане поделились поровну. Основываясь на этих данных, мы решили бы, что розовых марсиан столько же, сколько и зеленых, то есть их доля составляет 50%. Исследователь мог бы извлечь другую выборку, например одну из представленных на рис. 5.5. Здесь выборочные доли розовых марсиан равны 30, 30, 10 и 20%. Как любая выборочная оценка, оценка доли (обозначим ее р) отражает долю р в совокупности, но отклоняется от нее в силу случайности. РассмотРозовые Зеленые Рис. 5.5. Еще 4 случайные выборки из той же совокупности марсиан. Оценки доли розовых марсиан: 30, 30, 10 и 20%. рим теперь не совокупность марсиан, а совокупность всех значений р, вычисленных по выборкам объемом 10 каждая. (Из совокупности в 200 членов можно получить более 1016 таких выборок.) На рис. 5.6 приведены пять значений р, вычисленных по пяти выборкам с рис. 5.4 и 5.5, и еще 20 значений, полученных на других случайных выборках того же объема. Среднее этих 25 значений составляет 30%. Это близко к истинной доле розовых марсиан — 25%. По аналогии со стандартной ошибкой среднего найдем стандартную ошибку доли. Для этого нужно охарактеризовать разброс выборочных оценок доли, то есть рассчитать ООО ООО оооо о о о о о о е о о о • о i—i—i i—i i—i—i—i—i—i 0 0 2 04 06 08 10 р Рис. 5.6. Нанесем на график оценки доли розовых марсиан, полученные по выборке с рис. 5.4 и четырем выборкам с рис. 5.5. Добавим к ним еще 20 выборочных оценок. Получилось распределение выборочных оценок р. Стандартное отклонение совокупности средних — это стандартная ошибка доли. стандартное отклонение совокупности р. В данном случае оно равно примерно 14%; в общем случае где Gр — стандартная ошибка доли, о — стандартное отклонение, п — объем выборки. Поскольку а = ^р(1-р), то GP =л • V п Заменив в приведенной формуле истинное значение доли ее оценкой р, получим оценку стандартной ошибки доли: V п Из центральной предельной теоремы (см. гл. 2) вытекает, что при достаточно большом объеме выборки выборочная оценка р приближенно подчиняется нормальному распределению, имеющему среднее р и стандартное отклонение о^. Однако при значениях р, близких к 0 или 1, и при малом объеме выборки это не так. При какой численности выборки можно пользоваться приведенным способом оценки? Математическая статистика утверждает, что нормальное распределение служит хорошим приближением, если и прип(1 -р) превосходят 5*. Напомним, что примерно 95% всех членов нормально распределенной совокупности находятся в пределах двух стандартных отклонений от среднего. Поэтому если перечисленные условия соблюдены, то с вероятностью 95% можно утверждать, что истинное значение р лежит в пределах 2sр от р. Вернемся на минуту к сравнению операционной летальности при галотановой и морфиновой анестезии. Напомним, что при использовании галотана летальность составила 13,1% (численность группы — 61 больной), а при использовании морфина — 14,9% (численность группы — 67 больных). для группы морфина Стандартная ошибка доли для группы галотана Если учесть, что различие в летальности составило лишь 2%, то маловероятно, чтобы оно было обусловлено чем-нибудь, кроме случайного характера выборки. Прежде чем двигаться дальше, перечислим те предпосылки, на которых основан излагаемый подход. Мы изучаем то, что в статистике принято называть независимыми испытаниями Бер-нулли. Эти испытания обладают следующими свойствами. • Каждое отдельное испытание имеет ровно два возможных взаимно исключающих исхода. • Вероятность данного исхода одна и та же в любом испытании. • Все испытания независимы друг от друга. * Если объем выборки недостаточен для использования нормального распределения, можно прибегнуть к помощи биномиального распределения. О биномиальном распределении см. J. Н. Zar. Biostatis-tical analysis, 2nd ed. Prentice-Hall, Englewood Cliffs, N. J., 1984. В терминах совокупности и выборок эти свойства формулируются так. • Каждый член совокупности принадлежит одному из двух классов. • Доля членов совокупности, принадлежащих одному классу, неизменна. • Каждый член выборки извлекается из совокупности независимо от остальных. СРАВНЕНИЕ ДОЛЕЙ В предыдущей главе мы рассмотрели критерий Стьюдента t. Он вычисляется на основе выборочных средних и стандартной ошибки: Разность выборочных средних Стандартная ошибка разности выборочных средних Выборочная доля р аналогична выборочному среднему. Выражение для стандартной ошибки мы уже вывели. Теперь мы можем перейти к задаче сравнения долей, то есть к проверке нулевой гипотезы о равенстве долей. Для этого используется критерий z, аналогичный критерию Стьюдента /: Разность выборочных долей — . Стандартная ошибка разности выборочных долей — объемы двух выборок, то Пусть р] и р2 — выборочные доли. Поскольку стандартная ошибка — это стандартное отклонение всех возможных значений р, полученных по выборкам заданного объема, и поскольку дисперсия разности равна сумме дисперсий, стандартная ошибка разности долей равна SPi = л 1 KSP,= P\(l-P\) „ Pitt-Pi) я, у П2 Таким образом, л л 1 П{ П2 Итак, мы вывели формулу для критерия z- Вообще, этой буквой обозначаются величины со стандартным нормальным распределением (то есть нормальным распределением со средним ц = 0 и стандартным отклонением а =1, см. табл. 6.4). С величиной z мы встретимся еще неоднократно. В данном случае нормальное распределение имеет место только при достаточно больших объемах выборок*. щ +п2 Тогда Если при оценке дисперсии объединить наблюдения из обеих выборок, чувствительность критерия Стьюдента увеличится. Таким же способом можно повысить чувствительность критерия z-Действительно, если справедлива нулевая гипотеза, то обе выборочные доли р\ =mjnx и р2 = т2/п2 — это две оценки одной и той же доли р, которую мы, следовательно, можем оценить как А ш, + т2 Р = Sp =У1Р(1-Р)-Отсюда имеем 2 2 Sn S; — н я, п2 V «1 п2) * Точнее говоря, когда значения прип(\-р) больше 5. Если хотя бы для одной выборки это условие не выполняется, то критерий z неприменим и нужно воспользоваться точным критерием Фишера. Этот критерий мы рассмотрим чуть позже. Подставляя полученную объединенную оценку в формулу для критерия z, имеем: z = Р\ ~ Pi \р(\-р) 1 1 ^ — + — щ п2) О статистически значимом различии долей можно говорить, если значение z окажется «большим». С такой же ситуацией мы имели дело, рассматривая критерий Стьюдента. Отличие состоит в том, что t подчиняется распределению Стьюдента, a z — стандартному нормальному распределению. Соответственно, для нахождения «больших» значений z нужно воспользоваться стандартным нормальным распределением (рис. 2.5). Однако, поскольку при увеличении числа степеней свободы распределение Стьюдента стремится к нормальному, критические значения z можно найти в последней строке табл. 4.1. Для 5% уровня значимости оно составляет 1,96, для 1% — 2,58. Поправка Йейтса на непрерывность Нормальное распределение служит лишь приближением для распределения Z- При этом оценка Р оказывается заниженной и нулевая гипотеза будет отвергаться слишком часто. Причина состоит в том, что z принимает только дискретные значения, тогда как приближающее его нормальное распределение непрерывно. Для компенсации излишнего «оптимизма» критерия z введена поправка Йейтса, называемая также поправкой на непрерывность. С учетом этой поправки выражение для z имеет следующий вид: Z = Р\ -Рг 1 1 > — + п2 ) ]р(1-р) 1 1 — + — Поправка Иейтса слегка уменьшает значение z, уменьшая тем самым расхождение с нормальным распределением. Галотан и морфин: операционная летальность Теперь мы можем, наконец, сравнить операционную летальность при галотановой и морфиновой анестезии. Как вы помните, Конахан и соавт. исходили из предположения о том, что морфин в меньшей степени угнетает кровообращение, чем галотан, и потому предпочтительнее для общей анестезии. Действительно, при использовании морфина артериальное давление и сердечный индекс были выше, чем при использовании галотана, и различия эти статистически значимы. Однако выводы делать рано — ведь до сих пор не проанализированы различия операционной летальности, а именно этот показатель наиболее значим с практической точки зрения. Итак, среди получавших галотан (1 -я группа) умерли 8 больных из 61 (13,1%), а среди получавших морфин (2-я группа) — 10 из 67 (14,9%). Объединенная оценка доли умерших Р = л 8 + 10 = 0,141. 61+67 Величина пр для каждой из выборок равна соответственно пхрх = 61 х 0,141 = 8,6 и п2 р2 =67x0,149 = 9,4. Оба значения больше 5*, поэтому можно воспользоваться критерием Z- С учетом поправки Йейтса имеем: z = Р\ ~Рг 2 1 1 ^ — + — п2 ) 'АО-А) 0,131-0,149 п2 ) \( 1 V 61 + 67у = 0,04. (0,141(1-0,141) * Больше 5 и «(1-^) - нетрудно показать, что если /><0,5, то п{\-р)>пр. Это очень маленькая величина. Она гораздо ниже 1,96 — критического значения для 5% уровня значимости. Следовательно, хотя галотан и морфин действуют на кровообращение по-разному, нет никаких оснований говорить о различии операционной летальности. Этот пример очень поучителен: мы убедились, сколь важно учитывать исход лечения. Организм устроен сложно, действие любого препарата многообразно. Если препарат положительно в |
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 |
Скачать книгу "Медико-биологическая статистика" (7.41Mb) |
[каталог] [статьи] [доска объявлений] [обратная связь] |