![]() |
|
|
Медико-биологическая статистика, то это называется ошибкой Ipoda. Максимальная приемлемая вероятность ошибки I рода называется уровнем значимости и обозначается а. С этой величиной мы уже много раз встречались; обычно а принимают равной 0,05 (то есть 5%), однако можно взять и какой-нибудь другой уровень значимости, например 0,1 или 0,01. Если мы не отклоняем нулевую гипотезу, когда она не верна, то есть не находим различий там, где они есть, то это — ошибка IIрода. Ее вероятность обозначается Р. Ясно, что вероятность обнаружить различия, то есть чувствительность критерия, равна 1 - Р. В нашем примере с диуретиком Р =0,45 и 1-Р =0,55, то есть чувствительность критерия при данных условиях составляет 55%. Все, что мы узнали об ошибках критериев значимости, кратко представлено в таблице 6.1. ЧЕМ ОПРЕДЕЛЯЕТСЯ ЧУВСТВИТЕЛЬНОСТЬ? Естественно, мы заинтересованы в том, чтобы по возможности уменьшить вероятность ошибки II рода, то есть повысить чувствительность критерия. Для этого нужно знать, от чего она зависит. В принципе, эта задача похожа на ту, что решалась применительно к ошибкам I рода, но за одним важным исключением. Чтобы оценить чувствительность критерия, нужно задать величину различий, которую он должен выявлять. Эта величина определяется задачами исследования. В примере с диуретиком чувствительность была невелика — 55%. Но, может быть, исследователь просто не считал нужным выявлять прирост диуреза с 1200 до 1400 мл/сут, то есть всего на 17%? С увеличением разброса данных повышается вероятность ошибок обоих типов. Как мы вскоре увидим, величину различий и разброс данных удобнее учитывать совместно, рассчитав отношение величины различий к стандартному отклонению. Чувствительность диагностической пробы можно повысить, снизив ее специфичность — аналогичное соотношение существует между уровнем значимости и чувствительностью критерия. Чем выше уровень значимости (то есть чем меньше а), тем ниже чувствительность. Как мы уже говорили, важнейший фактор, который влияет на вероятность ошибок как I, так и II рода, — это объем выборок. С ростом объема выборок вероятность ошибок уменьшается. Практически это очень важно, поскольку прямо связано с планированием эксперимента. Прежде чем перейти к подробному рассмотрению факторов, влияющих на чувствительность критерия, перечислим их еще раз. • Уровень значимости а. Чем меньше а, тем ниже чувствительность. • Отношение величины различий к стандартному отклонению. Чем больше это отношение, тем чувствительнее критерий. • Объем выборок. Чем больше объем, тем выше чувствительность критерия. Уровень значимости Чтобы получить наглядное представление о связи чувствительности критерия с уровнем значимости, вернемся к рис. 6.3. Выбирая уровень значимости а, мы тем самым задаем критическое значение t. Это значение мы выбираем так, чтобы доля превосходящих его значений — при условии, что препарат не оказывает эффекта, — была равна а (рис. 6.ЗА). Чувствительность критерия есть доля тех значений критерия, которые превосходят критическое при условии, что лечение дает эффект (рис.6.ЗБ). Как видно из рисунка, если изменить критическое значение, изменится и эта доля. t Рис. 6.4. Выбирая уровень значимости а, мы тем самым определяем критический уровень t. Чем меньше а, тем выше критический уровень и тем ниже чувствительность. А. Уровень значимости а = 0,05, критическое значение t = 2,101, чувствительность 55%. Б. Теперь уровень значимости а =0,01, критическое значение t возросло до 2,878 и чувствительность снизилась до 45%. Рассмотрим подробнее, как это происходит. На рис. 6.4А изображено распределение значений критерия Стьюдента. Отличие от рис. 6.3 состоит в том, что теперь это распределение, полученное для всех 1027 возможных пар выборок. Верхний график — это распределение значений/ для случая, когда препарат не обладает диуретическим действием. Предположим, мы выбрали уровень значимости 0,05, то есть приняли а =0,05. В этом случае критическое значение равно 2,101, то есть мы отвергаем нулевую гипотезу и признаем различия статистически значимыми при / > +2,101 или/ < -2,101. Соответствующие области на графике заштрихованы, а критическое значение изображено вертикальной пунктирной линией, спускающейся к нижнему графику, на котором изображено распределение / для случая, когда препарат обладает диуретическим действием, а именно увеличивает суточный диурез на 200 мл. По форме нижний график такой же, как верхний, но сдвинут на 200 мл вправо. Доля значений /, превышающих критическое значение 2,101 (заштрихованная область), составляет 0,55. Итак чувствительность критерия в данном случае 55%; а вероятность ошибки второго рода(3 = 1 -0,55 = = 0,45, то есть 45%. А теперь взглянем на рис. 6.4Б. На нем изображены те же самые распределения значений /. Отличие в выбранном уровне значимости — а =0,01. Критическое значение / повысилось до 2,878, пунктирная линия сместилась вправо и отсекает от нижнего графика только 45%. Таким образом, при переходе от 5% к 1% уровню значимости чувствительность снизилась с 55 до 45%. Соответственно, вероятность ошибки II рода повысилась до 1-0,45=0,55. Итак, снижая а, мы снижаем риск отвергнуть верную нулевую гипотезу, то есть найти различия (эффект) там, где их нет. Но тем самым мы снижаем и чувствительность — вероятность выявить имеющиеся на самом деле различия. Величина различий Рассматривая влияние уровня значимости, мы принимали величину различий постоянной: наш препарат увеличивал суточный диурез с 1200 до 1400 мл, то есть на 200 мл. Теперь примем4 -3 -2 -1 0 1 2 3 4 5 6 7 8 Рис. 6.5. Чем больше величина различий, тем сильнее распределение t сдвигается вправо и тем выше чувствительность. постоянным уровень значимости а =0,05 и посмотрим, как чувствительность критерия зависит от величины различий. Понятно, что большие различия выявить легче, чем маленькие. Рассмотрим следующие примеры. На рис. 6.5А изображено распределение значений / для случая, когда исследуемый препарат не обладает диуретическим действием. Заштрихованы 5% наибольших по абсолютной величине значений /, расположенных левее -2,101 или правее +2,101. На рис. 6.5Б изображено распределение значений / для случая, когда препарат увеличивает суточный I , ; f , _ ^ 0 100 200 300 400 Увеличение суточного диуреза, мл Рис. 6.6. Чувствительность критерия Стьюдента как функция от величины различий при объеме выборок 10 человек и уровне значимости а = 0,05. Пунктирная линия показывает, как пользоваться графиком. Для величины различий 200 мл чувствительность составляет 0,55. диурез в среднем на 200 мл (эту ситуацию мы уже рассматривали). Выше правого критического значения лежит 55% возможных значений /: чувствительность равна 0,55. Далее, на рис. 6.5В представлено распределение значений / для случая, когда препарат увеличивает диурез в среднем на 100 мл. Теперь только 17% значений / превышает 2,101. Тем самым, чувствительность критерия равна лишь 0,17. Иными словами, эффект будет обнаружен менее чем в одном из каждых пяти сравнений контрольной и экспериментальной групп. Наконец, рис. 6.5Г представляет случай увеличения диуреза на 400 мл. В критическую область попало 99% значений/. Чувствительность критерия равна 0,99: различия будут выявлены почти наверняка. Повторяя этот мысленный эксперимент, можно определить чувствительность критерия для всех возможных значений эффекта, от нулевого до «бесконечного». Нанеся результаты на график, мы получим рис. 6.6, где чувствительность критерия показана как функция от величины различий. По этому графику можно определить, какой будет чувствительность при той или иной величине эффекта. Пользоваться графиком пока что не очень удобно, ведь он годится только для этих численности групп, стандартного отклонения и уровня значимости. Вскоре мы построим другой график, более подходящий для планирования исследования, но сначала нужно подробнее разобраться с ролью разброса значений и численности групп. Разброс значений Чувствительность критерия возрастает с ростом наблюдаемых различий; с ростом разброса значений чувствительность, напротив, снижается. где Хх и Х2 — средние, s — объединенная оценка стандартного Напомним, что критерий Стьюдента / определяется следующим образом: Ц1-Ц2 отклонения а, пх и п2 — объемы выборок. Заметьте, что Хх и Х2 — это оценки двух (различных) средних — ц, и ц2 • Для простоты допустим, что объемы обеих выборок равны, то есть пу =п2. Тогда вычисленное значение / есть оценка величины Обозначим 8 (греческая буква «дельта») величину эффекта, то есть разность средних: 5 = ц, - ц2 5 тогда Ц1-Ц2 Таким образом, / 'зависит от отношения величины эффекта к стандартному отклонению. Рассмотрим несколько примеров. Стандартное отклонение в исследуемой нами совокупности составляет 200 мл (см. рис. 6.1). В таком случае увеличение суточного диуреза на 200 или 400 мл равно соответственно одному или двум стандартным отклонениям. Это очень заметные изменения. Если бы стандартное отклонение равнялось 50 мл, то те же самые изменения диуреза были бы еще более значительными, составляя соответственно 4 и 8 стандартных отклонений. Наоборот, если бы стандартное отклонение равнялось, например, 500 мл, то изменение диуреза в 200 мл составило бы 0,4 стандартного отклонения. Обнаружить такой эффект было бы непросто да и вряд ли вообще стоило бы. Итак, на чувствительность критерия влияет не абсолютная величина эффекта, а ее отношение к стандартному отклонению. Обозначим его ср (греческая «фи»); это отношение ф = 5/а называется параметром нецентральности. Объем выборки Мы узнали о двух факторах, которые влияют на чувствительность критерия: уровень значимости а и параметр нецентральности ф. Чем больше а и чем больше ф, тем больше чувствительность. К сожалению, влиять на ср мы не можем вовсе, а что касается а, то его увеличение повышает риск отвергнуть верную нулевую гипотезу, то есть найти различия там, где их нет. Однако есть еще один фактор, который мы можем, в определ |
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 |
Скачать книгу "Медико-биологическая статистика" (7.41Mb) |
[каталог] [статьи] [доска объявлений] [обратная связь] |