![]() |
|
|
Медико-биологическая статистикаед тем как направить рукопись на рецензию, ее тщательно проверяют на предмет правильности использования статистических методов. Результатом этого нередко становится пересмотр используемых в статье статистических методов, а иногда и самих выводов*. Но большинство редакторов, похоже, убеждены, что каждый рецензент рассматривает статистическую сторону работы столь же тщательно, сколь и собственно медицинскую. Неясно, однако, как он может это сделать — ведь даже авторы ведущих медицинских журналов, упоминая статистическую проверку гипотез, редко затрудняют себя указанием, какой именно критерий был использован. * Подробнее о существующей в редакциях практике работы с рукописями см. М. J. Gardner, J. Bond. An exploratory study of statistical assessment of papers published in the British Medical Journal. JAMA, 263:1355—1357,1990,а также S. A. G lant z. It is all in the numbers .J.Am. Coll. Cardiol., 21:835-837, 1993. Коротко говоря, для грамотного чтения медицинской литературы необходимо научиться понимать и оценивать правильность применения статистических методов, используемых для анализа результатов. К счастью, основные идеи, которыми необ ходимо овладеть вдумчивому читателю (и, конечно, вдумчивому исследователю), довольно просты. В следующей главе мы приступим к их обсуждению. Глава 2 Как описать данные В этой книге мы встретимся с двумя типами задач. Первый тип задач — как сжато описать данные. Этими задачами занимается так называемая описательная статистика. Задачи второго типа связаны с оценкой статистической значимости различий и вообще с проверкой гипотез. В этой главе мы рассмотрим задачи первого типа — как наилучшим образом описать данные. Если значения интересующего нас признака у большинства объектов близки к их среднему и с равной вероятностью отклоняются от него в большую или меньшую сторону, лучшими характеристиками совокупности будут само среднее значение и стандартное отклонение. Напротив, когда значения признака распределены несимметрично относительно среднего, совокупность лучше описать с помощью медианы и процентилей. Возможно, сказанное давно вам известно. Тогда смело переходите к следующей главе. Тех же, для кого термины вроде про-центиля звучат туманно, мы приглашаем приступить к изучению марсиан. Поначалу займемся каким-нибудь количественным признаком, например ростом. Чтобы попусту не фантазировать, слетаем на Марс и измерим всех марсиан, благо их всего две сотни. Результаты приведены на рис. 2.1 (мы округлили рост до целого числа сантиметров). Каждому марсианину соответствует кружок, так что, например, два кружка над числом 30 означают, что имеются два марсианина ростом 30 см. Рис. 2.1 — это распределение марсиан по росту. Мы видим, что рост большинства марсиан — от 35 до 45 см. Коротышек (ниже 30 см) совсем немного — всего трое, и столько же великанов (выше 50 см). Окрыленные успехом марсианского проекта, мы решаем измерить венерианцев. Легко находим деньги на путешествие и, вооружившись линейками, измеряем всех 150 обитателей Венеры. Научный отчет об экспедиции будет звучать так: «Редко встретишь венерианца ниже 10 см или выше 20 см, а чаще попадаются 15-сантиметровые, см. рис. 2.2». о о о о о о о о Но вот остались позади нелегкие межпланетные перелеты. Настала пора скрупулезного анализа данных. Сравним рис. 2.1 и 2.2. Мы видим, что венерианцы ниже марсиан и что интервал, в который умещается рост всех марсиан, шире, чем соответствующий интервал для венерианцев. Ширина интервала, в который попадают почти все марсиане (194 из 200) — 20 см (от 30 до 50 см). Рост большинства венерианцев (144 из 150) умещается в интервал от 10 до 20 см, то есть имеет ширину всего лишь 10 см. Несмотря на эти различия, между двумя совокупностями инопланетян имеется и существенное сходство. В обеих рост любого члена скорее близок к середине распределения, нежели заметно от нее удален, и одинаково вероятно может быть как выше, так и ниже середины. Распределения на рис. 2.1 и 2.2 имеют схожую форму и приближенно определяются одной и той же формулой. Раз существует множество похожих распределений, значит, для характеристики одного из них достаточно указать, чем оно отличается от других, ему подобных, то есть всю собранную информацию мы можем свести к нескольким числам, которые называются параметрами распределения. Это среднее значение и стандартное отклонение. СРЕДНЕЕ Расположив мысленно распределения марсиан и венерианцев на одной шкале роста, мы увидим, что распределение венерианцев находится ниже, чем распределение марсиан. Характеристика положения распределения на числовой оси называется средним. Среднее по совокупности обозначают греческой буквой \х (читается «мю») и вычисляют по формуле: Сумма значений признака для всех членов совокупности Распределение марсиан по росту. Каждому марсианину соответствует кружок. Обратите внимание, что марсиан среднего роста (около 40 см) больше всего и что высокорослых столько же, сколько коротышек (распределение симметрично). Среднее по совокупности = ~ Число членов совокупности Эквивалентное математическое выражение имеет вид N где X — значение признака, N — число членов совокупности. Как всегда, большая греческая буква I (читается «сигма») обозначает сумму. Подставив в формулу добытые нами данные, получим ценное дополнение к научному отчету: средний рост марсиан 40 см, а венерианцев — 15 см. СТАНДАРТНОЕ ОТКЛОНЕНИЕ Еще на Венере мы заметили, что тамошние жители более однородны по росту, нежели марсиане. Хотелось бы и это впечатление оформить количественно, то есть иметь показатель разброса значений относительно среднего. Ясно, что для характеристики разброса все равно, в какую сторону отклоняется значение — в большую или меньшую. Иными словами, отрицательные и положительные отклонения должны вносить равный вклад в характеристику разброса. Воспользуемся тем, что квадраты двух равных по абсолютной величине чисел равны между собой, и вычислим средний квадрат отклонения от среднего. Этот пока-затель носит название дисперсии и обозначается а . Чем больше разброс значений, тем больше дисперсия. Дисперсию вычисляют по формуле: N Как видно из формулы, дисперсия измеряется в единицах, равных квадрату единицы измерения соответствующей величины. Например, дисперсия измеряемого в сантиметрах роста сама измеряется в квадратных сантиметрах. Это довольно неудобно. Поэтому чаще используют квадратный корень из дисперсии — стандартное отклонение а (маленькая греческая буква «сигма»): Стандартное отклонение измеряется в тех же единицах, что исходные данные. Например, стандартное отклонение роста марсиан составляет 5 см, а венерианцев — 2,5 см. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ Таблица 2.1 сжато представляет то, что мы узнали о марсианах и венерианцах. Таблица очень информативна, из нее можно узнать об объеме совокупности, о среднем росте и о том, насколько велик разброс относительно среднего. Вновь обратившись к рис. 2.1 и 2.2, мы обнаружим, что на обеих планетах рост примерно 68% обитателей отличается от среднего не более чем на одно стандартное отклонение и примерно 95% — на два стандартных отклонения. Подобные распределения встречаются очень часто. Можно сказать, что это происходит всегда, когда некая величина отклоняется от средней под действием множества слабых, независимых друг от друга фактоТаблица 2.1. Параметры распределения марсиан и венерианцев по росту Объем совокупности Среднее, см Стандартное отклонение, см 200 Марсиане 200 Венерианцы 150 40 5,0 2,5 ров. Распределение такого рода называется нормальным (или гауссовым) и описывается формулой: f(X) 1 CTV27C ст Заметим, что нормальное распределение полностью определяется средней (а и стандартным отклонением а. Поэтому сведения в табл. 2.1 — это не просто удачное представление данных, но также и полное их описание. МЕДИАНА И ПРОЦЕНТИЛИ И снова в путь! Обогатившись теоретическими познаниями, мы отправляемся на Юпитер. Здесь мы не только измеряем всех до одного юпитериан, но также подсчитываем среднее и стандартное отклонение роста для всей их совокупности. Оказывается, средний рост юпитериан — 37,6 см, а его стандартное отклонение — 4,5 см. Можно заключить, что юпитериане очень похожи на марсиан, ведь близки оба параметра, определяющие нормальное распределение — среднее и стандартное отклонение. Однако если взглянуть на исходные данные по юпитерианам (рис. 2.ЗА), то обнаружится совершенно иная картина. На самом деле типичный юпитерианин довольно приземист — около 35 см, то есть на добрых 5 см ниже марсианина. И только небольшая группа долговязых смещает значения стандартного отклонения и среднего, вводя ученых в заблуждение! Итак, рост произвольно выбранного юпитерианина вовсе не равновероятно может оказаться выше или ниже среднего, то есть распределение юпитериан по росту асимметрично. В такой ситуации полагаться на среднее и стандартное отклонение нельзя. На рис. 2.3Б изображено нормальное распределение для совокупности с теми же самыми значениями среднего и стандартного отклонения, что и на рис. 2.ЗА. Оно ничуть не похоже на распределение юпитериан. Таким образом, доверившись среднему и стандартному отклонению, мы получим превратное представление о совокупности, не подчиняющейся нормальному распределению. Для описания таких данных лучше подходит не среднее, а медиана. Медиана — это значение, которое делит распределение пополам: половина значений больше медианы, половина — меньше (точнее, не больше). Из рис. 2.4А видно, что ровно половина юпитериан выше 36 см. Стало быть, 36 см — это медиана роста юпитериан. Для характеристики разброса роста юпитериан найдем значения, не выше которых оказались 25 и 75% результатов измерения. Эти величины называются 25-м и 75-м процентилями. Если медиана делит распределение пополам, то 25-й и 75-й проценти-ли отсекают от него по четвертушке. (Саму медиану, кстати, можно считать 50-м процентилем.) Для юпитериан, как видно из рис. 2.4Б, 25-й и 75-й процентили равны соответственно 34 см и 40 см. Конечно, ме |
< К СПИСКУ КНИГ > 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 |
Скачать книгу "Медико-биологическая статистика" (7.41Mb) |
[каталог] [статьи] [доска объявлений] [обратная связь] |