ВАРИАЦИОННАЯ СТАТИСТИКА — часть математической статистики, используемая при изучении эмпирических распределений количественных признаков в статистической совокупности.
Методы В. с. широко применяются в медицине и здравоохранении для обработки количественно выраженных данных в пределах качественно однородных групп (результатов антропометрических измерений, клинико-физиологических исследований, экспериментальных и лабораторных наблюдений, данных о сети и деятельности органов здравоохранения и медицинских учреждений) и являются мощным средством их научного статистического анализа.
Математической основой В. с. является теория вероятностей (см.Вероятностей теория) и закон больших чисел (см.Больших чисел закон), в частности теоремы Бернулли, Чебышева и Ляпунова. В общей форме смысл этих теорем сводится к доказательству того, что точность результатов статистического измерения зависит от числа наблюдений. В совокупности единиц, однородных в определенном отношении, встречаются признаки, количественно различные у отдельных индивидуумов (напр., дети одного пола, возраста и этнической группы имеют различные величины роста, веса, окружности груди и т.п.). Такого рода признаки называются варьирующими. Отдельное числовое значение варьирующего признака называется вариантой (v).
Числа, показывающее, как часто встречается каждая варианта в данной совокупности, носят название частот (р).
Статистический ряд чисел, состоящий из вариант и частот, называется вариационным рядом, или рядом распределения (табл. 1, графы 1, 2 и 3).
Рис. 1. Гистограмма распределения обследованных по величине жизненной емкости легких (ЖЕЛ).Рис. 2. Полигон (кривая распределения) обследованных по частоте пульса: 1 — до физической нагрузки, 2 — после нагрузки.
Вариационные ряды могут быть представлены графически с помощью гистограммы (рис. 1), полигона, или кривой распределения (рис. 2). В ряде случаев в процессе анализа вариационного ряда применяют построение ряда накопленных частот, что графически изображается кумулятой, или огивой (рис. 3), а также кривой нормального распределения (рис. 4).
Рис. 3. Кривая зависимости между количеством накопленных частот признака и его размером (кумулята, или огива). По оси ординат — верхние границы совокупности вариант в процентах.Рис. 4. Кривая нормального распределения: ? — среднее квадратическое отклонение, X — средняя арифметическая величина вариационного ряда. Цифры над стрелками — удельный вес вариант в указанных пределах.
Вариация количественных признаков может быть дискретной и непрерывной. Дискретной называется вариация, при к-рой отдельные значения признака (варианты) отличаются друг от друга на нек-рую конечную величину (как правило, целое число). Напр., число коек в больнице, число дней временной нетрудоспособности, число ударов пульса в одну минуту и т. д. Непрерывной называется вариация, при к-рой значения признака могут отличаться друг от друга на сколь угодно малую величину (процент выполнения плана, возраст, длина тела, вес тела или величина любого другого антропометрического признака, уровень гемоглобина в крови и т. д.).
Важнейшей обобщающей характеристикой вариационного ряда являются средние величины М или X. С помощью средних величин можно одним числом охарактеризовать любой количественно выраженный признак изучаемой совокупности.
В В. с. применяются различные средние величины: средняя арифметическая, средняя геометрическая, средняя квадратическая, средняя гармоническая и др. Кроме того, определяются мода (Мо), наиболее часто встречающаяся в данном вариационном ряду варианта, являющаяся в некоторых случаях типичной величиной для исследуемого явления, а также медиана (Me) — варианта, в обе стороны от к-рой находится одинаковое число вариант. Средняя геометрическая и средняя гармоническая сравнительно редко употребляются в сан. статистике.
Наиболее простой и общепринятой сводной характеристикой вариационного ряда является его средняя арифметическая величина М (Х), равная сумме произведений вариант (у) на частоты (р), деленная на сумму частот (N). Формула этого вычисления: M = (?vp)N. В вариационном ряду со сгруппированными вариантами v соответствует срединной варианте, равной в случае непрерывной вариации полусумме начальных вариант данной и следующей групп (графа 2 табл. 1). Основной мерой изменчивости (вариабельности) вариационного ряда служит его среднее квадратическое отклонение (а), равное корню квадратному из суммы произведений квадратов отклонений каждой варианты от средней величины ряда на соответствующие частоты, деленной на сумму частот:
Отклонением (d) называется разность между вариантой и средней арифметической (v — М). Ход вычислений — см. в графах 4, 5, 6, 7 табл. 1.
В нормальных вариационных рядах распределение частот вокруг М(X) соответствует схеме, представленной в табл. 2.
Имеются упрощенные приемы вычисления М и а, излагаемые в специальных руководствах.
При равенстве прочих условий величина о зависит от размеров входящих в нее отклонений и будет тем меньше, чем меньше эти отклонения. Поэтому, чем меньше а, тем теснее сгруппированы варианты вокруг М и тем, следовательно, лучше, точнее характеризует средняя арифметическая вариационный ряд.
В. с. позволяет установить точность средней величины эмпирического распределения, а также существенность (статистическую значимость) различий между сравниваемыми средними значениями изучаемых признаков. Мерой точности средней величины является ее средняя ошибка.
Средняя ошибка т показывает, насколько средняя, полученная измерением определенной части совокупности, отклоняется от средней, к-рая была бы получена при измерении всех единиц совокупности. Она вычисляется по формуле m = ?/(vN) . Чем больше число наблюдений (N), тем меньше m и тем ближе результаты частичного (выборочного) и сплошного измерений. Для оценки существенности различия между двумя средними применяется средняя ошибка разности, равная
Если разность между средними величинами М1—М2 превосходит свою среднюю ошибку не менее чем в 2—3 раза, то различие между ними является существенным и вызвано систематически действующими факторами. Критерий достоверности различий (t) определяется по формуле
Критерий достоверности различии оценивается но общепринятым правилам: если t?2, то различия следует считать достоверными, т. е. они соответствуют вероятности безошибочного прогноза в 95% и более, если же t<2, то различия недостоверны. Это означает, что для выводов о достоверности различий необходим дополнительный материал. При небольшом числе наблюдений для оценки достоверности различий пользуются специальными таблицами (таблицами Стьюдента). Методы В. с. позволяют измерить взаимную связь (корреляционную зависимость) двух и более признаков одной совокупности (напр., зависимость между ростом и весом, ростом и окружностью груди и т. п.) и выразить ее количественно с помощью коэффициента корреляции (r). Методы измерения корреляции излагаются в специальных руководствах.
См. такжеСанитарная статистика.
Таблица 1. РАСПРЕДЕЛЕНИЕ ПО РОСТУ 14-ЛЕТНИХ ДЕВОЧЕК
Рост в см (варианты) |
Срединные варианты (V) |
Число девочек с данным ростом (частоты— р) |
vp |
Отклонения от М (d) |
d2 |
d2p |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
137,0-140,9 |
139,0 |
15 |
2085 |
— 10,3 |
106,09 |
1591,31 |
14 1 ,0-144,9 |
143,0 |
17 |
243 1 |
—6,3 |
39,69 |
674,73 |
145,0-148,9 |
147,0 |
41 |
6027 |
-2,3 |
5,29 |
216,89 |
149 ,0-152 ,9 |
151,0 |
52 |
7701 |
1,7 |
2,89 |
150,28 |
153 ,0—156 ,9 |
15 5,0 |
42 |
6510 |
5,7 |
32,49 |
1364,58 |
157,0 —160 ,9 |
159 ,0 |
19 |
3021 |
9,7 |
94,09 |
1787,71 |
Всего |
— |
186 |
27775 |
— |
— |
5785,50 |
Таблица 2. РАСПРЕДЕЛЕНИЕ ЧАСТОТ В НОРМАЛЬНОМ ВАРИАЦИОННОМ РЯДУ
М± соответствующая часть ? |
Количество вариант, в% |
|
в указанных пределах |
вне этих пределов |
|
М±0,5 ? |
38 |
6 2 |
М±1,0 ? |
(58 |
32 |
M±1,5 ? |
87 |
13 |
?±2,0 ? |
95,5 |
4,5 |
?±2,5 ? |
98,8 |
1 , 2 |
?±3,0 ? |
99 , 7 |
0,3 |
?±3,5 ? |
99,95 |
0,05 |
Библиография: Ашмарин И. П. и Воробьев А. А. Статистические методы в микробиологических исследованиях, Л., 1962, библиогр.; Бейли H. Т. Дж. Математика в биологии и медицине, пер. с англ., М., 1970, библиогр.; Бессмертный Б. С. Математическая статистика в клинической, профилактической и экспериментальной медицине, М., 1967, библиогр.; Боярский А. Я. Статистические методы в экспериментальных медицинских исследованиях, М., 1955; Каминский Л. С. Статистическая обработка лабораторных и клинических данных, Л., 1964, библиогр.; Кендалл М. Дж. и Стьюарт А. Теория распределений, пер. с англ., М., 1966, библиогр.; Кувшинников П. А. Статистический метод в клинических исследованиях, М., 1955, библиогр.; Мерков А. М. Общая теория и методика санитарно-статистического исследования, М., 1969, библиогр.; С e п e т л и e в Д. А. Статистические методы в научных медицинских исследованиях, пер. с болг., М., 1968, библиогр.; Статистическая оценка достоверности результатов исследования, под ред. А. М.Меркова, М., 1965; Статистические методы исследования в медицине и здравоохранении, под ред. Л. Е. Полякова, Л.,1971, библиогр.: W e b e г E. Grund-riss der biologischen Statistik fur Naturwis-senschaftler, Landwirte und Mediziner, Jena, 1961.
А. М. Мерков, Л. E. Поляков.
^
Источник: Большая Медицинская Энциклопедия (БМЭ), под редакцией Петровского Б.В., 3-е изданиехештеги матрица судьбы