Мода, медиана, квартили и децили

Кроме перечисленных выше средних в статистическом анализе как обобщающие характеристики совокупности используют такие значения признака, которые отличаются особым расположением в вариационном ряду распределения. Это так называемые структурные (позиционные) средние. Из них чаще всего применяют моду и медиану.

Величина моды и медианы зависит только от характера частот, т.е. от структуры распределения. Если величина средней арифметической зависит от всех значений признака, то величина моды и медианы не зависит от крайних значений признака. Это особенно важно для рядов распределения, в которых крайние значения признака имеют нечетко выраженные границы (до и более).

Моды называют значение признака, имеющее наибольшую частоту в статистическом ряду распределения. Способ вычисления моды зависит от того, в каком виде дано значение признака: дискретного или интервального ряда распределения. В дискретных вариационных рядах моду вычисляют без дополнительных расчетов по значению варианта с наибольшей частотой. Например, известный переменный выработка деталей рабочими цеха:

выработка деталей, шт 30 33 35 38

число рабочих, чел. 7 10 15 12

В данном примере модальной величиной является 35 деталей, так как эта величина в исследуемой совокупности имеет наибольшую частоту - 15 случаев. Модальной цене на тот или иной продукт на рынке является и цена, которая наблюдается чаще всего.

При расчете моды в интервальном вариационном ряду распределения сначала нужно определить модальный интервал, в пределах которого находятся мода, а затем-значение модальной величины признака.

В интервальном вариационном ряду распределения модой наближенно считают центральный вариант так называемого модального интервала, т.е. того интервала, который имеет наибольшую частоту. В пределах интервала надо найти то значение признака, которое является модой.

В интервальных вариационных рядах распределения моду определяют по формуле:

где х0 - нижняя (минимальная) граница модального интервала; к - величина интервала; /1 - частота передмодального интервала; /2 - частота модального интервала; /3 - частота послемодального интервала.

Формула основывается на предположении, что расстояния от нижней границы модального интервала до моды и от моды до верхней границы модального интервала прямо пропорциональны разницам между чисельностями (частотами) модального интервала и интервалов, что прилегают к нему.

Расчет моды в интервальном вариационном ряду распределения покажем на примере распределения 100 хозяйств по надою молока на корову (табл. 4.8).

Таблица 4.8. Данные для расчета моды и медианы в интервальном ряду распределения

Номер группы

Группы хозяйств по надою молока на корову, ц

Число хозяйств

Накопленные частоты

I

26-28

8

8

II

28-30

16

24 (8+16)

III

30-32

17

41(17+24)

IV

32-34

25

66 (25+41)

V

34-36

18

84 (18+66)

VI

36-38

11

95 (11+84)

VII

38-40

5

100 (5+95)

Вместе

-

100

-

Интервал, в котором содержится мода, будет 32 - 34 ц, так как этот интервал наибольшую частоту.

Подставив соответствующие числовые значения в формулу моды, получим:

Итак, в исследуемой совокупности наибольшее число хозяйств продуктивность коров 33,07 ц.

Мода и средняя величина по-разному характеризуют совокупность. Мода определяет непосредственно размер признака, свойственного хотя и значительной части совокупности, но не всей совокупности. Мода за своим обобщающим значением менее точная по сравнению со средней арифметической, которая характеризует совокупность в целом с учетом всех без исключения элементов совокупности.

Медианой называют такое значение признака, которое разделяет ранжирований ряд распределения на две равные части, то есть значение, которое находится в середине ряда распределения. Если в дискретном вариационном ряду 2т + 1 случаев, то значение признака в случае т + 1 является медианным. Если в ряду четное число 2т случаев, медиану определяют как среднюю арифметическую из двух середенних значений. Например, если 15 комбайнеров агрофирмы расположить в порядке возрастания, т.е. в ранжирований ряд по количеству намолоченного ими зерна, намолот зерна в восьмого комбайнера будет медианным. Если же число комбайнеров будет 16 человек, то медианой будет среднее значение намолота зерна восьмого и девятого комбайнеров.

Медиану с четным и нечетным числом вариант в дискретном ряду распределения вычисляют по формулам:

В интервальном вариационном ряду распределения медиана определяется по формуле:

где х 0 - нижняя (минимальная) граница медианного интервала; к - величина интервала; 0,5^ й - половина суммы накопленных частот интервального ряда распределения; 3т,-1 - сумма накопленных частот интервала, предшествующего медианному; /т, - частота медианного интервала.

Для определения медианы в интервальном вариационном ряду распределения надо вычислить накопленные частоты и отыскать медианный интервал. Под накопленными частотами понимают нарастающий итог частот, начиная с первого интервала. Медианным является тот интервал, на который приходится первая накопившаяся частота, превышающая половину всего объема совокупности.

Вычислим медиану по данным этого самого интервального ряда распределения (табл. 4.8). По данным таблицы построим ряд накопленных частот и найдем медианный интервал. Медианным интервалом является интервал 32 - 34 ц, так как на этот интервал приходится первая накопившаяся частота, превышающая половину всего объема совокупности (66 превышает £/ : 2 = 100:2= 50).

Медианное значение продуктивности коров составит:

Итак, продуктивность коров, ровный 32,72 ц и есть вариантой, что делит вариационный ряд распределения 100 хозяйств на две равные части (50 хозяйств имеет надой на корову меньше 32,72 ц и 50 хозяйств - более 32,72 ц).

Мода и медиана, как правило, отличаются от значения средней, совпадая с ней только в случае симметричного распределения частот вариационного ряда: х = M0 = Me. Поэтому соотношение моды, медианы и средней арифметической позволяет оценить асимметрию ряда распределения (см. разд. 5).

Для умеренно асимметричных распределений К.Пирсон установил следующее приближенное соотношение между этими характеристиками:

Медиана является лучшей характеристикой центральной тенденции, когда пределы крайних интервалов открыты. Медиана является наиболее приемлемой характеристикой и в случае, если в ряду распределения является значительно большие и значительно малые значения, которые влияют на среднюю величину, а на медиану - нет. Медиана, кроме того, обладает свойством линейного минимума: сумма абсолютных значений отклонений величины признака у всех единиц совокупности от медианы, наименьшая, то есть

Это свойство имеет большое значение для решения некоторых практических задач - например, для расчета самой короткой из всех возможных расстояний

для разных видов транспорта, для размещения станций технического обслуживания таким образом, чтобы расстояние до всех машин, обслуживаемых данной станцией, была минимальной и т. п.

Моду и медиану применяют обычно в тех случаях, когда определять среднюю арифметическую нецелесообразно. Так, нет смысла вычислять средний размер одежды и обуви, которую производят фабрики. Для этого достаточно знать модальные размеры одежды и обуви, то есть те, которые пользуются наибольшим спросом у населения с тем, чтобы фабрики, планируя свое производство, могли как можно лучше удовлетворить спрос покупателей именно на эти размеры одежды и обуви.

Медиана широко используется при проектировании мест строительства объектов массового обслуживания населения (школьных и дошкольных заведений, кинотеатров, предприятий службы быта и торговли). Например, продовольственный магазин в сельском поселке целесообразно расположить в такой точке, чтобы он обслуживал половину количества жителей поселка, а не располагался точно в середине его.

Дополнительно к медианы для характеристики структуры вариационного ряда распределения вычисляют квартили, которые делят ранжирований ряд на 4 равные части, и децили, которые разделяют ранжирований ряд на 10 равных частей. Второй квартиль 22 - равен медиане, а первый - <21 и третий - 23 вычисляют аналогично расчету медиане, только вместо медианного интервала берут для первого квартиля интервал, в котором находится варианта, что отделяет 1/4 количества частот, а для третьего квартиля - интервал, в котором находится варианта, что отделяет 3/4 количества частот.

В интервальном ряду распределения первый и третий квартиль рассчитывают по следующим формулам:

где х0 - нижние (минимальные) пределы квартальных интервалов; к - величина интервала; £ / - сумма накопленных частот ряда распределения; 5а 1 и 5а 1 - накопленные частоты интервала, предшествующего интервальном соответственно для первого и третьего кварталов; /аи /& - частоты квартальных интервалов.

Расчет первого и третьего кварталов рассмотрим на примере табл. 4.8.

Вычислим первый квартиль. Для нахождения интервала, в котором находится первая квартиль, используем накопленные частоты. Первый квартиль находится в интервале, в который входит первая накопившаяся частота, что превышает четверть общего объема совокупности (0,25 100 = 25). Итак, первый квартиль (1 находится в третьем интервале (с надоем молока от 30 до 32 ц), который имеет сумму накопленных частот 41.

Значение первого квартиля:

Это означает, что одна четверть хозяйств имеет надежд 30,12 ц, а три четверти - больше как 30,12 ц.

Чтобы определить третий квартиль, найдем интервал, в котором он находится. На этот интервал приходится первая накопившаяся частота, что превышает три четверти общего объема совокупности(0,75 ■ 100 = 75). Итак, третий квартиль находится в интервале 34 - 36 ц, который имеет сумму накопленных частот, равную 84.

Значение третьего квартиля:

Итак, три четверти хозяйств имеют надой молока на корову до 35,00 ц, а одна четверть - более 35,00 ц.

В интервальном ряду распределения децили определяют по формуле:

где х0 - нижняя (минимальная) граница соответствующего децильного интервала; к - величина интервала; - сумма накопленных частот интервалов, предшествующих децильним; Фв - частоты соответствующих децильных интервалов.

Подставив данные табл. 4.8 в формулу, определим первый децилям:

Итак, десятая часть всех хозяйств имеет надой на корову 28,25 ц и меньше, а остальные (90%) - больше как 28,25 ц.

Аналогично рассчитываются и остальные децилей (второй, третий и т.д.).

 
< Пред   СОДЕРЖАНИЕ   След >