Дисперсия случайной величины
Математическое ожидание показывает, вокруг которой численной меры группируются значения случайной величины. Однако, необходимо также иметь возможность измерять изменчивость (вариативность) случайной величины относительно математического ожидания. Таким показателем изменчивости является математическое ожидание квадрата разности между случайной величиной и ее математическим ожиданием, а именно M [(X - М [Х]) 2].
Определение. дисперсией случайной величины x называется число 14 DX] = M [(XM [X]) 2], (3.30)
или DX] = ± f (x t) o (*, - M [X]) 2.
На рис.3.26 приведены формулы для расчета распределения - статистической вероятности fx;) - а также показателей: математического ожидания М [Х] (ячейка Е9) и дисперсии D [X] (ячейка G9).
14 Предлагаем сравнить это определение с определением выборочной дисперсии
s 2.
Рис. 3.26. Формулы расчета м [х] и 0 [Х] В таблице рис.3.27 показаны результаты расчета математического ожидания м [х] и дисперсии 0 [Х] по данным примера 3.14, а также гистограмму распределения м [х] = 4,00 (ячейка Е9) и дисперсия 0 [Х] = 1,00 (ячейка В9).
Математическое ожидание показывает, что значение случайной величины x группируются около значения 4,00, количество которых составляет 50% от общего количества. Однако, вокруг такого же значения могут группироваться и другие данные.
Рис. 3.27. Таблица и гистограмма распределения с А / [Х] = 4,00 и £> [Х] = 1,00
С рис.3.28 видно, что для математического ожиданиям [х] = 4,00 дисперсия £> [Х] = 2,32 является вдвое большей, чем по данным рис. 3.27. О значительной изменчивости свидетельствует и соответствующая гистограмма.
Рис. 3.28. Таблица и гистограмма распределения с М [Х] = 4,00 и £> [Х] = 2,32
Предлагаем сравнить таблицы и графики рис. 3.27 и 3.28 и сделать выводы. Свойства дисперсии случайной величины, которые постоянно используются в вероятностно статистические методы:
o если x - случайная величина, а и Ь - некоторые числа, В = ах + Ь, то
D [ax + b] = a 2 D [X] (3.31)
(это значит, что число а в качестве параметра масштаба существенно влияет на дисперсию, тогда как число b - параметр сдвига на значение дисперсии не влияет);
o если X 1, X 2, X n - попарно независимые случайные величины (то есть X t и X независимые для i Ф j), то дисперсия суммы равна сумме дисперсий
D [X 1 + X 2 + ... + X n] = D [X 1] + D [X 2] + ... + D [X n]. (3.32)
Соотношение по математического ожидания (3.25) и дисперсии (3.32) имеют важное значение при изучении выборочных свойств, поскольку результаты выборочных наблюдений или измерений рассматриваются в математической статистике, как реализации независимых случайных величин.
С дисперсией случайной величины тесно связан еще один показатель изменчивости - стандартное отклонение.
Определение. Стандартным отклонением случайной величины x называется неотъемлемое число
SD [X] = + VD [X]. (3.33)
Итак, стандартное отклонениях однозначно связано с дисперсией.
В теории и практике статистических исследований также важную роль играют специальные функции - так называемые моменты (начальные и центральные), которые являются характеристиками случайных величин.
Определение. Исходным моментом k-то порядка случайной величины x называется математическое ожидание k-й степени этой величины:
~ K = M [X k]. 15 (3.34)
Определение. Центральным моментом k-то порядка случайной величины x называется математическое ожидание k-й степени отклонения этой величины x от его математического ожидания:
m = m [x - M (X) Y, (3.35)
или m k = M [X - a] k, где a = M [X].
Для обозначения мометнив случайных величин используем те же буквы, что и для мометнив вариационного ряда, но с дополнительным знаком ~ ("тильда").
Формулы для вычисления моментов дискретных (которые принимают значения Х и с вероятностью р) и непрерывных (с плотностью вероятности / х)) случайных
величин приведены в табл. 3.4.
Таблица 3.4
Формулы для вычисления моментов случайных величин
Как и для вариационных строк моменты дискретных случайных величин имеют аналогичный смысл:
Первый начальный момент (¿= 1) случайной величины Хе ее математическим ожиданием:
~ 1 = М [Х] = с. (3.36)
Второй центральный момент (¿= 2) определяет дисперсию 0 [Х] случайной величины x:
Ш г (хи - а) 2 г. и = ЦХ] = (Т 2. (3.37)
Третий центральный момент (¿= 3) характеризует асимметрию распределения случайной величины x:
п
Коэффициент асимметрии а распределения случайной величины x имеет вид:
Г = ~ X (хи "а) 3 Р и = А. (3.38)
Четвертый центральный момент (¿= 4) характеризует крутизну распределения случайной величины.
На основе сравнения значений теоретических и выборочных моментов выполняется оценивания параметров распределений случайных величин (см., Например, разделы 4 и 5).
Как отмечалось выше, в математической статистике используются два параллельных строки показателей: первый - имеет отношение к практике (это показатели выборки), второй - базируется на теории (это показатели вероятностной модели). Соотношение этих показателей представлены в табл. 3.5.
Таблица 3.5
Соотношение показателей эмпирической выборки и вероятностной модели
Таблица 3.5 продолжение
Итак, целью описательной статистики является превращение совокупности выборочных эмпирических данных на систему показателей - так называемых статистик, имеющие отношение к реально существующих объектов. Так, психологи, педагоги, другие специалисты работают в реальной сфере, объектами которой являются лица, группы лиц, коллективы, характеристиками для которых служат эмпирические показатели. Однако основная цель исследования - это получение нового знания, а знание существует в идеальной форме в виде характеристик теоретических моделей. Отсюда возникает проблема корректного перехода от эмпирических показателей реальных объектов к показателям теоретической модели. Этот переход требует анализа как общих методических подходов, так и строгих математических оснований. Принципиальную возможность здесь открывает закон больших чисел, теоретическое обоснование котором было предоставлено Якобом Бернулли (1654-1705), Пафнутием Львовичем Чебышевым (1821-1894) и другими математиками XIX в.
Вопрос. Задача.
1. Раскройте понятие случайной величины.
2. Чем отличаются дискретная и непрерывная случайные величины?
3. Из каких элементов состоит вероятностное пространство?
4. Как построить распределение дискретной случайной величины?
5. Как связаны между собой функция плотности Л (х) и функция распределения Б (х)?
6. Предоставьте геометрическую интерпретацию Интеграл Б (со) = | Л (х) сх = 1.