Ошибки при проверке статистических гипотез. Статистические критерии и критическая область

В результате проверки статистической гипотезы, основанной на данных выборки ограниченного объема, можно отклонить и принять нулевую гипотезу (соответственно выборочные данные противоречат и согласуются с Н0). Отсюда видно, что проверка статистических гипотез связана с риском принятия ошибочных решений.

Неправильное решение может быть принято в двух случаях. В связи с этим различают ошибки двух родов.

Ошибка первого рода заключается в том, что нулевая гипотеза Н0 отклоняется, хотя в действительности она является правильной.

Ошибка второго рода заключается в том, что принимается нулевая гипотеза Н0, хотя на самом деле правильным является альтернативная гипотеза.

Если, например, установлено, что новый пестицид является лучшим, хотя на самом деле его действие не отличается от старого, это ошибка первого рода; если мы решили, что оба вида пестицидов одинаковые, тогда как на самом деле новый вид является лучшим, то допущена ошибка второго рода.

Правильные и неправильные решения могут быть получены в двух случаях, что наглядно иллюстрирует табл.7.1.

Таблица 7.1. Возможные результаты проверки нулевой гипотезы

Результат проверки Ка

Возможен состояние гипотезы, проверяется

правильная гипотеза Н0

правильная гипотеза

Н" отклоняется

Ошибка первого рода а

Правильное решение

Но принимается

Правильное решение

Ошибка второго рода р

Вероятность допустить ошибку первого рода (неоправданное отклонение Н0) получила название уровня значимости и обозначается а. Вероятность совершить ошибку второго рода (принятие неверной гипотезы Н0) обозначается г. Итак, можно сказать, что при большом числе выборок доля ошибочных выводов равен а, если правильная Н0, и равна р, если правильная.

Ошибки i И II рода по своим последствиям неравнозначны и ведут к различным материальным потерям. Поэтому выбор уровня значимости должен основываться на учете возможных потерь: чем больше эти потери, тем меньшим должен быть уровень значимости. Однако, если снижается уровень значимости, увеличивается вероятность появления ошибок второго рода. В этом смысле ошибки i И II рода являются конкурирующими.

Поскольку ошибки i И II рода практически исключить невозможно, то в каждом случае необходимо стремиться к уменьшению потерь от этих ошибок. При практической проверке гипотез стремятся к тому, чтобы за ошибку И принять ту из возможных ошибок, сопряженная с более серьезными последствиями на практике.

Уровень значимости устанавливается самим исследователем в зависимости от характера и важности задач, их решают (по так называемому принципу практической уверенности). Уровень значимости представляет собой ту минимальную вероятность, начиная с которой можно признать событие практически невозможной. Можно пользоваться стандартными значениями а= 0,10; 0,05; 0,01; 0,001; 0,0001 и др. А чаще всего устанавливают на уровне 0,05 и 0,01. При более ответственных решениях а повышают до 0,001. Уровень значимости, например, а = 0,05, означает, что в среднем в 5 случаях из 100 есть риск допустить ошибку И рода, т.е. отвергнуть правильную гипотезу (Но).

Устанавливая определенный уровень значимости, исследователь контролирует вероятность ошибки И рода: чем он ниже, тем чаще Н0 будет признаваться правильным. Однако, как было указано выше, снижение уровня значимости ведет к появлению ошибок второго рода. В большинстве случаев единственным путем одновременного уменьшения вероятности появления ошибок двух родов является увеличение численности выборки.

Для проверки нулевой гипотезы и принятия заключения о совместимости выборочных данных с выдвинутой гипотезой используют специальные статистические критерии, что является сводом правил, по которым проверяемую гипотезу либо принимают, либо отклоняют. Иначе говоря, критерий определяет те свойства, которыми должны обладать выборочные данные, чтобы гипотеза могла быть принята или отклонена.

Для каждого вида гипотез, проверяемых разработаны специальные критерии, среди которых чаще всего используются и-критерии нормального распределения и распределения Стьюдента, критерий Фишера-Снедекора, %2(хи-квадрат) распределения Пирсона и др.

Статистические критерии, используемые для проверки статистических гипотез, бывают двух видов: параметрические и непараметрические.

Параметрическими называют критерии, которые основываются на предположении, что распределение случайной величины в совокупности подчинен некоторому известному закону (например, нормальному, біномінальному, Пуассона). К таким критериям относятся критерии ., Б, %2 и др.

Непараметричними (порядковыми) называют критерии, использование которых не связано со знанием закона распределения случайной величины, их можно применять и тогда, когда исследуемый распределение значительно отличается от нормального. К таким критериям относятся, в частности, критерий знаков Вилкоксона, Уайта, Манна-Уитни и др.

Параметрические критерии более эффективны по сравнению с непараметричними. Однако они могут быть использованы для совокупностей, которые имеют нормальный или близкий к нормальному распределение. Непараметрические критерии могут быть использованы при любой форме распределения. Единственным условием их применения является взаимная независимость данных наблюдения.

В множестве возможных значений выбранного критерия можно выделить два подмножества не пересекаются, одна из которых содержит значения критерия, а вторая - нет. Первое подмножество называется критической областью, , а вторая областью допустимых значений.

Критической областью называют те значения критерия, при которых нулевая гипотеза отклоняется. Областью допустимых значений (областью принятия Н0) называют совокупность значений используемого критерия, при которых нулевая гипотеза принимается.

Точки, отделяющие критическую область от области допустимых значений, называют критическими точками.

Различают одностороннюю и двустороннюю критические области.

Односторонней называют правостороннюю или левостороннюю критическую область. Эти области определяются такими неровностями: для правосторонней критической области к > акр, где акр - положительное число, для левосторонней к < акр - где акр - отрицательное число.

Двусторонняя критическая область определяется неровностями к < аь к > а2, где а2 > аь или коротко |к| > акр, где акр > 0.

Выбор односторонней или двусторонней критической области зависит от конкретных условий и цели задач, которые решаются. Например, при альтернативной гипотезе На : xi Ф х2 следует пользоваться двусторонней критической областью, а при гипотезах На : xi > х2 и На : Xi < х2 - односторонней (в соответствии правосторонним и левосторонним) критической областью.

Критическую область целесообразно строить так, чтобы она наилучшим образом отличала нулевую от альтернативной гипотезы.

Критерий проверки гипотезы должен быть подобран так, чтобы риск допущения ошибок был минимальным. При этом очень важно определить вероятность того, что не будет допущена ошибка II рода. Эта вероятность характеризует чувствительность критерия к ошибкам II рода и получила название мощности критерия.

Мощностью критерия называется вероятность отклонения испытуемой гипотезы Н0, когда правильным является альтернативная гипотеза На(1-|3). Следовательно, мощность критерия есть вероятность того, что не будет допущена ошибка II рода. Конечно, желательно иметь мощный критерий, потому что это обеспечит минимальную вероятность допущения ошибки II рода. Поэтому из всех возможных критериев следует выбирать самый мощный.

Мощность (чувствительность) критерия может быть повышена двумя способами: а) увеличением уровня значимости. Однако этот путь не совсем приемлем, так как необоснованно повышается вероятность ошибок И рода; б) увеличением численности выборки.

При формулировке выводов по результатам проверки гипотезы руководствуются таким принципом (правилом): если фактическое значение критерия попадает в критическую область, то Н0 отклоняют, если же фактическое значение критерия принадлежит области допустимых значений, то Н0 принимают.

Для каждого критерия составлены специальные таблицы, по которым находят его табличное значение (критические точки), отделяющие критическую область от области допустимых значений. Найденное табличное значение критерия сравнивают с его фактическим значением. Если фактическое значение критерия, определенное по данным выборки, будет больше табличного значения, то нулевую гипотезу следует отклонить и принять альтернативную гипотезу. Если же фактическое значение критерия будет меньше или равно табличному, то делается вывод о согласии данных наблюдения с нулевой гипотезой, то есть основания для отказа от Н0 нет и поэтому ее надо принять.

Если, например, в опыте проверяют влияние любого фактора на результативный признак с помощью X - критерия Стьюдента, то выводы формулируются так. Если Хф^ > Ха, то нулевую гипотезу (Н0 : фактор не влияет на результативный признак) отклоняют, а влияние фактора на результативный признак вероятен, существенный. Если же проверяют достоверность разницы между средними двух или нескольких малых выборок, то в этом случае (Хфщ^ > Ха) говорят, что различия между средними настолько значительные, что они не могут быть результатом случайного варьирования выборочных данных, поэтому они должны быть признаны существенными, существенными.

в ситуации, когда окажется, что Хфщ^ < Ха , делают обратные выводы: нулевая гипотеза (Н0: фактор не влияет на результативный признак) принимается, влияние фактора на результативный признак, несущественный, недостоверен, а сама разница между средними лежит в границах возможных случайных колебаний, а поэтому она несущественна, невірогідна.

При этом следует иметь в виду, что согласие с нулевой гипотезой не доказывает ее абсолютной справедливости. Это лишь свидетельство о необходимости дальнейшей ее проверки, в том числе путем увеличения объема выборки или пока более убедительные исследования не позволят сделать противоположный вывод. Поэтому при формулировке окончательных выводов в этом случае более правильно говорить о том, что данные наблюдения не противоречат нулевой гипотезе и, следовательно, не дают основания для ее отклонения.

 
< Пред   СОДЕРЖАНИЕ   След >