Меню

Сравнение средних значений двух нормально распределенных генеральных совокупностей



Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых известны (независимые выборки)

Пусть генеральные совокупности Х и У распределены нормально, причем их дисперсии известны (например, из предшествующего опыта или найдены теоретически). По независимым выборкам, объемы которых соответственно равны n и m, извлеченным из этих совокупностей, найдены выборочные средние и .

Требуется по выборочным средним при заданном уровне значимости α проверить нулевую гипотезу, состоящую в том, что генеральные средние (математические ожидания) рассматриваемых совокупностей равны между собой, т. е.

Учитывая, что выборочные средние являются несмещенными оценками генеральных средних (см. гл. XV, § 5), т. е. М ( ) = М (X) и М ( ) = М (Y), нулевую гипотезу можно записать так:

Н:М( )=М( ).

Таким образом, требуется проверить, что математические ожидания выборочных средних равны между собой. Такая задача ставится потому, что, как правило, выборочные средние оказываются различными. Возникает вопрос: значимо или незначимо различаются выборочные средние?

Если окажется, что нулевая гипотеза справедлива, т. е. генеральные средние одинаковы, то различие выборочных средних незначимо и объясняется случайными причинами и, в частности, случайным отбором объектов выборки.

Например, если физические величины А и В имеют одинаковые истинные размеры, а средние арифметические и результатов измерений этих величин различны, то это различие незначимое.

Если нулевая гипотеза отвергнута, т. е. генеральные средние неодинаковы, то различие выборочных средних значимо и не может быть объяснено случайными причинами, а объясняется тем, что сами генеральные средние (математические ожидания) различны. Например, если среднее арифметическое результатов измерений физической величины А значимо отличается от среднего арифметического результатов измерений физической величины В, то это означает, что истинные размеры (математические ожидания) этих величин различны.

В качестве критерия проверки нулевой гипотезы примем случайную величину

,

Эта величина случайная, потому что в различных опытах и принимают различные, наперед неизвестные значения.

Пояснение. По определению среднего квадратического отклонения, .

На основании свойства 4 (см. гл. VIII, § 5), D( )=D( )+D( ).

По формуле (*) (см. гл. VIII, § 9), D( )=D(X)/n, D( )=D(Y)/m.

.

Критерий Z—нормированная нормальная случайная величина. Действительно, величина Z распределена нормально, так как является линейной комбинацией нормально распределенных величин и ; сами эти величины распределены нормально как выборочные средние, найденные по выборкам, извлеченным из нормальных генеральных совокупностей; Z — нормированная величина потому, что М (Z) = 0; при справедливости нулевой гипотезы σ(Z)==1, поскольку выборки независимы.

Критическая область строится в зависимости от вида конкурирующей гипотезы.

Первый случай. Нулевая гипотеза Н: М(X) = М (Y). Конкурирующая гипотеза Н1: М(Х)≠М(У).

В этом случае строят двустороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости α.

Наибольшая мощность критерия (вероятность попадания критерия в критическую область при справедливости конкурирующей гипотезы) достигается тогда, когда «левая» и «правая» критические точки выбраны так,что вероятность попадания критерия в каждый из двух интервалов критической области равна α/2:

Читайте также:  Сравнение цикория с кофе

Поскольку Z—нормированная нормальная величина, а распределение такой величины симметрично относительно нуля, критические точки симметричны относительно нуля.

Таким образом, если обозначить правую границу двусторонней критической области через zкр, то левая граница равна— zкр (рис. 25).

Итак, достаточно найти правую границу, чтобы найти саму двустороннюю критическую область Z zкр и область принятия нулевой гипотезы (—zкр, zкр).

Покажем, как найти zкр —правую границу двусторонней критической области, пользуясь функцией Лапласа Ф(z). Известно, что функция Лапласа определяет вероятность попадания нормированной нормальной случайной величины, например Z, в интервал (0, z):

В силу (*) и (**) получим

Отсюда заключаем: для того чтобы найти правую границу двусторонней критической области (zкр), достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное (1—α)/2. Тогда двусторонняя критическая область определяется неравенствами

или равносильным неравенством |Z| > zкр, а область принятия нулевой гипотезы—неравенством — zкр zкр —нулевую гипотезу отвергают.

Пример 1. По двум независимым выборкам, объемы которых соответственно равны n==60 и m =50, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние =1250 и =1275. Генеральные дисперсии известны: D(X)=120, D(У)==100. При уровне значимости 0,01 проверить нулевую гипотезу Н: М(Х) = М(Y), при конкурирующей гипотезе Н1: М (Х) ≠ М (Y).

Решение. Найдем наблюдаемое значение критерия:

.

По условию, конкурирующая гипотеза имеет вид М (Х) ≠ М (Y), поэтому критическая область—двусторонняя. Найдем правую критическую точку:

По таблице функции Лапласа (см. приложение 2) находим zкр = 2,58. Так как | Zнабл | > zкр —нулевую гипотезу отвергаем. Другими словами, выборочные средние различаются значимо.

Второй случай. Нулевая гипотеза Н: М (X) = М (Y). Конкурирующая гипотеза Н1: М (X) > М (Y).

На практике такой случай имеет место, если профессиональные соображения позволяют предположить, что генеральная средняя одной совокупности большегенеральной средней другой. Например, если введено усовершенствование технологического процесса, то естественно допустить, что оно приведет к увеличению выпуска продукции. В этом случае строят правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости (рис. 26):

Покажем, как найти критическую точку с помощью функции Лапласа. Воспользуемся соотношением (***):

В силу (**) и (****) имеем

Отсюда заключаем: для того чтобы найти границу правосторонней критической области (zкр), достаточно найти значение аргумента функции Лапласа, которому соответствует значение функции, равное (1—2α)/2. Тогда правосторонняя критическая область определяется неравенством Z > zкр, а область принятия нулевой гипотезы — неравенством Z М (Y), надо вычислить наблюдавшееся значение критерия и по таблице функции Лапласа найти критическую точку из равенства Ф(zкр) = (1-2α)/2.

Читайте также:  Хонор редми нот 8 про сравнить с редми 9 про

Если Zнабл zкр —нулевую гипотезу отвергают.

Пример 2. По двум независимым выборкам, объемы которых соответственно равны n =10 и m ==10, извлеченным из нормальных генеральных совокупностей, найдены выборочные средние =14,3 и = 12,2. Генеральные дисперсии известны: D(Х)==22, D(Y)=18. При уровне значимости 0,05 проверить нулевую гипотезу Н: М (X) = М (Y), при конкурирующей гипотезе Н1: М (X) > М (Y).

Решение. Найдем наблюдаемое значение критерия:

.

По условию, конкурирующая гипотеза имеет вид М (X) > М (Y), поэтому критическая область—правосторонняя.

По таблице функции Лапласа находим zкр = 1,64. Так как Zнабл М (Y).

В этом случае строят левостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости (рис. 27):

Р(Z 0, для которой Р (Z > zкр) = α,’ т. е. z’кр = — zкр. Таким образом, для того чтобы найти точку z’кр, достаточно сначала найти «вспомогательную точку» zкр так, как описано во втором случае, а затем взять найденное значение со знаком минус. Тогда левосторонняя критическая область определяется неравенством Z — zкр.

Правило 3. При конкурирующей гипотезе Н1: М (X) > М (Y) надо вычислить Zнабл и сначала по таблице функции Лапласа найти «вспомогательную точку» zкр по равенству Ф(zкр = (1—2α)/2, а затем положить z’кр = — zкр

Если Zнабл -zкр —нулевую гипотезу отвергают.

Пример 3. По двум независимым выборкам, объемы которых соответственно равны n==50 и m ==50, извлеченнымиз нормальных генеральных совокупностей, найдены выборочные средние ==142 и =150. Генеральные дисперсии известны: D(Х)=28,2, D(Y)==22,8. При уровне значимости 0,01 проверить нулевую гипотезу Н: М (X) = М (Y), при конкурирующей гипотезе Н1: М (X) > М (Y).

Решение. Подставив данные задачи в формулу для вычисления наблюдаемого значения критерия, получим Zнабл = — 8.

По условию, конкурирующая гипотеза имеет вид М (X)

Источник

Сравнение двух средних генеральных совокупностей

1) Генеральные совокупности Х и Y распределены нормально, причем известны их дисперсии. Из этих генеральных совокупностей извлечены выборки объемов соответственно т и п, для которых найдены выборочные средние и . При заданном уровне значимости α проверяется нулевая гипотеза о равенстве математических ожиданий генеральных совокупностей:

Статистическим критерием для проверки этой гипотезы является нормиро-ванная нормально распределенная случайная величина

Наблюдаемое значение критерия . Вид критической области зависит от типа конкурирующей гипотезы:

а) Н1: М (Х) ≠ М (Y) – критическая область двусторонняя, zкр определяется как аргумент функции Лапласа, при котором и критическая область задается неравенством |Z| > zкр.

б) Н1: М (Х) > М (Y) – критическая область правосторонняя, zкр определяется как аргумент функции Лапласа, при котором и критическая область определяется неравенством Z > zкр.

Читайте также:  Светодиодные лампы обзор сравнение

,

имеющая при справедливости нулевой гипотезы распределение Стьюдента с k = n + m – 2 степенями свободы. Наблюдаемое значение критерия вычисляется по формуле

.

Критическая область строится в зависимости от вида конкурирующей гипотезы.

а) Н1: М (Х) ≠ М (Y) – критическая область двусторонняя, задаваемая неравенством |T| > tдвуст.кр., где tдвуст.кр.(α, k) находится из таблицы критических точек распределения Стьюдента.

б) Н1: М (Х) > М (Y) – критическая область правосторонняя, определяемая условием T > tправ.кр.. Критическая точка вновь находится по таблице критических точек распределения Стьюдента.

в) Н1: М (Х) Предположение Генеральные совокупности нормальны s1 ,s2 известны s1 ,s2 не известны: s1 = s2 Оценки по выборке Статистика К Распределение статистики К Стандартное нормальное N(0;1) Распределение Стьюдента

Пусть по двум независимым выборкам объема n1 и n2, извлеченным из нормальных генеральных совокупностей

и

требуется сравнить генеральные средние, т.е. основная гипотеза имеет вид:

H : a1 = a2 .

Если обе генеральные дисперсии известны, то используется статистика, имеющая стандартное нормальное распределение. Если же дисперсии неизвестны, то применяется статистика, имеющая распределение Стьюдента.

Пример. Имеются независимые выборки значений нормально распределенных случайных величин

Х: 2, 2, 3, 3, 4, 4, 4, 5, 5, 6 и Y: 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 5, 7, 8, 9.

Требуется проверить для уровня значимости α = 0,1 при условии равенства генеральных дисперсий нулевую гипотезу Но: М (Х) = М (Y) при конкурирующей гипотезе Н1: М (Х) ≠ М (Y).

Объемы выборок т = 10, п = 15. Вычислим выборочные средние и исправленные выборочные дисперсии: Вычислим наблюдаемое значение критерия: Критическая область – двусторонняя, tдвуст.кр.(0,1; 23) = 1,71 (см. [2], приложение 6). Итак, |Tнабл |

Сформулируем основную и альтернативную гипотезы.

H : a1 = a2 или – генеральные средние двух нормально распределенных совокупностей равны (предприятия двух обследованных групп относятся к одному типу предприятий; выборочные средние отличаются незначимо; средняя производительность в двух группах одинакова).

– генеральные средние различны (предприятия двух групп относятся к разному типу предприятий; средняя производительность труда в двух группах различна).

Так как генеральные дисперсии известны, то для проверки гипотезы используем статистику, имеющую нормальное стандартное распределение (табл. 9). Ее наблюдаемое значение равно

.

Альтернативная гипотеза двусторонняя, поэтому критическое значение Ккр находим по таблице значений функции Лапласа из соотношения:

, откуда Ккр = 1,96 и –Ккр = – 1,96. Область допустимых значений основной гипотезы . Наблюдаемое значение лежит за пределами этого интервала и не является допустимым (принадлежит критической области) на заданном уровне значимости. Основная гипотеза отвергается в пользу альтернативной: полученное различие средних показателей производительности труда в группах неслучайно, имеется два типа предприятий с различной средней производительностью труда.

Ответ. Имеется два типа предприятий с различной средней производительностью труда.◄

Источник