Меню

Статистические параметры обработки измерений



Статистическая обработка результатов многократных измерений

Прямые многократные измерения делятся на равно- и нерав­ноточные. Равноточными называются измерения, которые производятся средствами измерения одинаковой точности по од­ной и той же методике при неизменных внешних условиях. При равноточных измерениях средние квадратические отклонения (СКО) результатов всех рядов измерений равны между собой.

Задача обработки результатов многократных измерений за­ключается в нахождении оценки измеряемой величины и довери­тельного интервала, в котором находится её истинное значение. Обработка должна проводиться в соответствии с ГОСТ 8.207-76 «ГСИ. Прямые измерения с многократными наблюдениями. Ме­тоды обработки результатов наблюдений. Общие положения».

Исходной информацией для обработки является ряд из п > 4 результатов измерения х1, х2, x3, . xп из которых ис­ключены известные систематические погрешности — выборка. Число п зависит как от требований к точности получаемого ре­зультата, так и от реальной возможности выполнять повторные измерения.

Последовательность обработки результатов прямых много­кратных измерений состоит из ряда этапов.

1-й этап: определение точечных оценок закона распределения результатов измерений. На этом этапе определяются:

— среднее арифметическое значение измеряемой величины по формуле

, (3.1)

где Xi – результат i-го единичного измерения; n – число единичных измерений в ряду.

Величина X, полученная в одной серии измерений, является случайным приближением к Xист. Для оценки ее возможных отклонений от Xист (случайной погрешности среднего арифметического значения результата измерений одной и той же величины в одном ряду измерений) определяют среднюю квадратичную погрешность (СКП)

, (3.2)

которая получена из ряда равноточных измерений.

Для оценки рассеяния единичных результатов измерений в ряду равноточных измерений одной и той же физической величины около среднего их значения используют СКП:

, при n

Первым шагом при идентификации закона распределения яв­ляется построение по исправленным результатам измерения хi, где i = 1, 2. п, вариационного ряда (упорядоченной выборки), в котором результаты измерения (или их отклонения от среднего арифметического) располагают в порядке возрастания от xmin до xmax. Далее этот ряд разбивается на оптимальное число т, как правило, одинако­вых интервалов группирования длиной, которая вычисляется по формуле:

где m – число интервалов, находящееся в пределах от mmin = 0,55 п 0,4 до mmax = 1,25 n 0,4 .

Искомое значение т должно быть нечётным, так как при чётном т в ост­ровершинном или двухмодальном симметричном распределении результатов измерения в центре гистограммы оказываются два равных по высоте столб­ца и середина кривой распределения искусственно уплощается. В случае, если гистограмма распределения явно двухмодальная, число столбцов может быть увеличено в 1,5—2 раза, чтобы на каждый из двух максимумов приходилось примерно по т интер­валов. Полученное значение длины интервала группирования h всегда округляют в большую сторону, иначе последняя точка окажется за пределами крайнего интервала.

Далее определяют интервалы группирования эксперименталь­ных данных в виде x…x1 ; x1…x2 ; …; xk-1…xk. и подсчитывают число попаданий nk результатов измерения в каждый интервал группирования. Сумма этих чисел должна равняться числу измерений. По полученным значениям рассчитывают вероятности попадания результатов из­мерения (частоты) в каждый из интервалов группирования по формуле Pk=nk/n и кумулятивную (накопленную) частоту:

, (3.6)

где k –номер строки в табл. 3.1 с результатами расчетов.

Результаты расчетов Таблица 3.1

№ строки интервал Число наблюдений nk Частота Pk Кумулятивная частота Fk
x…x1 n1 n1/n n1/n
x1…x2 n2 n2/n (n1+n2)/n
…. …. ….
k xk-1…xk nk nk/n (n1+n2+..+nk)/n

Проведенные расчёты позволяют построить гистограмму, по­лигон и кумулятивную кривую. Используем данные второго, четвёртого и пятого столбцов таблицы. Для построения гистограммы по оси результатов наблюдений х (рис. 3.3а) откладываются интерва­лы группирования в порядке возрастания номеров и на каждом интервале строится прямоугольник высотой рk. При увеличении числа интервалов и, со­ответственно, при уменьшении их длины гистограмма всё более приближается к гладкой кривой-графику плотности распределе­ния вероятности. Следует отметить, что в ряде случаев произво­дят расчётное симметрирование гистограммы.

Полигон представляет собой ломаную кривую, соединяющую середины верхних оснований каждого столбца гистограммы (рис. 3.3а). Он более наглядно, чем гистограмма, отражает форму кривой распределения. За пределами гистограммы справа и слева остаются пустые интервалы, в которых точки, соответствующие их серединам, лежат на оси абсцисс. Эти точки при построении полигона соединяют между собой отрезками прямых линий. В результате совместно с осью х обра­зуется замкнутая фигура, площадь которой пропорциональна числу наблюдений п.

Кумулятивная кривая — это график статистической функции распределения. Для её построения по оси результатов наблюде­ний х (рис. 3.3б) откладывают интервалы группирования в порядке возраста­ния номеров и на каждом интервале строят прямоугольник высотой­ Fk.

Полигон (а) и кумулятивная кривая (б)

По виду построенных зависимостей может быть оценен закон распределения результатов измерения.

3-и этап: оценка закона распределения по статистическим кри­териям и идентификация формы распределения результатов измерения. В качестве способа оценки близости распределения выборки экспериментальных данных к принятой аналитической модели закона распределения используются критерии согласия. Известен целый ряд критериев согласия, предложенных разными авторами. При числе наблюдений п > 50 для идентификации зако­на распределения используется критерий Пирсона или критерий Мизеса — Смирнова. При числе наблюдений 50 > п > 15 для проверки нормальности закона распределения применяется со­ставной критерий (d-критерий), приведенный в ГОСТ 8.207 — 76. При числе наблюдений п 50) и заключается в вычислении величины c 2 (хи-квадрат):

(3.7)

где ni;, Ni — экспериментальные и теоретические значения час­тот в i-м интервале разбиения; т — число интервалов разбиения.

При n → ∞ случайная величина c 2 имеет распределе­ние Пирсона с так называемым числом степеней свободы v = т — 1 — r, где r —число определяемых по статистике параметров, необходимых для совмещения модели и гистограммы. Для нормального закона распределения r = 2, так как закон однозначно характеризуется указанием двух его параметров — математического ожидания и СКП.

Если бы выбранная модель в центрах всех т столбцов совпа­дала с экспериментальными данными, то все т разностей (пi — Ni) были бы равны нулю, а следовательно, и значение крите­рия также было бы равно нулю. Таким образом, c 2 есть мера суммарного отклонения между моделью и экспериментальным распределением.

Критерий c 2 не инвариантен числу столбцов и существенно возрастает с увеличением их числа. Поэтому для использования его при разном числе столбцов составлены таблицы квантилей распределения c 2 , входом в которые служит число степеней свободы v. Чтобы совместить мо­дель, соответствующую нормальному закону, с гистограммой, необходимо совместить координату центра, а для того, чтобы ширина модели соответствовала ширине гистограммы, её нужно задать как r=2 и V=т—3.

Если вычисленная по опытным данным мера расхождения c 2 меньше определённого из таблицы значения c 2 q , то гипотеза о совпадении экспериментального и выбранного теоретического распределений принимается. Это не значит, что гипотеза верна. Можно лишь утверждать, что она правдоподобна, т.е. она не противоречит опытным данным. Если же c 2 выходит за грани­цы доверительного интервала, то гипотеза отвергается как противоречащая опытным данным.

Методика определения соответствия экспериментального и принятого законов распределения заключается в следующем: оп­ределяют оценки среднего арифметического значения и средней квадратической погрешности S по формулам (3.1) … (3.4); группируют результаты многократных наблюдений по интервалам длиной h, число которых опреде­ляют так же, как и при построении гистограммы; для каждого интервала разбиения определяют его центр хiо и подсчитывают число наблюдений пi, попавших в каждый интервал; вычисляют число наблюдений для каждого из интервалов, теоретически су­ществующее в выбранной аналитической модели распределения. Для этого сначала от реальных середин интервалов хi произво­дят переход к нормированным серединам . Затем для каждого значения zi с помощью аналитической мо­дели находят значение функции плотности вероятностей f(zi). Например, для нормального закона значение функции плотно­сти вероятностей равно:

По найденному значению f (zi) определяют ту часть Ni имеющихся наблюдений, которая теоретически должна быть в каждом из интервалов

,

где п — общее число наблюдений; если в какой-либо интервал теоретически попадает меньше пяти наблюдений, то в обеих гистограммах его соединя­ют с соседним интервалом. После этого определяют число степе­ней свободы v = т — 1 — r, где т — общее число интервалов. Если было произведено укрупнение, то т — число интервалов после укрупнения; по формуле (3.7) определяют показатель разно­сти частот c 2 , выбирают уровень значимости критерия q, который должен быть небольшим. По уровню значимости и числу сте­пеней свободы v по табл. 3.2 находят границу критической об­ласти c 2 q такую, что Р c 2 q> = q. Вероятность того, что полученное значение c 2 превышает c 2 q , равна q и мала. По­этому если оказывается, что c 2 >c 2 q, то гипотеза о совпадении экспериментального и теоретического законов распределения отвергается. Если же c 2 2 q то гипотеза принимается.

Читайте также:  Укажите фигуры которые будут подобны при любых значениях их линейных измерений

Значения c 2 q при различном уровне значимости

v c 2 q при уровне значимости q, равном
0,99 0,95 0,9 0,8 0,5 0,2 0,1 0,05 0,02
0,02 0,10 0,21 0,45 1,39 3,22 4,61 5,99 7,82
0,30 0,71 1,06 1,65 3,36 5,99 7,78 9,49 11,67
0,87 1,63 2,20 3,07 5,35 8,56 10,65 12,59 15,03
1,65 2,73 3,49 4,59 7,34 11,03 13,36 15,51 18,17
2,56 3,94 4,87 6,18 9,34 13,44 15,99 18,31 21,16
3,57 5,23 6,30 7,81 11,34 15,81 18,55 21,03 24,05
4,66 6,57 7,79 9,47 13,34 18,15 21,06 23,69 26,87
5,81 7,96 9,31 11,20 15,34 20,46 23,54 26,30 29,63
8,26 10,85 12,44 14,58 19,34 25,04 28,41 31,41 35,02
11,52 14,61 16,47 18,94 24,34 30,68 34,38 37.65 41,57
14,95 18,46 20,60 23,36 29,34 36,25 40,26 43,77 47,96

Чем меньше q, тем больше значение c 2 q (при том же числе степеней свободы v), тем легче выполняется условие c 2 2 q и принимается проверяемая гипотеза. Не рекомендуется принимать 0,02£q£ 0,1.

4-й этап: определение доверительных границ случайной по­грешности. Если удалось идентифицировать закон распределения результатов измерения, то с его использованием находят квантильный множитель tp при заданном значении доверительной вероятности Р. В этом случае доверительные границы случайной погрешности имеют вид:

. (3.8)

Обычно задаются доверительной вероятностью, равной одной из следующих величин: 0,90; 0,95; 0,99; 0,999, что соответствует значениям tp, равным 1,645; 1,96; 2,576 и 3,291.

5-й этап: запись результата измерения. Результат измерения записывается в виде х = ± Dр при доверительной вероятности Р.

При отсутствии данных о виде функции распределения, составляющих погрешности, результаты измерения представляют в виде , S, п, Θ при доверительной вероятности Р.

Источник

Статистическая обработка результатов измерений

1 Министерство образования Российской Федерации МАТИ Российский Государственный Технологический Университет им. К. Э. Циолковского. Кафедра «Высшая математика» Статистическая обработка результатов измерений Методические указания к курсовому проектированию по курсу «Математическая статистика» Составители: И. Ф. Заварзина И. А. Данилина А. С. Ионова Москва 00

3 I. Задачи математической статистики При изучении курса теории вероятностей предполагалось, что вероятности наступления отдельных событий известны. Считались известными законы распределения случайных величин или их числовые характеристики. Как правило, на практике вероятности наступления событий, законы распределения случайных величин или параметры этих законов распределения неизвестны. Для их определения (оценивания) необходимо производить эксперимент, специальные испытания. При обработке эксперимента статистическими методами основные понятия теории вероятностей выступают как некоторые модели реальных закономерностей. Основой статистических методов являются экспериментальные данные, часто называемые статистическими данными. Одним из основных методов статистического наблюдения является выборочный метод. Рассмотрим основные понятия этого метода. II. Генеральная и выборочная совокупность Пусть для исследования закономерностей случайного явления произведено n опытов, в результате которых получен ряд наблюдений x, x. x n. Требуется обработать этот ряд статистически. Для этого надо вначале построить математическую модель ряда наблюдений, т.е. указать, какие величины случайны, какие не случайны, какие зависимы, какие не зависимы и т.д. Ставится задача оценить функцию распределения F(x) исследуемой СВ X, т.е. построить уточненную вероятностную модель ряда наблюдений x, x. x n, которая бы отражала в себе основные статистические особенности этого ряда. Наиболее точные сведения о случайной величине X можно получить, производя максимально возможное количество измерений этой случайной величины. Определение. Генеральной совокупностью называется совокупность всех мыслимых наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий измерений. Число членов, входящих в генеральную совокупность, называют объемом генеральной совокупности. Определение. Выборочной совокупностью или просто выборкой объема n называется совокупность n объектов, отобранных из исследуемой генеральной совокупности. Определение 3. Метод, состоящий в том, что на основании характеристик и свойств выборки х, х. х n делаются заключения о 3

4 числовых характеристиках и законе распределения СВ Х, называется выборочным методом. Для того чтобы сведения о законах распределения СВ Х были объективны, необходимо, чтобы выборка была репрезентативной, т.е. представительной. Существуют специальные методы для этого. III. Статистический ряд. Статистический закон распределения случайной величины Предположим, что изучается дискретная или непрерывная случайная величина, закон распределения которой неизвестен. Для оценки закона распределения этой случайной величины и его числовых характеристик производится ряд независимых измерений x, x. x n. Статистический материал представляют в виде таблицы, состоящей из двух строк, в первой из которых даны номера измерений, а во второй результаты измерений. i номер измерения. x i результат измерений x х. х n Такую таблицу называют простым статистическим рядом. Для того чтобы правильно оценить закон распределения СВ Х, производят группировку данных. Если X дискретная СВ, то наблюденные значения располагаются в порядке возрастания и подсчитываются частоты m i или частости m i /n появления одинаковых значений СВ Х. В результате получаем сгруппированные статистические ряды: х i x х. х k m i m m. m k к Контроль: m i = n. i = х i х х. х n m i /n m /n m /n. m k /n k Контроль: m i /n =. i = Если изучается непрерывная случайная величина, то группировка заключается в разбиении интервала наблюденных значений случайной величины на k частичных интервалов равной длины [x 0 ; x [, [x ; x [, [x ; x 3 [. [x k- ;x k ] и подсчете частоты или частости m i /n попадания наблюденных 4

5 значений в частичные интервалы. Количество интервалов выбирается произвольно, обычно не меньше 5 и не больше 5. В результате составляется интервальный статистический ряд следующего вида: СВХ [x 0 ; x [ [x ; x [. [x k- ;x k ] m i /n m /n m /n. m k /n k Контроль: m i /n =. i = Определение. Перечень наблюденных значений СВ Х (или интервалов наблюденных значений) и соответствующих им частостей m i /n называется статистическим законом распределения случайной величины. Статистические законы позволяют визуально произвести оценку закона распределения исследуемой случайной величины. IV. Эмпирическая функция распределения Эмпирической функцией распределения случайной величины X называют функцию F*(x), определяющую для каждого значения x частость события (X x. Основное значение эмпирической функции распределения состоит в том, что она используется в качестве оценки функции распределения F(x) = P(X 6 = F * ( x) при x ; 5. График F*(x) изображен на рисунке. Для наглядности сгруппированные статистические ряды изображают в виде графиков и диаграмм. Наиболее распространенными графиками являются полигон и гистограмма. Полигон применяется для изображения как дискретных, так и интервальных статистических рядов, гистограмма — для изображения только интервальных рядов. Пример. Результаты исследования прочности 00 образцов бетона на сжатие представлены в виде интервального статистического ряда. интервалы прочности кг/см частоты m i частости m i /n n = m i = 00, m i /n =. i i На рисунке представлена гистограмма. На оси абсцисс откладываются частичные интервалы наблюденных значений случайной величины Х, на каждом из которых строим прямоугольник, площадь которого равна частости данного частичного интервала. Высота элементарного прямоугольника частостей равна m i /nh, где h длина интервала. Если на гистограмме частостей соединить середины верхних сторон прямоугольников, то полученная замкнутая ломаная линия образует полигон распределения частостей. 6

7 V. Основные законы распределения случайных величин, используемых в математической статистике П.. Нормальное распределение Нормальная модель распределения вероятностей играет исключительно важную роль в теории вероятностей и математической статистике. Главная особенность нормального распределения состоит в том, что оно является предельным, к которому приближаются другие распределения при соблюдении некоторых условий. Нормальные распределения часто встречаются на практике в самых различных областях. Принято считать, что все ошибки измерений, вес деталей, размер деталей, дальность полета артиллерийского снаряда и многие другие случайные величины имеют нормальное распределение. Нормальное распределение задается функцией плотности вероятности: f ( x a ) σ ( x ) = e, (5.) σ π где а математическое ожидание случайной величины Х, т.е. М (Х) = а; σ — среднее квадратичное отклонение СВ Х, т.е. D(X ) = σ (D (X) дисперсия случайной величины). Из формулы (5.) видно, что нормальная модель зависит от двух параметров а и σ, поэтому ее называют двухпараметрической моделью распределения. Если случайная величина Х имеет нормальное распределение с параметрами M(X) = a и σ = D(X ), то этот факт кратко записывают с помощью символичной записи: СВ Х N (a, σ). График функции плотности вероятности называют нормальной кривой или кривой Гаусса. Эта кривая изображена на рисунке f(x) определена при всех х R. 0. Кривая нормального распределения симметрична относительно прямой х = а Кривая Гаусса имеет максимум в точке х = а: f ( a) =. σ π 7

8 4 0. Кривая Гаусса имеет две точки перегиба: x = a — σ и x = a + σ Площадь, заключенная между кривой Гаусса и осью абсцисс, равна ; между осью абсцисс, кривой Гаусса и прямыми а ± σ равна 0, При увеличении (уменьшении) параметра σ максимальная ордината уменьшается (увеличивается), см. рис. 4. Другими словами, параметр σ характеризует форму кривой, при неизменном положении центра кривой; так как площадь под кривой Гаусса всегда равна ( f ( x) dx = ), то, если σ увеличивается, то кривая становится плоско вершинной, σ уменьшается кривая Гаусса вытягивается вверх. Параметр σ иногда называют параметром масштаба Если изменять математическое ожидании а при неизменном σ, то кривая Гаусса будет смещаться вдоль оси абсцисс, т.е. параметр а = М (Х) характеризует положение кривой при неизменной форме. Иногда параметр a называют параметром сдвига (см. рис. 5). x a Если СВ Х N (a, σ), то случайная величина U = имеет σ нормальное распределение с параметром M ( U) = 0 и σ (U) =, т.е. U N (0,). x a Поэтому случайную величину U = называют нормированной или σ стандартизованной нормальной величиной. Плотность распределения вероятностей нормированной случайной величины U имеет вид: + f ( u) = e. (5.) π Функция распределения СВ Х N (a, σ) имеет следующий вид: u F x x ( x a ) σ ( ) ( ) x = f x dx = σ π Функция распределения нормализованной случайной величины u = e dx. (5.3) t F( u) P( U 9 Тогда β a α a P( α 10 0, ν f ( χ ) = (χ ) e ν ν Γ( ) χ, если χ 0. Итак, распределение χ зависит от одного параметра ν — числа степеней свободы. Функция распределения χ имеет вид: 0, χ ν χ = χ α, υ ) =, отвечающим заданному уровню χ α,ν f ( χ ) d ( χ ) χ α, υ, при котором = α Нахождение квантиля, с геометрической точки зрения, заключается в том, чтобы выбрать такое значение χ = χ α,ν, при котором площадь заштрихованной криволинейной трапеции (см. рис 6) была бы равна α.. П. 3. Распределение Стьюдента Распределение Стьюдента (t распределение) имеет важное значение при статистических вычислениях, связанных с нормальным законом, а именно тогда, когда среднее квадратическое отклонение σ неизвестно и подлежит определению по опытным данным. Пусть Y,Y, Y. Y n независимые случайные величины, имеющие нормальное распределение с параметрами M (Y) = M (Y i ) = 0 и σ Y = σ Yi =, i =, n. 0

Читайте также:  Измерить расстояние по киеву

11 Случайная величина t = n Y n i= Y = Y i χ n n, (5.4) являющаяся функцией нормально распределенных случайных величин, называется безразмерной дробью Стьюдента. Плотность распределения случайной величины t имеет вид: f ( t) = S( t, ν ) = ν + Γ( ) t ( + ν πν Γ( ) ν ) ν +, ). ν На рис. 8 изображен график плотности распределения Стьюдента при различных степенях свободы. Замечаем, что при увеличении числа степеней свободы ν он приближается к кривой Гаусса. В статистических расчетах используются квантили t распределения t α ;ν. Значения квантилей находятся из решения уравнения: P( t > t α ) = ; ν t α ; ν f ( t) dt = α С геометрической точки зрения, нахождение квантилей том выборе значения t = t α заключается в ;ν t, при котором суммарная площадь α ;ν заштрихованных на рис. 9 криволинейных трапеций была бы равна α..

12 VI. Точечные оценки параметров нормального распределения Пусть СВ Х имеет нормальное распределение: Х N (a, σ). Параметры а, σ нормального распределения, как правило, неизвестны. С целью их определения производится эксперимент, в результате которого фиксируется n значений случайной величины Х: х, х. х n. Результаты измерения х, х. х n рассматривают как выборку объема n из бесконечной генеральной совокупности. На основании этой выборки необходимо «оценить» (найти приближенные значения) двух параметров математического ожидания а и среднего квадратического отклонения σ. Вообще говоря, по результатам выборки, какого бы большого размера она ни была, нельзя определить точные значения неизвестных параметров а и σ, но можно найти их приближенные значения оценками. a, σ, которые называются Для нахождения приближенных значений a,, неизвестных параметров а и σ нормального закона будем рассматривать функции вида: a = a( x, x. xn ), σ = σ ( x, x. x n ), которые называются выборочными функциями или статистиками. Задача оценки неизвестных параметров а и σ сводится к нахождению таких статистик a = a( x, x. xn ), σ = σ ( x, x. x n ), которые могут быть использованы для приближенного определения значений неизвестных параметров а и σ. Оценки параметров подразделяются на точечные и интервальные. Точечная оценка параметра θ (где под θ будем понимать либо а, либо σ) определяется одним числом θ =θ ( x, x. xn ). Интервальной оценкой называют оценку, которая определяется двумя числами θ и θ — концами интервала, накрывающего оцениваемый параметр θ. Можно показать, что если СВ Х N (a, σ), то точечные оценки неизвестных параметров a и σ находятся по формулам: n a = M ( x) = xi = x; (6.), n n i= ( x ) i x i= σ = S = ; (6.). n σ

13 Эти оценки обладают свойствами несмещенности, состоятельности и эффективности. VII. Интервальные оценки параметров нормального распределения Пусть Х N (a,σ), причем а и σ неизвестны. Для нахождения точечных оценок а и σ из генеральной совокупности извлечена выборка объемом n. Пусть на основании этой выборки найдены точечные несмещенные оценки неизвестных параметров а и σ по формулам (6.) и (6.). Точечные оценки, найденные по выборке объемом n, не позволяют непосредственно ответить на вопрос, какую ошибку мы допускаем, принимая вместо точного значения неизвестного параметра а или σ его приближенные σ значения a,. Поэтому во многих случаях выгоднее пользоваться интервальной оценкой, основанной на определении некоторого интервала, внутри которого с определенной вероятностью находится неизвестное значение параметра а (или σ). Пусть найденная по результатам выборки объема n статистическая характеристика θ = θ x, x. x ) является точечной оценкой неизвестного ( n параметра θ. Чем меньше разность θ θ, тем лучше качество оценки, тем она точнее. Таким образом, положительное число ε характеризует точность оценки θ θ 14 оценки задается заранее. Наиболее часто полагают (-α) = 0,95; 0,99; 0,9973. Доверительная вероятность точечной оценки показывает, что при извлечении выборки объема n из одной и той же генеральной совокупности в (-α) 00% случаях параметр θ будет накрываться данным интервалом. 4 Пусть вероятность того, что θ θ 15 (-α) 0,90 0,95 0,99 0,9973 0,999 5 u α,64,96,58 3,00 3,37 Анализируя формулу доверительного интервала, задаваемого системой неравенств (7.4), можно заметить, что: а) увеличение объема выборки n приводит к уменьшению длины доверительного интервала; б) увеличение доверительной вероятности (-α) приводит к увеличению σ длины доверительного интервала, т.е. к уменьшению точности ε = u α ; n в) если задать точность ε и доверительную вероятность (-α), то из σ соотношения ε = u α можно найти минимальный объем выборки, который n обеспечивает заданную точность. Если же σ неизвестно, тогда доверительный интервал, накрывающий неизвестное математическое ожидание а СВ Х N (a, σ), имеет следующий вид: где t α ; n S S x tα 16 n n Значение величин γ = и γ = χ χ α ; n α ; n приведены в таблице. VIII. Примеры обработки результатов эксперимента Измерена максимальная емкость шести конденсаторов, выбранных из большого числа конденсаторов. Получены следующие результаты (в пф) 4,45; 4,40; 4,4; 4,45; 4,38; 4,4. Предполагая, что результаты измерений имеют нормальное распределение, требуется: ) найти точечные несмешанные оценки математического ожидания и среднего квадратического отклонения; ) записать плотность вероятности и функцию распределения СВ Х (емкости конденсаторов); 3) найти доверительный интервал, накрывающий математическое ожидание емкости конденсаторов с заданной доверительной вероятностью (-α) = 0,95, считая σ неизвестной; 4) найти доверительный интервал, накрывающий неизвестное среднее квадратичное отклонение σ с заданной доверительной вероятностью (-α) = 0,95; 5) принимая доверительную вероятность Р = -α = 0,99, найти n предельную погрешность, с которой x = x i оценивает n i= математическое ожидание а емкости конденсаторов; 6) найти минимальное число конденсаторов, емкость которых надо измерить, чтобы с доверительной вероятностью (-α) = 0,95 можно было бы утверждать, что, принимая среднее арифметическое x за математическое ожидание емкости конденсаторов, мы совершаем погрешность, не превышающую ε = 0,5σ, считая σ = S; 7) вычислить Р(4,4 17 7 6 ( x ) i x i= и σ = S = = пф. 6 ) Следовательно, плотность вероятности СВ Х (емкость конденсаторов) имеет вид: ( x 4.4) f ( x) = exp π 0.06 Функция распределения емкости конденсаторов имеет вид: x x ( x 4.4) F( x) = f ( x) dx = exp dx π 0.06 Используя нормированную функцию Лапласа x = e Φ ( ) dt, π можно записать x x x 4.4 F ( x) = + Φ = + Φ. S ) Найдем интервальные оценки параметров нормального распределения емкости конденсаторов. Для нахождения доверительного интервала, накрывающего математическое ожидание, найдем по таблице квантилей распределение Стьюдента по заданной доверительной вероятности Р = -α = 0,95 и числу степеней свободы ν = n- = 6- = 5 квантиль t = t =. 57 α 0.05;5. ; ν Вычислим предельную погрешность интервального оценивания математического ожидания S 0.08 ε = tα =.57 = 0.09 (пф). ; ν n 6 Искомый доверительный интервал, накрывающий математическое ожидание емкости конденсаторов с заданной доверительной вероятностью Р = 0,95, равен: x ε 18 доверительной вероятностью (-α) = 0,95, найдем по заданной доверительной вероятности 0,95 и числу степеней свободы ν = n-= 6- = 5 два числа γ и γ, т.е. γ = 0,64 и γ =,45. Искомый доверительный интервал равен: γ S 19 4. Найти доверительный интервал, накрывающий среднее квадратическое отклонение σ с заданной вероятностью Р = -α = 0, Принимая Р = -α = 0,99, найти предельную погрешность, с которой среднее арифметическое оценивает неизвестное математическое ожидание СВ Х. 6. Найти минимальное число измерений, которое нужно произвести, чтобы с доверительной вероятностью Р = -α = 0,95 можно было бы утверждать, что, принимая М (Х) = x, мы совершаем погрешность, не превышающую ε = 0,S. 7. Вычислить: ( ) β x α x P α 20 IX.Критерий согласия c Предположим, что по виду гистограммы или полигона частостей или из каких — либо других соображений удается выдвинуть гипотезу о множестве функций определенного вида (нормальных, показательных, биномиальных и т. п.), к которому может принадлежать функция распределения исследуемой СВ Х. Критерий χ Пирсона позволяет производить проверку согласия эмпирической функции распределения F*(x) с гипотетической функцией распределения F(x). Для этого придерживаются следующей последовательности действий: ) на основании гипотетической функции F(x) вычисляют вероятность попадания СВ Х в частичные интервалы [ x i, x i [: p i = P( xi X 21 X. Курсовая работа Каждому студенту в соответствии со своим номером варианта требуется: ) записать исходную выборку в виде таблицы; ) построить статистический ряд; 3) записать сгруппированную выборку в виде таблицы; 4) построить график эмпирической функции распределения; 5) построить гистограмму; 6) проверить гипотезу о нормальном законе распределения случайной величины Х и записать вычисления в таблицу; 7) построить график плотности случайной величины Х. При выполнении работы принять уровень значимости α = 0,05, отрезок [4,5; 54,5], число интервалов k = 0. Варианты индивидуальных заданий приведены в таблице. i му варианту соответствуют элементы выборки, расположенные в 5 ти следующих строчках таблицы, начиная с i й (объем выборки при этом n = 50)

Читайте также:  Измерения сопротивления изоляции фундаментов

22 Порядок выполнения работы. По данной выборке объема n строится статистический ряд y y. y e n n. n e где y 23 номер интервала границы интервала середины интервалов i x i, x i+ z i m i. k эмпирические частоты 3. Строится график эмпирической функции распределения 0 x z F * ( x) = ( m mi ), при zi zk 4. Строится гистограмма фигура, состоящая из прямоугольников с m основаниями [ x i, x i +] и высотами i. nh 5. Находится выборочное среднее x = m i z i, исправленная n k выборочная дисперсия S = mi z n i= k i= i x ; исправленное выборочное среднее квадратическое отклонение S = S. 6. Проверяется гипотеза о нормальном распределении СВ Х с математическим ожиданием a = и средним квадратическим отклонением σ = S с помощью критерия χ Пирсона. Для этого вычисляют теоретические частоты попадания СВ Х в i й интервал np, где p = p< x X 24 Затем по закону уровня значимости α и числу степеней свободы ν = r-3 находится критическая точка χ по таблице квантилей распределения α,ν χ. Если χ набл. >χ α,ν, то гипотеза отвергается. Если χ набл. χ α,ν, гипотеза принимается. 7. Строится график плотности вероятности ( x) = ( x x) S e f случайной величины Х, распределенной по π S нормальному закону. Пример выполнения курсовой работы Для данной выборки объема n = 50 построим статистический ряд, где Y 25 Граница интервала x i ; x i Середины интервалов Z i Эмпирические частоты m i X = X H =.465 k = 4 S = 5.5 X H (α, k) = 9.5 r = 7 Так как X H (α, k) X H, то гипотеза о нормальном распределении принимается, результаты занесены в таблицу. I x i ; x i+ m i p i np i (m i np i ) ( mi npi np ) i 5

26 0,8 0,6 0,4 0, Эмпирическая функция распределения 0 x z F * ( x) = ( m mi ) при zi z k 6

27 График плотности вероятности СВ Х. 0,08 0,07 0,06 0,05 0,04 0,03 0,0 0,0 0 0,0307 0, , , ,0788 0, , , ,0557 0, Ряд 7

28 8 Приложение.Нормальное распределение Плотность вероятностей нормированного нормального распределения: N(0,) u. ) ( u e u f = π U ,0 0, 0, 0,3 0,4 0,5 0,6 0,7 0,8 0,9,0. 3,4,5,6,7,8,9,0. 3,4,5,6,7,8,9 3,0 3, 3, 3,3 3,4 3,5 3,6 3,7 3,8 3,9 0, , , ,

29 9.Нормальное распределение Значение функции: ). ( ) ( 0 i i u x i u u P dx e u i 30 Целые и десятичные доли u i Сотые доли u i 4,0 4,5 0,36 0, ,0 0, Распределения Стьюдента Значения t a,n удовлетворяют условию P ( t t, ν ) = S( t, ν ) dt α. α = t α, ν В таблице приведены значения квантилей t a,n в зависимости от числа степеней свободы n и вероятности a. α ν 3 4 0,40 0,30 0,0 0,0 0,050 0,05 0,00 0,005 0,00 0,0005 0,35 0,89 0,77 0,7 0,77 0,67 0,584 0,569,376,06 0,978 0,94 3,078,886,638,533 6,34,90,353,3,7 4,303 3,8,776 3,8 6,965 4,54 3,747 63,66 9,95 5,84 4,604 38,3,33 0, 7,73 636,6 3,60,94 8, ,67 0,65 0,63 0,6 0,6 0,559 0,553 0,549 0,546 0,543 0,90 0,906 0,896 0,889 0,883,476,440,45,397,383,05,943,895,860,833,57,447,365,306,6 3,365 3,43,998,896,8 5,03 3,707 3,499 3,355 3,50 5,893 5,08 4,785 4,50 4,97 6,859 5,959 5,405 5,04 4, ,60 0,60 0,59 0,59 0,58 0,54 0,540 0,539 0,538 0,537 0,879 0,876 0,873 0,870 0,868,37,363,356,350,345,8,796,78,77,76,8,0,79,60,45,764,78,68,650,64 3,69 3,06 3,055 3,0 3,977 4,44 4,05 3,930 3,85 3,787 4,587 4,437 4,38 4, 4, ,58 0,58 0,57 0,57 0,57 0,536 0,535 0,534 0,534 0,533 0,866 0,865 0,863 0,86 0,86,34,337,333,330,38,753,746,740,734,79,3,0,0,0,093,60,583,567,55,539,947,9,898,878,86 3,733 3,686 3,646 3,6 3,597 4,073 4,05 3,965 3,9 3, ,57 0,57 0,56 0,56 0,533 0,533 0,53 0,53 0,860 0,859 0,858 0,858,35,33,3,39,75,7,77,74,086,080,074,069,58,58,508,500,845,83,89,807 3,55 3,57 3,505 3,485 3,850 3,89 3,79 3,767 30

31 α ν 4 0,40 0,30 0,0 0,0 0,050 0,05 0,00 0,005 0,00 0,0005 0,56 0,53 0,857,38,7,064,49,797 3,467 3, ,56 0,56 0,56 0,56 0,56 0,53 0,53 0,53 0,530 0,530 0,856 0,856 0,855 0,855 0,854,36,35,34,33,3,708,706,703,70,699,060,056,05,048,045,485,479,473,467,46,787,779,77,763,756 3,450 3,435 3,4 3,408 3,396 3,75 3,707 3,690 3,674 3, ,56 0,56 0,55 0,55 0,530 0,59 0,58 0,57 0,854 0,85 0,849 0,848,30,303,98,96,697,684,676,67,04,0,009,000,457,43,403,390,750,704,678,660 3,385 3,307 3,6 3,3 3,646 3,55 3,495 3, ,54 0,54 0,54 0,53 0,53 0,57 0,56 0,55 0,55 0,54 0,846 0,846 0,843 0,84 0,84,9,90,86,83,8,664,660,653,648,645,990,984,97,965,960,374,365,345,334,36,639,6,60,586,576 3,95 3,74 3,3 3,06 3,090 3,45 3,389 3,339 3,30 3,9 4.c — распределение В таблице представлены значения квантилей c a,n в зависимости от числа степеней свободы n и вероятности a. α ν ,0 0,0 0,05 0,0 0,0 0,00,64 3,9 4,64 5,989 7,89 8,558 9,803,030,4 3,44 4,63 5,8 6,985 8,5 9,3 0,465,65,760 3,900,706 4,605 6,5 7,779 9,36 0,645,07 3,36 4,684 5,987 7,75 8,549 9,8,064,307 3,54 4,769 5,989 7,04 3,84 5,99 7,85 9,488,070,59 4,067 5,507 6,99 8,307 9,675,06,36 3,685 4,996 6,96 7,587 8,869 30,44 5,4 7,84 9,837,668 3,388 5,033 6,6 8,68 9,679,6,68 4,054 5,47 6,783 8,59 9,633 30,995 3,346 33,687 6,635 9,0,345 3,77 5,086 6,8 8,475 0,090,666 3,09 4,75 6,7 7,688 9,4 30,578 3,000 33,409 34,805 36,9 0, ,66 8,467 0,55,457 4,3 6,5 7,877 9,588 3,64 3,909 34,58 36,3 37,697 39,5 40,790 4,3 43,80 3

32 α ν ,0 0,0 0,05 0,0 0,0 0,00 5,038 6,7 7,30 8,49 9,559 30,675 3,795 3,9 34,07 35,39 36,50 8,4 9,65 30,83 3,007 33,96 34,38 35,563 36,74 37,96 39,087 40,56 3,40 3,67 33,94 35,7 36,45 37,65 38,885 40,3 4,337 4,557 43,773 35,00 36,343 37,659 38,968 40,70 4,556 4,856 44,40 45,49 46,693 47,96 37,556 38,93 40,89 4,638 4,980 44,34 45,64 46,963 48,78 49,588 50,89 45,35 46,797 48,68 49,78 5,79 5,60 54,05 55,476 56,893 58,30 59, Доверительные интервалы для s Нижние g и верхние g границы доверительного интервала. n γ s 33 P ν=n- γ γ γ γ γ γ γ γ ,74 0,744 0,748 0,774 0,793 0,808 0,80 0,89 0,838 0,845 0,887,499,487,475,39,336,99,7,50,33,9,5 0,76 0,765 0,768 0,79 0,80 0,84 0,835 0,844 0,85 0,858 0,897,436,46,47,344,97,65,4,,07,95,3 0,794 0,796 0,799 0,8 0,837 0,849 0,858 0,866 0,873 0,878 0,9,35,344,337,79,43,7,98,83,7,6, 0,83 0,85 0,88 0,847 0, ,879 0,886 0,89 0,897 0,95,86,79,74,8,99,79,63,5,4,33,09 33

34 F (χ ) ν = 0,8 ν = 4 0,6 ν = 0 0,4 0, χ (рис. 7) f(t) кривая нормального распределения (ν = ) 0, ν = ν = t (рис. 8) f(t) α α t α ;ν (рис. 9) t α ;ν 34

35 Литература. Чистяков В. П. Курс теории вероятности. М.: Наука, Крамер Г. Математические методы статистики. М.: Мир, Гмурман В. Е. Теория вероятностей и математическая статистика. М.: Высшая школа, Коваленко И. Н., Филиппова А. А. Теория вероятностей и математическая статистика. М.: Высшая школа, Герасимович А. И. Математическая статистика. Минск: Высшая школа, 983. Оглавление. Задача математической статистики.3. Генеральная и выборочная совокупность Статистический ряд. Статистический закон распределения случайной величины.4 4. Эмпирическая функция распределения Основные законы распределения случайных величин, используемых в математической статистике Точечные оценки параметров нормального распределения 7. Интервальные оценки параметров нормального распределения 3 8. Примеры обработки результатов эксперимента Критерий согласия χ Курсовая работа. Приложение. 9. Приложение

Источник