Меню

Статистические методы оценки результатов измерений



Статистическая обработка результатов измерений.

Статистическая обработка результатов измерений – обработка измерительной информации с целью получения достоверных данных. Разнообразие задач, решаемых с помощью измерений, определяет и разнообразие видов статистической обработки их результатов.

Задача статистической обработки результатов многократных измерений заключается в нахождении оценки измеряемой величины и доверительного интервала, в котором находится истинное значение.

Статистическая обработка используется для повышения точности измерений с многократными наблюдениями, а также определения статистических характеристик случайной погрешности.

Для прямых однократных измерений статистическая обработка менее сложна и громоздка, что значительно упрощает оценку погрешностей.

Статистическую обработку результатов косвенных измерений производят, как правило, методами, основанными на раздельной обработке аргументов и их погрешностей, и методом линеаризации.

Наиболее распространенные совместные измерения обрабатываются разными статистическими методами. Среди них широко известен и часто применяется метод наименьших квадратов.

Прямые измерения с многократными наблюдениями.

Необходимость в многократных наблюдениях некоторой физической величины возникает при наличии в процессе измерений значительных случайных погрешностей. При этом задача обработки состоит в том, чтобы по результатам наблюдений определить наилучшую (оптимальную) оценку измеряемой величины и интервал, в котором она находится с заданной вероятностью. Данная задача может быть решена способом статистической обработки результатов наблюдений, основанным на гипотезе о распределении погрешностей результатов по нормальному закону.

Порядок такой обработки должен соответствовать государственному стандарту и рекомендациям по метрологии.

Итак, рассмотрим группу из n независимых результатов наблюдений случайной величины x, подчиняющейся нормальному распределению. Оценка рассеяния единичных результатов наблюдений в группе относительно их среднего значения вычисляется по формуле:

Поскольку число наблюдений в группе, на основании результатов которых выполнено вычисление среднего арифметического, ограничено, то, повторив заново серию наблюдений этой же величины, мы получили бы новое значение среднего арифметического. Повторив многократно наблюдения и вычисляя каждый раз их среднее арифметическое значение, принимаемое за результат наблюдений (измерений), обнаружим рассеяние среднего арифметического значения.

Характеристикой этого рассеяния является средний квадрат отклонения среднего арифметического:

Среднее квадратичное отклонение среднего арифметического используется для оценки погрешности результата измерений с многократными наблюдениями.

Теория показывает, что если рассеяние результатов наблюдения в группе подчиняется нормальному закону, то и их среднее арифметическое тоже подчиняется нормальному закону распределения при достаточно большом числе наблюдений (n>50). Отсюда при одинаковой доверительной вероятности доверительный интервал среднего арифметического в ỳже, чем доверительный интервал результата наблюдений. Теоретически случайную погрешность результата измерений можно было бы свести к 0, однако практически это невозможно, да и не имеет смысла, так как при уменьшении значения случайной погрешности определяющим в суммарной погрешности становится значение не исключенных остатков систематической погрешности.

При нормальном законе распределения плотности вероятностей результатов наблюдений и небольшом числе измерений среднее арифметическое подчиняется закону распределения Стьюдента с тем же средним арифметическим . Особенностью этого распределения является то, что доверительный интервал с уменьшением числа наблюдений расширяемся по сравнению с нормальным законом распределения при этой же доверительной вероятности. В формуле для оценки доверительных границ случайной погрешности это отражается введением коэффициента tq вместо t:

Коэффициент распределения Стьюдента зависит от числа наблюдений и выбранной доверительной вероятности и находится по таблице. Например, для n=4 и =0,95 tq=3,182; n=5 при =0,95 tq=2,776; для n=10 tq=2,262; n=15 tq=2,145 при той же =0,05.

Правила обработки результатов измерения с многократными наблюдениями учитывают следующие факторы:

— обрабатывается группа из n наблюдений (то есть группа ограничена);

— результаты наблюдений могут содержать систематическую погрешность;

— в группе наблюдений могут встречаться грубые погрешности;

— распределение случайных погрешностей может отличаться от нормального.

Обработка результатов наблюдения производится в следующей последовательности:

1) Исключить известные систематические погрешности из результатов наблюдения (введением поправки);

2) Вычислить среднее арифметическое исправленных результатов наблюдений, принимаемое за результат наблюдений:

3) Вычислить оценку среднего квадратичного отклонения результата наблюдения:

4) Вычислить оценку среднего квадратичного отклонения среднего арифметического по формуле:

5) Проверить гипотезу о том, что результаты измерений принадлежат нормальному распределению.

6) Вычислить доверительные границы e случайной погрешности результата измерения при заданной вероятности P:

,

где — коэффициенты Стьюдента

7) Вычислить границы суммарной неисключенной систематической погрешности (НСП) результата измерения.

При равномерном распределении НСП границы НСП вычисляют по формуле:

,

где — граница i-той НСП, k – коэффициент, определяемый принятой доверительной вероятностью (при =0,95 =1,1); m – число неисключенных составляющих систематической погрешности.

8) Вычислить доверительные границы погрешности результата измерения.

границы погрешности результата измерения вычисляют по формуле:

,

где k – коэффициент, определяемый как

9) Записать результат измерения в регламентированной стандартом форме:

а) при симметричном доверительном интервале погрешности результата измерения , где x – результат измерения;

б) при отсутствии данных о виде функции распределения составляющих погрешности результата или при необходимости использования данных для дальнейшей обработки результатов, результат представляют в форме:

Дата добавления: 2018-06-01 ; просмотров: 4188 ; Мы поможем в написании вашей работы!

Источник

Статистическая обработка результатов измерения

Завершающей стадией количественного анализа химического состава вещества любым методом является статистическая обработка результатов измерений. Она позволяет оценить систематические и случайные погрешности измерений.

Используя приемы математической статистики, можно:

• рассчитать основные метрологические характеристики методики анализа (оценить воспроизводимость и правильность полученных данных, отбросив результаты, содержащие промахи);

• определить методом регрессивного анализа вид функциональной зависимости аналитического сигнала от концентрации (содержания) определяемого элемента;

• рассчитать метрологические характеристики параметров градуировочного графика и результатов анализа;

• представить результаты статистической обработки в виде компактных табличных данных, позволяющих оценить воспроизводимость и правильность полученных результатов;

• в случае необходимости оценить нижнюю границу определяемых содержаний вещества, предел определения (обнаружения), коэффициент чувствительности.

Расчет метрологических характеристик результатов измерений (определений) при малой выборке

При химическом анализе пищевых продуктов содержание вещества в пробе устанавливают, как правило, по небольшому числу параллельных определений (n). Для расчета погрешностей определений в этом случае пользуются методами математической статистики, разработанными для малого числа определений. Полученные результаты рассматривают как случайную (малую) выборку из некоторой гипотетической генеральной совокупности, состоящей из всех мыслимых в данных условиях наблюдений.

Для практических целей можно считать, что при числе измерений п — 20-30 значения стандартного отклонения генеральной совокупности (а) — основного параметра и стандартного отклонения малой выборки (S) близки (S = у).

Оценка воспроизводимости результатов измерений

Среднее выборки. Пусть x1, х2, . хп обозначают п результатов измерений величины, истинное значение которой р.. Предполагается, что все измерения проделаны одним методом и с одинаковой точностью. Такие измерения называют равноточными.

В теории ошибок доказывается, что при условии выполнения нормального закона при п измерениях одинаковой точности среднее арифметическое из результатов, полученных при всех измерениях, является наиболее вероятным и наилучшим значением измеряемой величины:

Это среднее значение принимают за приближенное и пишут X = м.

Единичное отклонение — это отклонение отдельного измерения от среднего арифметического:

Алгебраическая сумма единичных отклонений равна нулю:

Дисперсия, стандартное отклонение, относительное стандартное отклонение. Рассеяние результатов измерений относительно среднего значения принято характеризовать дисперсией S 2 :

или стандартным отклонением (средним квадратичным отклонением) — S:

которое обычно и приводят при представлении результатов измерений (анализа) и которым характеризуют их воспроизводимость.

Стандартное отклонение, деленное на среднее выборки, называют относительным стандартным отклонением:

В общем случае метод анализа оптимален в той области содержаний, в которой и абсолютное (S) и относительное (Sr) стандартное отклонение имеют минимальные значения.

Определение и исключение грубых погрешностей

В литературе приведены различные методы оценки и исключения грубых погрешностей.

Рассмотрим наиболее простой для практического использования метод исключения грубых промахов по Q-критерию. Для этого составляют отношение:

где х1 — подозрительно выделяющийся результат определения (измерения);

х2 — результат единичного определения, ближайший по значению к х1;

R — размах варьирования;

Я = хмах — хмин — разница между наибольшим и наименьшим значением ряда измерений. При малой выборке (п Q (Р, пi).

Оценка правильности результатов измерений (определений)

Читайте также:  Джоуль это единица измерения формула

После того как осуществлена проверка грубых погрешностей (в случае подозрительных результатов измерений) и их исключение, производят оценку доверительного интервала (Ах) для среднего значения X и интервальных значений X ± Ах.

Доверительный интервал (Ах). Если воспроизводимость результатов измерений (методики анализа) характеризуют стандартным отклонением, то сами результаты измерений (определений) характеризуют доверительным интервалом среднего значения X, который рассчитывают по формуле

где tP, f — квантиль распределения Стьюдента при числе степеней свободы f = п — 1 и двухсторонней доверительной вероятности Р (значения tp, f см. в табл. 1.2).

Обычно для расчетов доверительного интервала пользуются значениями Р = 0,95; иногда достаточно Р = 0,90, но при ответственных измерениях требуется более высокая надежность (Р = 0,99).

Коэффициент tp, f показывает, во сколько раз разность между истинным и средним результатами больше стандартного результата.

Источник

Статистические методы оценки результатов измерений

Statistical methods. Three approaches for the interpretation and assessment of measurement uncertainty

Дата введения 2015-12-01

1 РАЗРАБОТАНЫ Открытым акционерным обществом «Научно-исследовательский центр контроля и диагностики технических систем» (АО «НИЦ КД»)

2 ВНЕСЕНЫ Техническим комитетом по стандартизации ТК 125 «Применение статистических методов»

4 Настоящие рекомендации разработаны с учетом основных нормативных положений международного документа ISO/TR 13587:2012* «Три статистических подхода к оценке и интерпретации неопределенности измерений» (ISO/TR 13587:2012 «Three statistical approaches for the assessment and interpretation of measurement uncertainty», NEQ)
________________
* Доступ к международным и зарубежным документам, упомянутым в тексте, можно получить, обратившись в Службу поддержки пользователей. — Примечание изготовителя базы данных.

5 ВВЕДЕНЫ ВПЕРВЫЕ

Правила применения настоящих рекомендаций установлены в ГОСТ Р 1.0-2012 (раздел 8). Информация об изменениях к настоящим рекомендациям публикуется в ежегодном (по состоянию на 1 января текущего года) информационном указателе «Национальные стандарты», а официальный текст изменений и поправок — в ежемесячном информационном указателе «Национальные стандарты». В случае пересмотра (замены) или отмены настоящих рекомендаций соответствующее уведомление будет опубликовано в ближайшем выпуске ежемесячного информационного указателя «Национальные стандарты». Соответствующая информация, уведомление и тексты размещаются также в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет (www.gost.ru)

Введение

Принятие Руководства ИСО/МЭК 98-3 (GUM) привело к возрастающему признанию необходимости включать указание неопределенности в результаты измерений. Аккредитация лабораторий на основе ГОСТ ИСО/МЭК 17025 ускорила этот процесс. Признавая, что указание неопределенности необходимо для принятия решений, метрологи в лабораториях всех типов (от национальных институтов метрологии до коммерческих лабораторий калибровки) проявляют значительные усилия по разработке соответствующих оценок неопределенности для различных типов измеряемых величин и методов, приведенных в GUM.
_______________
Национальный стандарт ГОСТ Р 54500.3-2011/Руководство ИСО/МЭК 98-3:2008 «Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения» идентичен ISO/IEC Guide 98-3:2008 (см. [1]).

Национальный стандарт ГОСТ ИСО/МЭК 17025-2009 «Общие требования к компетентности испытательных и калибровочных лабораторий» идентичен ISO/IEC 17025:2005 (см. [2]).

Некоторым преимуществом процедур, описанных и популяризированных в GUM, является стандартизированный подход к определению оценки неопределенности с адаптацией к источникам неопределенности, которая может быть статистической (тип А) или нестатистической (тип В), с акцентом на отчетах обо всех источниках рассматриваемой неопределенности. В основе подхода распространения неопределенности GUM лежит линейная аппроксимация функции измерений. Во многих практических ситуациях такой подход дает результаты, аналогичные полученным более формальными методами. Таким образом, принятие GUM произвело революцию в оценке неопределенности.

Конечно, необходимо много усилий для улучшения оценки неопределенности в практических ситуациях. Совместный комитет по руководствам в метрологии (JCGM), ответственный за GUM с 2000 года, закончил Дополнение 1 к GUM, а именно «Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения. Дополнение 1. Трансформирование распределений с использованием метода Монте-Карло» (называемый GUMS1). В настоящее время JCGM разрабатывает также другие дополнения к GUM в таких направлениях, как моделирование и модели с любым количеством выходных величин.

Применительно к широкому кругу измерительных задач в Руководстве ИСО/МЭК 99:2007 (см. [4]) приведено достаточно общее определение неопределенности измерения как неотрицательного параметра, характеризующего разброс значений, приписываемых измеряемой величине, на основе используемой информации. В результате определение и понимание функций различных статистических величин при определении оценки неопределенности, даже в хорошо понятных применениях измерений особенно интересны как статистикам, так и метрологам.

Ранее проводились исследования этих проблем с метрологической точки зрения. Некоторые авторы исследовали статистические свойства процедур, установленных в GUM. В [5] показано, что к этим процедурам непосредственно не применимы байесовская и фидуциальная интерпретация. В [6] предложено несколько модифицированных процедур GUM, которые дают результаты, более согласованные с интерпретацией Байеса в некоторых случаях. В [7] рассмотрено соотношение между процедурами определения оценки неопределенности, предложенной в GUMS1 (см. [3]) и результатами байесовского анализа для моделей особого вида. В [8] рассмотрены возможные вероятностные интерпретации интервалов охвата и даны рекомендации по аппроксимации апостериорного распределения для этого класса байесовского анализа распределений вероятностей семейства распределений Пирсона.

В [9] приведено сопоставление частотного и байесовского подходов для определения оценки неопределенности. Однако исследование выполнено только для измерительных систем, причем для всех источников неопределенности могут быть использованы оценки типа А. Напротив, в настоящих рекомендациях рассмотрены и иллюстрированы несколькими примерами измерительные системы с источниками неопределенности, для которых использованы оценки типа А и В.

Статистики потратили много сил на использование методов определения оценок неопределенности, имеющих вероятностное обоснование или интерпретацию. В результате их работы (часто вне метрологии) было разработано несколько подходов, относящихся к оценке неопределенности. В настоящих рекомендациях представлены некоторые из этих подходов и со статистической точки зрения рассмотрена их связь с методами, используемыми в настоящее время в метрологии. Статистическими подходами, для которых описаны различные методы определения оценки неопределенности, являются частотный, байесовский и фидуциальный подходы, рассмотренные в настоящих рекомендациях.

1 Область применения

В настоящих рекомендациях рассмотрены три основных статистических подхода к интерпретации и оценке неопределенности измерений: частотный подход, байесовский подход и фидуциальный подход. Общая черта этих подходов — четкая вероятностная интерпретация интервалов неопределенности. Для каждого подхода описаны основной метод, предположения и вероятностная интерпретация неопределенности. В настоящих рекомендациях также рассмотрено соотношение этих статистических подходов с методами, предложенными в ГОСТ Р 54500.3-2011 (далее GUM).

2 Нормативные ссылки

В настоящих рекомендациях использованы нормативные ссылки на следующие стандарты:

ГОСТ ИСО/МЭК 17025-2009 Общие требования к компетентности испытательных и калибровочных лабораторий

ГОСТ Р 50779.10-2000 Статистические методы. Вероятность и основы статистики. Термины и определения

ГОСТ Р 50779.11-2000 Статистические методы. Статистическое управление качеством. Термины и определения

ГОСТ Р 54500.3-2011/Руководство ИСО/МЭК 98-3:2008 Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения

ГОСТ Р 54500.3.1-2011/Руководство ИСО/МЭК 98-3:2008 Дополнение 1:2008 Неопределенность измерения. Часть 3. Руководство по выражению неопределенности измерения по выражению неопределенности измерения. Дополнение 1. Трансформирование распределений с использованием метода Монте-Карло

Примечание — При пользовании настоящими рекомендациями целесообразно проверить действие ссылочных стандартов в информационной системе общего пользования — на официальном сайте Федерального агентства по техническому регулированию и метрологии в сети Интернет или по ежегодному информационному указателю «Национальные стандарты», который опубликован по состоянию на 1 января текущего года, и по выпускам ежемесячного информационного указателя «Национальные стандарты» за текущий год. Если заменен ссылочный стандарт, на который дана недатированная ссылка, то рекомендуется использовать действующую версию этого стандарта с учетом всех внесенных в данную версию изменений. Если заменен ссылочный стандарт, на который дана датированная ссылка, то рекомендуется использовать версию этого стандарта с указанным выше годом утверждения (принятия). Если после утверждения настоящих рекомендаций в ссылочный стандарт, на который дана датированная ссылка, внесено изменение, затрагивающее положение, на которое дана ссылка, то это положение рекомендуется применять без учета данного изменения. Если ссылочный стандарт отменен без замены, то положение, в котором дана ссылка на него, рекомендуется применять в части, не затрагивающей эту ссылку.

Читайте также:  Средство измерений предназначенное для выработки сигнала измерительной информации это

3 Термины и определения

В настоящих рекомендациях применены термины по ГОСТ Р 50779.10, ГОСТ Р 50779.11, а также следующие термины с соответствующими определениями.

3.1 эмпирическая функция распределения, эмпирическая интегральная (кумулятивная) функция распределения (empirical distribution function, empirical cumulative distribution function): Функция распределения, присваивающая вероятность 1/ каждому из элементов случайной выборки и представляющая собой ступенчатую функцию вида

где < , . >— выборка, и — количество элементов, удовлетворяющих условию

3.2 байесовский анализ (Bayesian sensitivity analysis): Анализ влияния априорных распределений параметров статистической модели на апостериорное распределение измеряемой величины.

3.3 достаточная статистика (sufficient statistic): Функция выборки , . из распределения, функция плотности вероятностей которой зависит от параметра , а условное распределение , . при заданном значении статистики не зависит от .

Примечание — Достаточная статистика содержит всю информацию о параметре , как функции , . .

3.4 модель наблюдений (observation model): Математическая связь результатов измерений (наблюдений) измеряемой величины и соответствующей случайной ошибки погрешности измерений.

3.5 структурное уравнение (structural equation): Статистическая модель, связывающая наблюдаемую случайную величину с неизвестными параметрами и ненаблюдаемой случайной величиной, распределение которой известно и не зависит от неизвестных параметров.

3.6 нецентральное хи-квадрат распределение (non-central chi-squared distribution): Нецентральное распределение вероятностей, представляющее собой обобщение центрального -распределения.

Примечание 1 — Для нормально распределенных случайных величин со средним и дисперсией случайная величина имеет нецентральное -распределение. Нецентральное -распределение имеет два параметра: — число степеней свободы (количество ) и , который зависит от средних случайных величин и называется параметром нецентральности.

Примечание 2 — Плотность -распределения представляет собой смесь плотностей центральных распределений:

где подчиняется -распределению с степенями свободы.

4 Обозначения и сокращения

В настоящих рекомендациях использованы для обозначений греческие и латинские буквы. Греческие буквы использованы для обозначения параметров статистической модели (например, измеряемых величин), которые могут быть и случайными величинами и постоянными величинами в зависимости от используемого статистического подхода и модели. Прописные латинские буквы использованы для обозначения случайных величин, которые могут принимать различные значения при наблюдениях, и строчные латинские буквы для обозначения наблюдаемых значений величин (например, результатов измерений). В некоторых случаях использованы другие обозначения. Однако в этом случае смысл обозначений ясен из контекста.

5 Описание задачи

5.1 В настоящих рекомендациях рассмотрена модель измерений:

где , . — входные величины;

— выходная величина;

— функция измерений.

Функция определена математически в виде формулы или алгоритма вычислений. В GUM (примечание 1, 4.1) те же самые функциональные зависимости определены соотношением

которое сложно отличить от функции измерений, определяющей зависимость случайной величины от результатов наблюдений входной величины.

В соответствии с процедурой, рекомендованной GUM, для неизвестных величин определяют оценки , . по значениям , . полученным при выполнении измерений или из других источников. Соответствующие стандартные неопределенности также получают по имеющимся данным с помощью статистических методов или плотностей вероятностей, построенных на основе экспертных знаний о переменных. В GUM (см. также п.4.5 в [11]) модель измерений, связывающую измеряемую величину с входными величинами , . рекомендовано использовать также для вычисления функции, описывающей зависимость от , . . Таким образом, результат измерений (или оценка) для имеют вид

т.е. оценка , представляет собой результат измерений . Оценки , . являются реализациями случайных величин , , . соответственно.

5.2 В настоящих рекомендациях приведено три статистических подхода, обеспечивающих определение:

(а) наилучшей оценки для ,

(б) соответствующей стандартной неопределенности ,

(в) доверительного интервала или интервала охвата для с заданной вероятностью охвата (обычно 95%).

5.3 Необходимо различать оценки стандартной неопределенности, соответствующие оценкам различных величин и соответствующие теоретические значения стандартной неопределенности. Теоретические значения стандартных неопределенностей обозначены соответственно или , их оценки до и после наблюдений обозначены и соответственно.

6 Статистические подходы

6.1 Частотный подход

6.1.1 Статистический подход, позволяющий определить вероятностную оценку неопределенности, называют частотным. Этот подход иногда называют «классическим» или «общепринятым». Однако в силу особенностей неопределенности в метрологических задачах методы этого семейства для определения частотного интервала неопределенности в реальных условиях часто требуют адаптации.

6.1.2 При использовании частотного подхода входные значения , . модели измерений (1) и выходную величину рассматривают как неизвестные постоянные величины. Полученные для каждой величины данные используют для определения оценки с помощью модели измерений или других статистических моделей. Для определения оценки с помощью использования одного из математических методов (наименьших квадратов, максимального правдоподобия или бутстреп-метода) определяют доверительные интервалы с заданным уровнем доверия.

6.1.3 Поскольку рассматривают как постоянную величину, вероятностное утверждение, относящееся к доверительному интервалу для , не является прямым утверждением относительно значения . Это утверждение лишь указывает, как часто доверительный интервал, полученный с применением данной процедуры, накрывает измеряемую величину при многократном повторении процедуры. Повторение процедуры означает, что определение оценки неопределенности повторяют много раз с использованием различных данных, взятых из одних и тех же распределений. Частотный подход обеспечивает выполнение вероятностного утверждения о свойствах процедуры построения интервала неопределенности в конкретных условиях процесса измерений на достаточно большом количестве повторений процедуры.

6.1.4 В большинстве практических метрологических задач интервалы неопределенности должны учитывать как неопределенность, соответствующую оценкам величин, полученным с использованием результатов измерений, так и неопределенность, соответствующую экспертным оценкам. Для получения интервала неопределенности, аналогичного доверительному интервалу, оценки величин, не основанные на результатах измерений, рассматривают как случайные величины с распределениями вероятностей (величины, оценки которых могут быть получены с использованием статистических данных, рассматривают как неизвестные постоянные величины).

6.1.5 Традиционная частотная процедура построения доверительного интервала может быть модифицирована для обеспечения заданного уровня доверия после усреднения по возможным значениям величин, имеющих экспертные оценки [5]. Это позволяет использовать вероятностные утверждения, аналогичные утверждениям в случае доверительных интервалов для величин, которые не были измерены.

6.1.6 В таблице 1 приведено краткое описание частотного, байесовского и фидуциального подходов к оценке неопределенности.

Таблица 1 — Интерпретации частотного, байесовского и фидуциального подходов

Характеристика величин модели измерений

Интервал неопределенности для выходной величины

и — неизвестные постоянные величины

Доверительный интервал накрывает с заданной вероятностью, при длительном повторении процедуры

Классический частотный подход применяют для объединения неопределенностей, которые не являются статистическими оценками

и — случайные величины, распределения вероятностей которых основаны на предварительной информации о значениях входных и выходных величин

Интервал охвата для рассчитывают на основе апостериорного распределения

Возможна неоднозначность интервала, обусловленная выбором априорных распределений

— случайные величины, распределения которых получены на основе предположений о наблюдаемых данных, использованных для определения оценок и экспертных знаниях о

Интервал охвата для рассчитывают на основе фидуциального распределения

Не единственность интервала, обусловленная выбором структурного уравнения

6.2 Байесовский подход

Второй подход называют байесовским подходом в честь фундаментальной теоремы Байеса [12], на которой он основан. В этом подходе параметры модели измерений (1) , . рассматривают как случайные величины с соответствующими распределениями вероятностей. Теорема Байеса позволяет получить распределение вероятностей на основе данных наблюдений и параметров, определенных в соответствии с функцией или эквивалентными статистическими моделями. Полученное распределение вероятностей учитывает знания о распределении и информацию о наблюдаемых данных. Из этого распределения могут быть получены интервалы неопределенности, которые накрывают с заданной вероятностью. Поскольку знания о параметрах заданы в виде распределений вероятностей, байесовский метод обеспечивает возможность прямых вероятностных утверждений о значениях и других параметров, используя определение вероятности, как меры уверенности.

6.3 Фидуциальный подход

6.3.1 Фидуциальный подход разработан Р.Фишером [13] в 1930-ых годах. В этом подходе распределение вероятностей для , названное фидуциальным распределением, является условным (по данным) и получено на основе взаимосвязи и , описанной функцией , предположениями о распределении данных, используемых для определения оценки . Фидуциальное распределение может быть использовано для определения интервалов неопределенности, которые содержат с заданной вероятностью.

6.3.2 Обоснование процесса определения фидуциального распределения иллюстрирует следующий пример. Предположим, что величину можно описать уравнением , где — измеряемая величина, — случайная величина, подчиняющаяся нормированному нормальному распределению. Если — реализация случайной величины , a — реализация случайной величины , то . Знание распределения позволяет определить совокупность возможных значений . Распределение вероятностей может быть использовано для вывода распределения вероятностей . Процесс преобразования соотношения в соотношение и есть суть фидуциального подхода. Фидуциальное распределение представляет собой распределение вероятностей случайной величины ( ) при фиксированном .

Читайте также:  Инструкция по эксплуатации b well для измерения давления

7 Примеры

7.1 Общие положения

Примеры связаны с корректировкой некоторой физической величины на фоне помех. В таблице 2 приведено описание и обозначение используемых величин, в 7.2-7.4 приведены примеры определения оценок.

Примечание — Описание величин, несущественных для целей настоящего примера, не приведено.

Таблица 2 — Пояснения к примеру

Исследуемая физическая величина (измеряемая)

Величина, обнаруженная методом измерений при измерении фонового шума (т.е. среднее )

Исследуемая физическая величина, обнаруженная методом измерений (т.е. среднее )

Стандартное отклонение метода измерений при измерении исследуемой физической величины (стандартное отклонение )

Стандартное отклонение метода измерений при измерении фонового шума (стандартное отклонение )

7.2 Пример а)

Наблюдаемой величиной является композиция сигнала и фонового шума. В результате измерений получено пять независимых значений. Предполагается, что каждое значение является реализацией случайной величины , подчиняющейся нормальному распределению со средним и стандартным отклонением . Результаты измерений составили:

Выборочные среднее и стандартное отклонение равны 3,537 и 0,342.

Аналогично определено пять результатов измерений фонового шума. Эти значения, как предполагается, являются реализацией случайной величины , подчиняющейся нормальному распределению со средним и стандартным отклонением . Наблюдаемые значения фонового шума составили:

Поскольку имеются результаты измерений для каждой величины, которая является источником неопределенности, то на основе данного примера может быть показана статистическая интерпретация каждого подхода.

7.3 Пример б)

Пример б) идентичен примеру а), но оценки параметров фонового шума определяют не на основе экспериментальных данных, а на основе предыдущего опыта или экспертных данных. В этом случае величина подчиняется равномерному распределению на интервале с конечными точками 1,126 и 1,329. Поскольку использована экспертная оценка, неопределенность, соответствующая фоновому шуму, получена с использованием оценки типа В. Пример б) ближе к реальной ситуации, чем пример а).

7.4 Пример в)

Пример в) идентичен примеру б) за исключением того, что сигнал ближе по характеристикам к фоновому шуму. Наблюдаемые данные «сигнал плюс фоновый шум» в этом случае составили

Для сигнала, почти совпадающего с фоновым шумом, в примере в) показано, как физические ограничения могут быть использованы при определении оценки неопределенности в каждом подходе.

8 Частотный подход

8.1.1 При частотном подходе параметры рассматривают как неизвестные постоянные величины. Далее случайные переменные обозначены прописными буквами, а соответствующие им наблюдаемые значения — строчными. Доверительный интервал может быть получен на основе функции от и параметра , которая может быть многомерной. Распределение вероятностей параметра не имеет неизвестных параметров (если такое распределение может быть определено). Тогда доверительный интервал уровня 100 (1- )% для может быть определен через нижнюю и верхнюю процентили и , удовлетворяющие условию .

8.1.2 Например, если ( , . ) — случайные величины, подчиняющиеся нормальному распределению ( , ), то — также случайная величина, подчиняющаяся нормальному распределению. Пусть необходимо определить оценку при известном значении . Величина подчиняется (0, 1).

Тогда границы доверительного интервала для имеют вид

где — квантиль уровня нормированного нормального распределения.

Если неизвестно, можно использовать в качестве его оценки выборочное стандартное отклонение

Оценку , получают, заменяя на .

Величина

подчиняется распределению Стьюдента с числом степеней свободы ( -1). Доверительный интервал для определяют по формуле

где — квантиль распределения Стьюдента с ( -1) степенями свободы.

8.1.3 Вместо точных оценок, которые можно получить только в простых ситуациях, обычно используют приближенные оценки. Для больших выборок приближенные доверительные интервалы могут быть получены на основе центральной предельной теоремы.

8.1.4 Дополнительные методы определения доверительных интервалов приведены в [14]. Некоторые из них упомянуты в примерах. При построении доверительного интервала для обратных величин с неизвестными распределениями может быть использован бутстреп-метод. Процедура бутстреп-метода приведена в 8.2.

8.1.5 При получении приближенного доверительного интервала для измеряемой величины также могут быть использованы процедуры, рекомендуемые GUM, хотя они отличаются от методов построения доверительного интервала на основе частотного подхода. Такие доверительные интервалы основаны на аппроксимации распределения функции наблюдений в модели измерений (1) распределением Стьюдента (t-распределением). В соответствии с этой процедурой оценки неизвестных величин , . определяют на основе значений . , полученных в результате измерений или из других источников. Значения могут быть выборочными средними или другими функциями данных, используемыми для оценки , 1, . . Их суммарную стандартную неопределенность также определяют с помощью статистических методов, как правило, используя выборочное стандартное отклонение или робастные ранговые процедуры. Такие методы позволяют определить оценки неопределенности типа А. Число степеней свободы , связанное с , зависит от объема выборки, используемой для оценки .

8.1.6 Так как физические измерения не всегда возможны или целесообразны для некоторых , оценки параметров , для некоторых , например , . получают с помощью субъективных (или потенциально субъективных) оценок и используют вместе с для 1, . , полученными на основе оценок неопределенности типа А. Таким образом, для определения оценок , . использована нестатистическая информация (данные научных исследований, требования изготовителя или другая прямая или косвенная информация) при определении оценки неопределенности типа В.

Примечание — Иногда могут быть получены оценки неопределенности типа А и В одновременно.

8.1.7 В GUM рекомендовано для вычисления по , . использовать модель, связывающую измеряемую величину с входными величинами , . . Таким образом, измеряемую величину (или ее оценку) определяют в виде

т.е. как оценку . При этом — измеряемое значение .

8.1.8 В GUM для оценки стандартной неопределенности использован закон распространения неопределенности. Стандартную неопределенность , …, , соответствующую , определяют на основе разложения функции в ряд Тейлора первого порядка

Пусть . Частные производные

называют коэффициентами чувствительности. В соответствии с GUM применение закона распространения неопределенности дает метод определения приближенной оценки стандартной неопределенности :

где — ковариация и .

8.1.9 Для определения оценки стандартной неопределенности в GUM использована формула Велча-Саттервейта для вычисления эффективного числа степеней свободы :

Примечание — В [15] рассмотрен парадокс, в соответствии с которым в межлабораторных исследованиях доверительный интервал, построенный на основе аппроксимации Велча-Саттервейта, может быть меньше для оценки различий между лабораториями, чем внутри лаборатории для компонентов неопределенности.

8.1.10 Согласно GUM для построения доверительного интервала для используют величину

Распределение приближенно можно считать -распределением с степенями свободы.

Тогда доверительный интервал уровня 100 (1- )% имеет вид:

Этот доверительный интервал может быть рекомендован в качестве доверительного интервала для с уровнем доверия 100 (1- )%. Полуширина этого интервала представляет собой расширенную неопределенность .

8.1.11 Изложенное согласуется с обычной статистической практикой, когда общую неопределенность определяют с помощью оценки типа А, а наиболее часто используемой статистической оценкой для конкретной входной величины является выборочное среднее по наблюдаемым величинам. Традиционным методом получения оценки стандартной неопределенности типа А является дисперсия с ( -1) степенями свободы. Это основано на том, что подчиняется -распределению с ( -1) степенями свободы. Этот метод применим также к статистикам вида , когда оценки , 1, . подчиняются центральной предельной теореме. При этом стандартное отклонение может быть получено по формуле (7), в которой необходимо заменить на .

Метод GUM обобщает коллективный опыт многих метрологов. Однако он ограничен предположениями о:

— локальной линейности функции (коэффициенты чувствительности не следует сильно менять и удалять);

— нормальности распределения точечных оценок (для малых выборок это может не выполняться даже в приближении);

— законности формулы Велча-Саттервейта (возможно, формула плохо работает, если входные величины взаимно зависимы, входные данные не подчиняются нормальному распределению и стандартные неопределенности различны. Число степеней свободы для распределений, не связанных с -распределением, трудно интерпретировать, и в действительности его не используют в статистической теории).

8.1.12 Для анализа выражения (7) с точки зрения частотного подхода можно использовать понятия теории статистических решений и дисперсию (квадрат стандартной неопределенности) интерпретировать как средний квадрат ошибки статистической оценки (

Доступ к полной версии этого документа ограничен

Ознакомиться с документом вы можете, заказав бесплатную демонстрацию систем «Кодекс» и «Техэксперт».

Источник