Доверительный интервал, доверительная вероятность - реферат. Большая энциклопедия нефти и газа

Cтраница 2


Качество исходных данных (статистика) о показателях надежности электрооборудования (вместе с показателями ущерба от нарушений электроснабжения и сведениями о режимах работы и ППР) оценивается точностью - шириной доверительного интервала, накрывающего показатель, и достоверностью - вероятностью не совершить ошибку, выбирая этот интервал. Точность математических моделей надежности оценивается их адекватностью реальному объекту, а точность метода расчета надежности - адекватностью полученного решения идеальному.  

Теперь коэффициент вариации дебита, так же как и сам дебит, существенно зависит от &0 / &1 - Так, например, при pi 1 м и ku / k 5 средний дебит уменьшается по сравнению с первоначальным примерно в 2 раза, а ширина доверительного интервала почти в 3 раза. Очевидно, уточнение параметров призабойной зоны в этом случае дает существенную информацию и значительно улучшает качество прогноза.  


Неизменность числа испытаний п на каждой ступени оказывает существенное влияние иа точность результатов. Ширина доверительного интервала уменьшается с увеличением объема выборки.  

Доверительными называют интервалы, в пределах которых находятся с определенными (доверительными) вероятностями истинные значения оцениваемых параметров. Обычно ширину доверительного интервала выражают через СКО результатов отдельных наблюдений ах.  

Ширина доверительного интервала зависит от желаемой статистической надежности е, объема выборки п и от распределения случайных значений, в особенности от разброса. Длина и ширина доверительных интервалов определяется также имеющейся (случайной) выборкой.  

Однако ширина доверительного интервала при этом получается неприемлемо большой. Однако и в этом случае ширина доверительного интервала получается слишком большой.  


Отсюда границы доверительного интервала составляют (23 85 - 2 776 - 0 13; 23 85 2 776Х Х0 13) (23 49; 24 21) МПа. Из результатов видно, что ширина доверительного интервала для той же вероятности должна быть почти в 1 5 раза больше за счет того, что при меньшем числе измерений доверие к ним меньше.  

Из соотношения (2.29) следует, что вероятность того, что доверительный интервал (0 - Д; в Д) со случайными границами накроет известный параметр 0, равна у. Величину Д, равную половине ширины доверительного интервала, называют точностью оценки, а вероятность у - доверительной вероятностью (или надежностью) оценки.  

Интервал (04, 042) называется доверительным, его границы 04 и 0W, являющиеся случайными величинами, соответственно нижним и верхним доверительными пределами. Любая интервальная оценка может быть охарактеризована совокупностью двух чисел: шириной доверительного интервала Н 04 - 0И, являющейся мерой точности оценивания параметра 0, и доверительной вероятностью у, характеризующей степень достоверности (надежности) результатов.  

При этих условиях доверительные границы определяются: для Мэ и а с помощью - распределения, а для Мн - с помощью распределения Стьюдента. Из графиков видно, что при малом числе п наблюдавшихся отказов ширина доверительного интервала, которая характеризует возможное отклонение в оценке параметра распределения, велика. Действительное значение параметра может в несколько раз отличаться от полученного из опыта значения соответствующей статистической оценки. С увеличением п границы доверительного интервала постепенно суживаются. Для получения достаточно точных и достоверных оценок требуется, чтобы при испытании наблюдалось большое число отказов, что, в свою очередь, требует значительного объема испытаний, особенно при высокой надежности объектов.  

11.1. Доверительные интервалы и доверительная вероятность.

Доверительные интервалы для параметров нормально распреде­ленной

генеральной совокупности.

При статистической обработке результатов наблюдений следует не только найти оценку неизвестного параметра θ , но и охарактеризовать точность этой оценки. С этой целью вводится понятие доверительного интервала.

Доверительным интервалом для параметра θ называется интервал (θ 1 , θ 2 ), содержащий (накрывающий) истинное значение θ с заданной вероятностью р = 1 - α , т.е. Р [θ 1 < θ < θ 2 ] = 1-α .

Число 1 - α называется доверительной вероятностью, а зна­чение α - уровнем значимости. Статистики θ 1 = θ 1 (x 1 ,...,x n ) и θ 2 = θ 2 (x 1 ,...,x n ), определяемые по выборке x 1 ,...,x n из генераль­ной совокупности с неизвестным параметром θ , называются со­ответственно нижней и верхней границами доверительного ин­тервала.

Условие Р [θ 1 < θ < θ 2 ] = 1-α означает, что в большой серии независимых экспериментов, в каждом из которых получена вы­борка объема n , в среднем (1 - α )·100% из общего числа построенных доверительных интервалов содержат истинное значение параметра θ .

Длина доверительного интервала, характеризующая точ­ность интервального оценивания, зависит от объема выборки n и доверительной вероятности 1 - α : при увеличении объема выборки длина доверительного интервала уменьшается, а с приближе­нием доверительной вероятности к единице - увеличивается. Вы­бор доверительной вероятности определяется конкретными усло­виями. Обычно используются значения 1 - α , равные 0,90; 0,95; 0,99.

При решении некоторых задач применяются односторонние доверительные интервалы, границы которых определяют из усло­вий: Р [θ < θ 2 ] = 1-α или Р [θ 1 < θ ] = 1-α .

В этом случае интервалы называются соответственно левосторонними и правосторонними доверительными интервалами.

Чтобы найти доверительный интервал для параметра θ , на­до знать закон распределения статистики = (х 1 ,...,х п) , значе­ние которой является оценкой параметра θ.

Для получения доверительного интервала наименьшей дли­ны при данном объеме выборки п и заданной доверительной веро­ятности 1в качестве оценки параметра θ следует брать эффективную либо асимптотически эффективную оценку.

Рассмотрим один из методов построения доверительных интервалов. Предположим, что существует статистика Y = Y( , θ) такая, что:

а) закон распределения Y известен и не зависит от θ ;

б) функция Y( , θ) непрерывна и строго монотонна по θ.
Пусть (1) - заданная доверительная вероятность, а у а/2 и у 1- a /2 - квантили распределения статистики Y порядков α/2 и 1-α/ 2соответственно. Тогда с вероятностью 1выполняется неравенство у а/2 < Y( , θ) < у 1- a /2 .

Решая это неравенство относительно θ , найдем границы θ i и θ 2 доверительного интервала для θ. Если плотность распреде­ления статистики Y симметрична относительно оси Оу , то доверительный интервал имеет наименьшую длину, а если это распре­деление несимметрично, то длину, близкую к наименьшей.

Пример 46. Пусть х 1 ,х 2 ,...,х n - выборка из нормально рас­пределенной генеральной совокупности. Найти доверительный интервал для математического ожидания т при условии, что дис­персия генеральной совокупности известна и равна σ 2 , а довери­тельная вероятность равна 1-α.

Решение. В качестве оценки математического ожидания т возьмем выборочное среднее . Для нормально распределенной генеральной совокупности выборочное среднее является эффективной оценкой т. Выборочное среднее в данном случае имеет нормальное распределение .

Рассмотрим статистику , имеющую нормальное распределение N (0,1) независимо от значения параметра т. Кро­ме того, U как функция т непрерывна и строго монотонна. Тогда , где и а/2 и и 1- a /2 - квантили нормального распределения N (0,1).

Решая неравенство относительно т, по­лучим, что с вероятностью 1 выполняется условие:

.

Так как квантили нормального распределения связаны со­отношением и а/2 =-u 1- a /2 , полученный доверительный интервал для т можно записать следующим образом:

11.2. Доверительные интервалы для вероятности успеха в схеме Бернулли

и параметра λ распределения Пуассона.

Если распределение генеральной совокупности не является нор­мальным, то в некоторых случаях по выборкам большого объема можно построить доверительные интервалы для неизвестных па­раметров приближенно, используя при этом предельные теоремы теории вероятности и вытекающие из них асимптотические рас­пределения и оценки.

Пример 47. Пусть в n независимых испытаниях успех на­ступил х раз. Найти доверительный интервал для вероятности р успеха в одном испытании.

Решение . Эффективной оценкой вероятности успеха р в од­ном испытании является относительная частота = h = x/h . По теореме Муавра-Лапласа относительная частота h имеет асимпто­тически нормальное распределение , где q = 1 - р.

Рассмотрим статистику , которая имеет асимптотически нормальное распределение N (0,1) независимо от значения р. При больших п тогда имеем

.

Отсюда получим, что с вероятностью ≈1 выполняется неравенство

.

Заменяя значения р и q влевой и правой частях записанно­го выше неравенства их оценками = h и = 1-h, получим до­верительный интервал для вероятности успеха в схеме

Пример 48. При проверке 100 деталей из большой партии обнаружено 10 бракованных деталей.

а) Найти 95 % приближенный доверительный интервал для доли бракованных деталей во всей партии.

б) Какой минимальный объем выборки следует взять для того, чтобы с вероятностью 0,95 можно было утверждать, что до­ля бракованных деталей по всей партии отличается от частоты
появления бракованных деталей в выборке не более чем на 1 %?

Решение .а) Оценка доли бракованных деталей в партии по выборке равна = h = 10/100 = 0,1. По таблице приложений (П1) находим квантиль и 1- a /2 = и 0,975 = 1,96 . Тогда 95% доверительный

интервал для доли бракованных деталей в партии приближенно имеет вид 0,041 < р < 0,159.

б) Представим полученный доверительный интервал в виде неравенства

,

которое выполняется с вероятностью ≈1 - α = 0,95. Так как со­гласно условию задачи , то для определения n полу­чим неравенство

.

Отсюда следует, что и n ≥(0,3·196) 2 =3457,44 . Итак, минимальный объем выборки n = 3458.

11.3. Доверительные интервалы для коэффициента корреляции ρ.

Пусть выборка (х i ,у i), i = 1,2,...,п, получена из генеральной совокупности, имеющей двумерное нормальное распределение, и r - выборочный коэффициент корреляции. При достаточно больших n статистика имеет приближенно нормальное распределение .

Доверительный интервал для Arth ρ имеет вид

Доверительный интервал для ρ вычисляется с помощью таблиц гиперболического тангенса ρ= thz .(смотри таблицу при­ложение П8).

Пример 49. Выборочный коэффициент корреляции, вычис­ленный по выборке объема 10, r = -0,64. Найти 90 % доверительный интервал для коэффициента корреляции р.

Решение. По таблице приложений (П8) находим Arth(-0,64)= -Arth0,64 = -0,76.

Так как и 0, 95 = 1,645, то доверительный интервал для Arthρ имеет вид , т.е. -1,38

Обращаясь к таблице П8, получим 90 % доверительный ин­тервал для коэффициента корреляции: - 0,881 < ρ < -0,139.

11.4. Примеры доверительных интервалов.

1. Доверительный интервал для математического ожидания а нормальной случайной величины при известной дисперсии σ 2 имеет вид .

Здесь величина определяется по заданной доверительной вероятности γ по таблице значений , в которой .

Пусть измерение проводят несколько раз, причем условия эксперимента поддерживают, насколько возможно, неизменными. Поскольку строго соблюдать неизменность условий невозможно, результаты отдельных измерений будут несколько различаться. Их можно рассматривать как значения случайной величины g, распределенной по некоторому закону, заранее нам неизвестному.

Очевидно, математическое ожидание равно точному значению измеряемой величины (строго говоря, точному значению плюс систематическая ошибка).

Обработка измерений основана на центральной предельной теореме теории вероятностей: если с есть случайная величина, распределенная по любому закону, то

есть также случайная величина, причем

а закон распределения величины стремится к нормальному (гауссову) при . Поэтому среднеарифметическое нескольких независимых измерений

является приближенным значением измеряемой величины, причем с тем большей надежностью, чем больше число измерений .

Однако равенство не является точным, и нельзя даже строго указать предел его ошибки; в принципе может сколь угодно сильно отличаться от хотя вероятность такого события ничтожно мала.

Ошибка приближенного равенства (2) носит вероятностный характер и описывается доверительным интервалом Р, т. е. границей, которую с доверительной вероятностью не превышает разность . Символически это записывают следующим образом:

Доверительный интервал зависит от закона распределения (а тем самым от постановки эксперимента), от числа измерений , а также от выбранной доверительной вероятности . Из (3) видно, что чем ближе к единице, тем шире оказывается доверительный интервал.

Доверительную вероятность выбирают, исходя из практических соображений, связанных с применениями полученных результатов. Например, если мы делаем игрушечный воздушный змей, то вероятность благополучного полета нас устроит, а если конструируем самолет, то даже вероятность недостаточна. Во многих физических измерениях считается достаточной.

Замечание 1. Пусть требуется найти величину z, но измерять удобнее величину связанную с ней известным соотношением например, нас интересует джоулево тепло, а измерять легче ток. При этом следует помнить, что

так, среднее значение переменного тока равно нулю, а средний джоулев нагрев отличен от нуля. Поэтому, если мы вычислим сначала а затем положим это будет грубая ошибка. Следует по каждому измерению вычислять и далее обрабатывать полученные значения .

Ширина доверительного интервала. Если известна плотность распределения величины то доверительный интервал можно определить из (3), разрешая уравнение

относительно . Выше отмечалось, что при распределение стремится к нормальному

здесь - дисперсия распределения, а величину называют стандартным отклонением или просто стандартом.

Подставляя (5) в (4) и полагая , т. е. измеряя доверительный интервал в долях стандарта, получим соотношение

(6)

Интеграл ошибок, стоящий в правой части (6), табулирован, так что из этого соотношения можно определить доверительный интервал . Зависимость дается в таблице 23 строкой, соответствующей

Из таблицы 23 видно, что доверительный интервал соответствует доверительной вероятности так что отклонение от более чем на маловероятно. Но отклонение более чем на довольно вероятно, поскольку ширине соответствует

Таким образом, если известна дисперсия то нетрудно определить стандарт и, тем самым, абсолютную ширину доверительного интервала . В этом случае даже при выполнении одного измерения можно оценить случайную ошибку , а увеличение числа измерений позволяет уменьшать доверительный интервал, поскольку

Критерий Стьюдента. Чаще всего дисперсия D? неизвестна, поэтому выполнить оценку ошибки указанным выше способом обычно не удается. При этом точность однократного измерения неизвестна. Однако, если измерение повторено несколько раз, можно приближенно найти дисперсию:

Точность этого выражения невелика по двум причинам: во-первых, число членов суммы обычно мало; во-вторых, использование замены вносит ошибку значительную при малых n. Более хорошее приближение дает так называемая несмещенная оценка дисперсии:

где величину s называют стандартом выборки.

Оценка (8) также является приближенной, поэтому нельзя пользоваться формулой (6), заменяя в ней на Надо вносить в нее поправку, тем большую, чем меньше . Если распределение считать нормальным при любых , то связь доверительного интервала со стандартом выборки устанавливается критерием Стьюдента:

где коэффициенты Стьюдента представлены в таблице 23.

Таблица 23

Коэффициенты Стьюдента

Очевидно, при больших с хорошей точностью выполняется . Поэтому при критерий Стьюдента переходит в формулу (6); выше отмечалось, что этой формуле соответствует строка таблицы 23. Однако при малых доверительный интервал (8) оказывается много шире, чем по критерию (6).

Пример 1. Выбрано и выполнено 3 измерения; по таблице 23 доверительный интервал равен

К сожалению, не все физики и инженеры знакомы с понятием доверительного интервала и критерием Стьюдента. Нередко встречаются экспериментальные работы, в которых при малом числе измерений пользуются критерием или даже считают, что значение является погрешностью величины , и вдобавок оценивают дисперсию по формуле (7).

Для приведенного выше йримера при первой ошибке был бы дан ответ при второй а при третьей что сильно отличается от правильного значения.

Замечание 2. Зачастую одна и та же величина измерена в разных лабораториях на разном оборудовании. Тогда следует найти среднее и стандарт по формулам (2) и (8), где суммирование проводится по всем измерениям во всех лабораториях, и определить доверительный интервал по критерию Стьюдента.

Нередко при этом суммарный стандарт s оказывается больше, чем стандарты определенные по данным отдельных лабораторий. Это естественно. Каждая лаборатория делает при измерениях систематические ошибки, и часть систематических ошибок в разных лабораториях совпадает, а часть различается. При совместной обработке различающиеся систематические ошибки переходят в разряд случайных, увеличивая стандарт.

Значит, при совместной обработке разнотипных измерений обычно систематическая ошибка значения будет меньше, а случайная больше. Но случайную ошибку можно сколь угодно уменьшить, увеличивая число измерений. Поэтому такой способ позволяет получить окончательный результат с большей точностью.

Замечание 3. Если в разных лабораториях используется оборудование разного класса точности, то при такой совместной обработке надо суммировать с весами

где относятся, как квадраты точности приборов.

Произвольное распределение. Чаще всего число измерений невелико и заранее неясно, можно ли считать распределение нормальным и пользоваться приведенными выше критериями.

Для произвольного распределения справедливо неравенство Чебышева

Отсюда можно оценить доверительный интервал:

Коэффициент в этой оценке приведен в дополнительной строке таблицы 23.

Из таблицы видно, что если в качестве доверительной вероятности принять то для произвольного закона распределения сизвестной дисперсией доверительный интервал не превышает . Для симметричного одновершинного распределения аналогичные оценки показывают, что доверительный интервал не превышает напомним, что для нормального распределения он равен (при выбранном ).

Разумеется, если вместо используют найденное по тем же измерениям значение то надо строить критерий, аналогичный критерию Стьюдента. Оценки при этом будут существенно хуже приведенных.

Проверка нормальности распределения. Из сравнения критериев (6) и (11) видно, что даже при невысокой доверительной вероятности оценки доверительного интервала при произвольном распределении вдвое хуже, чем при нормальном. Чем ближе к единице, тем хуже соотношение этих оценок. Поэтому целесообразно проверять, существенно ли отличается распределение от нормального.

Распространенный способ проверки - исследование так называемых центральных моментов распределения:

Два первых момента, по определению, равны Для нормального распределения два следующих момента равны Обычно ограничиваются этими моментами. Вычисляют их фактические значения по проведенным измерениям и проверяют, согласуются ли они со значениями, соответствующими нормальному распределению.

Удобно вычислять не сами моменты, а составленные из них безразмерные комбинации - асимметрию и эксцесс для нормального распределения они обращаются в нуль. Аналогично дисперсии, вычислим их по несмещенным оценкам:

где s определяется формулой (8). Собственные дисперсии этих величин известны и зависят только от числа измерений:

причем собственное распределение А является симметричным.

Поэтому, если выполняются соотношения

то по критерию Чебышева (11) отличие А и Е от нуля недостоверно, так что можно принять гипотезу о нормальности распределения

Формулы (13)-(15) непосредственно относятся к распределению единичного измерения. На самом деле надо проверить, нормально ли распределение среднеарифметического при выбранном . Для этого делают большое число измерений разбивают их на групп по измерений в каждой и среднее значение в каждой группе рассматривают как единичное измерение. Тогда проверка выполняется по формулам (13)-(15), где вместо надо подставить .

Разумеется, такую тщательную проверку проводят не в каждой измеряемой точке, а лишь во время отработки методики эксперимента.

Замечание 4. Аналогично проверяют любые естественнонаучные гипотезы. Производят большое число экспериментов и выясняют, нет ли среди них событий, маловероятных с точки зрения этой гипотезы. Если найдутся такие события, то гипотезу отвергают, если нет - условно принимают.

Выбор . За счет увеличения числа измерений можно неограниченно уменьшать доверительный интервал. Однако систематическая ошибка при этом не уменьшается, так что суммарная ошибка все равно будет больше Поэтому целесообразно выбрать я так, чтобы ширина доверительного интервала составляла Дальнейшее увеличение числа измерений бессмысленно.

Точность оценки, доверительная вероятность (надежность)

Доверительный интервал

При выборке малого объема следует пользоваться интервальными оценками т.к. это позволяет избежать грубых ошибок, в отличие от точечных оценок.

Интервальной называют оценку, которая определяется двумя числами - концами интервала, покрывающего оцениваемый параметр. Интервальные оценки позволяют установить точность и надежность оценок.

Пусть найденная по данным выборки статистическая характеристика * служит оценкой неизвестного параметра. Будем считать постоянным числом (может быть и случайной величиной). Ясно, что * тем точнее определяет параметр в, чем меньше абсолютная величина разности | - * |. Другими словами, если >0 и | - * | < , то чем меньше, тем оценка точнее. Таким образом, положительное число характеризует точность оценки.

Однако статистические методы не позволяют категорически утверждать, что оценка * удовлетворяет неравенству | - *|<, можно лишь говорить о вероятности, с которой это неравенство осуществляется.

Надежностью (доверительной вероятностью) оценки по * называют вероятность, с которой осуществляется неравенство | - *|<. Обычно надежность оценки задается наперед, причем в качестве берут число, близкое к единице. Наиболее часто задают надежность, равную 0,95; 0,99 и 0,999.

Пусть вероятность того, что | - *|<, равна т.е.

Заменив неравенство | - *|< равносильным ему двойным неравенством -<| - *|<, или *- <<*+, имеем

Р(*- < <*+)=.

Доверительным называют интервал (*- , *+), который покрывает неизвестный параметр с заданной надежностью.

Доверительные интервалы для оценки математического ожидания нормального распределения при известном.

Интервальной оценкой с надежностью математического ожидания а нормально распределенного количественного признака Х по выборочной средней х при известном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал

х - t(/n^?) < a < х + t(/n^?),

где t(/n^?)= - точность оценки, n - объем выборки, t - значение аргумента функции Лапласа Ф(t), при котором Ф(t)=/2.

Из равенства t(/n^?)=, можно сделать следующие выводы:

1. при возрастании объема выборки n число убывает и, следовательно, точность оценки увеличивается;

2. увеличение надежности оценки = 2Ф(t) приводит к увеличению t (Ф(t) -- возрастающая функция), следовательно, и к возрастанию; другими словами, увеличение надежности классической оценки влечет за собой уменьшение ее точности.

Пример. Случайная величина X имеет нормальное распределение с известным средним квадратическим отклонением =3. Найти доверительные интервалы для оценки неизвестного математического ожидания a по выборочным средним х, если объем выборки n = 36 и задана надежность оценки = 0,95.

Решение. Найдем t. Из соотношения 2Ф(t) = 0,95 получим Ф (t) = 0,475. По таблице находим t=1,96.

Найдем точность оценки:

точность доверительный интервал измерение

T(/n^?)= (1 ,96 . 3)/ /36 = 0,98.

Доверительный интервал таков: (х - 0,98; х + 0,98). Например, если х = 4,1, то доверительный интервал имеет следующие доверительные границы:

х - 0,98 = 4,1 - 0,98 = 3,12; х + 0,98 = 4,1+ 0,98 = 5,08.

Таким образом, значения неизвестного параметра а, согласующиеся с данными выборки, удовлетворяют неравенству 3,12 < а < 5,08. Подчеркнем, что было бы ошибочным написать Р (3,12 < а < 5,08) = 0,95. Действительно, так как а - постоянная величина, то либо она заключена в найденном интервале (тогда событие 3,12 < а < 5,08 достоверно и его вероятность равна единице), либо в нем не заключена (в этом случае событие 3,12 < а < 5,08 невозможно и его вероятность равна нулю). Другими словами, доверительную вероятность не следует связывать с оцениваемым параметром; она связана лишь с границами доверительного интервала, которые, как уже было указано, изменяются от выборки к выборке.

Поясним смысл, который имеет заданная надежность. Надежность = 0,95 указывает, что если произведено достаточно большое число выборок, то 95% из них определяет такие доверительные интервалы, в которых параметр действительно заключен; лишь в 5% случаев он может выйти за границы доверительного интервала.

Если требуется оценить математическое ожидание с наперед заданной точностью и надежностью, то минимальный объем выборки, который обеспечит эту точность, находят по формуле

Доверительные интервалы для оценки математического ожидания нормального распределения при неизвестном

Интервальной оценкой с надежностью математического ожидания а нормально распределенного количественного признака Х по выборочной средней х при неизвестном среднем квадратическом отклонении генеральной совокупности служит доверительный интервал

х - t()(s/n^?) < a < х + t()(s/n^?),

где s -«исправленное» выборочное среднее квадратическое отклонение, t() находят по таблице по заданным и n.

Пример. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=16 найдены выборочная средняя x = 20,2 и «исправленное» среднее квадратическое отклонение s = 0,8. Оценить неизвестное математическое ожидание при помощи доверительного интервала с надежностью 0,95.

Решение. Найдем t(). Пользуясь таблицей, по = 0,95 и n=16 находим t()=2,13.

Найдем доверительные границы:

х - t()(s/n^?) = 20,2 - 2,13 *. 0 ,8/16^? = 19,774

х + t()(s/n^?) = 20,2 + 2,13 * 0 ,8/16^? = 20,626

Итак, с надежностью 0,95 неизвестный параметр а заключен в доверительном интервале 19,774 < а < 20,626

Оценка истинного значения измеряемой величины

Пусть производится n независимых равноточных измерений некоторой физической величины, истинное значение а которой неизвестно.

Будем рассматривать результаты отдельных измерений как случайные величины Хl, Х2,…Хn. Эти величины независимы (измерения независимы). Имеют одно и то же математическое ожидание а (истинное значение измеряемой величины), одинаковые дисперсии ^2 (измерения равноточные) и распределены нормально (такое допущение подтверждается опытом).

Таким образом, все предположения, которые были сделаны при выводе доверительных интервалов, выполняются, и, следовательно, мы вправе использовать формулы. Другими словами, истинное значение измеряемой величины можно оценивать по среднему арифметическому результатов отдельных измерений при помощи доверительных интервалов.

Пример. По данным девяти независимых равноточных измерений физической величины найдены среднее арифметической результатов отдельных измерений х = 42,319 и «исправленное» среднее квадратическое отклонение s = 5,0. Требуется оценить истинное значение измеряемой величины с надежностью = 0,95.

Решение. Истинное значение измеряемой величины равно ее математическому ожиданию. Поэтому задача сводится к. оценке математического ожидания (при неизвестном) при помощи доверительного интервала покрывающего а с заданной надежностью = 0,95.

х - t()(s/n^?) < a < х + t()(s/n^?)

Пользуясь таблицей, по у = 0,95 и л = 9 находим

Найдем точность оценки:

t()(s/n^?) = 2 ,31 * 5/9^?=3.85

Найдем доверительные границы:

х - t()(s/n^?) = 42,319 - 3,85 = 38,469;

х + t()(s/n^?) = 42,319 +3,85 = 46,169.

Итак, с надежностью 0,95 истинное значение измеряемой величины заключено в доверительном интервале 38,469 < а < 46,169.

Доверительные интервалы для оценки среднего квадратического отклонения нормального распределения.

Пусть количественный признак X генеральной совокупности распределен нормально. Требуется оценить неизвестное генеральное среднее квадратическое отклонение по «исправленному» выборочному среднему квадратическому отклонению s. Для этого воспользуемся интервальной оценкой.

Интервальной оценкой (с надежностью) среднего квадратического отклонения о нормально распределенного количественного признака X по «исправленному» выборочному среднему квадратическому отклонению s служит доверительный интервал

s (1 -- q) < < s (1 + q) (при q < 1),

0 < < s (1 + q) (при q > 1),

где q находят по таблице по заданным n н.

Пример 1. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n = 25 найдено «исправленное» среднее квадратическое отклонение s = 0,8. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,95.

Решение. По таблице по данным = 0,95 и n = 25 найдем q = 0,32.

Искомый доверительный интервал s (1 -- q) < < s (1 + q) таков:

0,8(1-- 0,32) < < 0,8(1+0,32), или 0,544 < < 1,056.

Пример 2. Количественный признак X генеральной совокупности распределен нормально. По выборке объема n=10 найдено «исправленное» среднее квадратическое отклонение s = 0,16. Найти доверительный интервал, покрывающий генеральное среднее квадратическое отклонение с надежностью 0,999.

Решение. По таблице приложения по данным = 0,999 и n=10 найдем 17= 1,80 (q > 1). Искомый доверительный интервал таков:

0 < < 0,16(1 + 1,80), или 0 < < 0,448.

Оценка точности измерений

В теории ошибок принято точность измерений (точность прибора) характеризовать с помощью среднего квадратического отклонения случайных ошибок измерений. Для оценки используют «исправленной» среднее квадратическое отклонение s. Поскольку обычно результаты измерений взаимно независимы, имеют одно и то же математическое ожидание (истинное значение измеряемой величины) и одинаковую дисперсию (в случае равноточных измерений), то теория, изложенная в предыдущем параграфе, применима для оценки точности измерений.

Пример. По 15 равноточным измерениям найдено «исправленное» среднее квадратическое отклонение s = 0,12. Найти точность измерений с надежностью 0,99.

Решение. Точность измерений характеризуется средним квадратическим отклонением случайных ошибок, поэтому задача сводится к отысканию доверительного интервала s (1 -- q) < < s (1 + q) , покрывающего с заданной надежностью 0,99

По таблице приложения по = 0,99 и n=15 найдем q = 0,73.

Искомый доверительный интервал

0,12(1-- 0,73) < < 0,12(1+0,73), или 0.03 < < 0,21.

Оценка вероятности (биномиального распределения) по относительной частоте

Интервальной оценкой (с надежностью) неизвестной вероятности p биномиального распределения по относительной частоте w служит доверительный интервал (с приближенными концами p1 и р2)

p1 < p < p2,

где n - общее число испытаний; m - число появлений события; w - относительная частота, равная отношению m/n; t - значение аргумента функции Лапласа, при котором Ф(t) = /2.

Замечание. При больших значениях n (порядка сотен) можно принять в качестве приближенных границ доверительного интервала

Рассмотрим построение доверительного интервала для оценки математического ожидания.

Пусть - выборка объемаиз генеральной совокупности объема
;- выборочное среднее;- выборочное среднее квадратическое отклонение.

Доверительный интервал уровня надежности для математического ожидания (генеральной средней) имеет вид

,

где -предельная ошибка выборки , которая зависит от объема выборки , доверительной вероятностии равна половине доверительного интервала.

генеральной средней неизвестном служит доверительный интервал:

где - выборочное среднее;-исправленное выборочное среднее квадратическое отклонение; - параметр, который находится по таблице распределения Стьюдента для (
) степеней свободы и доверительной вероятности.

Интервальной оценкой с надежностью генеральной средней в случае нормального распределения генеральной совокупности приизвестном среднем квадратическом отклонении служит доверительный интервал:

где - выборочное среднее;
- выборочное среднее квадратическое отклонение;- значение аргумента функции Лапласа
, при котором
;- объем выборки.

Выводы . Доверительный интервал для среднего представляет интервал значений вокруг оценки, где с данным уровнем доверия, находится "истинное" (неизвестное) среднее значение признака.

Хорошо известно, например, что чем «неопределенней» прогноз погоды (т.е. шире доверительный интервал), тем вероятнее он будет верным.

Пример. Найти доверительный интервал с надежностью 0,95 для оценки математического ожидания нормально распределенной случайной величины, если известны ее среднее квадратическое отклонение
, выборочная средняя
и объем выборки
.

Воспользуемся формулой
. Значениенайдем по таблице значений функции Лапласа
, с учетом того, что
, т.е.
. Находим по таблице для значения функции
значение аргумента
. Получим доверительный интервал:

; или
.

Тестовые задания

1. Длина доверительного интервала уменьшается с увеличением:

1) выборочных значений 2) объема выборки

3) доверительной вероятности 4) выборочного среднего

2. Длина доверительного интервала с увеличением объема выборки:

1) уменьшается; 2) увеличивается;

3) не изменяется; 4) колеблется.

3. Длина доверительного интервала с увеличением доверительной вероятности:

1) изменяется, 2) уменьшается,

3) увеличивается, 4) постоянна.

4. Отметьте два правильных ответа. Символы ив формуле доверительного интервала означают:

1) оценка параметра; 2) доверительный интервал;

3) объем выборки; 4) доверительная вероятность.

Ответы. 1. 2). 2. 1 3. 2). 4. 4) и 3).

Контрольные Вопросы

    Что понимается под термином «интервальная оценка параметра распределения»?

    Дайте определение доверительного интервала.

    Что такое точность оценки и надежность оценки?

    Что называется доверительной вероятностью? Какие значения она принимает?

    Как изменится длина доверительного интервала, если увеличить: 1) объем выборки, 2) доверительную вероятность? Ответ обоснуйте.

    Запишите формулу для нахождения доверительного интервала математического ожидания нормально распределенной случайной величины, если генеральная дисперсия: 1) известна; 2) неизвестна.



Понравилась статья? Поделиться с друзьями: