Критерии выбросов в случае нормального распределения. Табличные значения критерия Ирвина для крайних элементов вариационного ряда В.В

Кроме того, аномальные уровни во временных рядах могут возникать из-за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически или очень редко – ошибки второго рода , они устранению не подлежат.

Для выявления аномальных уровней временных рядов используются методы, рассчитанные для статистических совокупностей.

Метод Ирвина.

Метод Ирвина предполагает использование следующей формулы:

где среднее квадратическое отклонение рассчитывается в свою очередь с использованием формул:

. (2)

Расчетные значения сравниваются с табличными значениями критерия Ирвина , и если оказываются больше табличных, то соответствующее значение уровня ряда считается аномальным. Значение критерия Ирвина для уровня значимости , т.е. с 5%-ной ошибкой, приведены в таблице 4.

Таблица 4.

2,8 2,3 1,5 1,3 1,2 1,1 1,0

После выявления аномальных уровней ряда обязательно определение причин их возникновения!

Если точно установлено, что аномалия вызвана ошибками первого рода, то соответствующие уровни ряда «поправляются» либо заменой простой средней арифметической соседних уровней ряда, либо значениями, полученными по кривой, аппроксимирующей данный временной ряд в целом.

Метод проверки разностей средних уровней.

Реализация этого метода состоит из четырех этапов.

1. Исходный временной ряд разбивается на две примерно равные по числу уровней части: в первой части первых уровней исходного ряда, во второй – остальных уровней .

2. для каждой из этих частей вычисляются среднее значение и дисперсии:

3. проверка равенства (однородности) дисперсий обеих частей ряда с помощью F-критерия Фишера, которая основана на сравнении расчетного значения этого критерия:

с табличным (критическим) значением критерия Фишера с заданным уровнем значимости (уровнем ошибки) . В качестве чаще всего берут значения 0,1 (10%-ная ошибка), 0,05 (5%-ная ошибка), 0,01 (1%-ная ошибка). Величина называется доверительной вероятностью. Если расчетное (эмпирическое) значение F меньше табличного , то гипотеза о равенстве дисперсий принимается и переходят к четвертому этапу. В противном случае, гипотеза о равенстве дисперсий отвергается и делается вывод, что данный метод для определения наличия тренда ответа не дает.

4. проверяется гипотеза об отсутствии тренда с использованием критерия Стьюдента. Для этого определяется расчетное значение критерия Стьюдента по формуле:

(3)

где среднее квадратическое отклонение разности средних:

.

Если расчетное значение меньше табличного значения статистики Стьюдента с заданным уровнем значимости , гипотеза принимается, то есть тренда нет, в противном случае тренд есть. Заметим, что в данном случае табличное значение берется для числа степеней свободы, равного , при этом данный метод применим только для рядов с монотонной тенденцией.

Метод Фостера-Стьюарта.

Этот метод обладает большими возможностями и дает более надежные результаты по сравнению с предыдущими. Кроме тренда самого ряда (тренда в среднем), он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен; если дисперсия увеличивается, то ряд «раскачивается» и т.д.

Реализация метода также состоит из четырех этапов.

1. производится сравнение каждого уровня со всеми предыдущими, при этом определяются две числовые последовательности:

2. вычисляются величины:

Нетрудно видеть, что величина , характеризующая изменение временного ряда, принимает значения от 0 (все уровни ряда равны между собой) до (ряд монотонный). Величина характеризует изменение дисперсии уровней временного ряда и изменяется от (ряд монотонно убывает) до (ряд монотонно возрастает).

1. отклонение величины от величины математического ожидания величины для ряда, в котором уровни расположены случайным образом;

2. отклонение величины от нуля.

Эта проверка проводится с использованием расчетных (эмпирических) значений критерия Стьюдента для средней и для дисперсии:

где математическое ожидание величины , определенной для ряда, в котором уровни расположены случайным образом;


Задания для самостоятельного изучения дисциплины.

Задание 1. В соответствии с вариантом, осуществить имитацию набора эмпирических данных, получаемых в результате измерения одномерного признака. Для этого необходимо осуществить табулирование функции:

, ,

и получить 15 – 20 последовательных данных. Здесь, предположительно характеристика признака (отражает основную тенденцию признака), а помехи (ошибки) измерений, которые явились следствием проявления случайностей различного рода.

Варианты исходных данных:

Осуществить выявление аномальных уровней получаемого при табулировании функции ряда данных и выполнить их сглаживание:

а). методом Ирвина, по формуле

,

.

Расчетные значения сравниваются с табличными значениями критерия Ирвина:

Таблица критерия Ирвина

В таблице приведены значения критерия Ирвина для уровня значимости (с 5% ошибкой).

б). методом проверки разностей средних уровней, разбивая временной ряд данных, примерно на две равные части и вычисляя для каждой из частей среднее значение и дисперсию. Далее, проверить равенство дисперсий обеих частей с помощью критерия Фишера. Если гипотеза о равенстве дисперсий принимается, перейти к проверке гипотезы об отсутствии тренда с использованием критерия Стьюдента. Для вычисления эмпирического значения статистики, использовать формулы:

,

где среднее квадратическое отклонение разностей средних:

.

Расчетное значение статистики сравнить с табличным.

в). Методом Фостера-Стьюарта.

2. Осуществить механическое сглаживание уровней ряда:

а). методом простой скользящей средней;

б). методом взвешенной скользящей средней;

в). Методом экспоненциального сглаживания.

Задание 2. В таблице данных экономических показателей, приведен временной ряд ежемесячных объемов перевозок (привязанных к определенной местности) сельскохозяйственных грузов в условных единицах.

Применяя метод Четверикова для выделения компонент временного ряда:

а). провести выравнивание эмпирического ряда с использованием центрированной скользящей средней с периодом сглаживания ;

б). полученную предварительную оценку тренда вычесть из исходного эмпирического ряда: .

в). Вычислить для каждого года (по строке) среднее квадратическое отклонение величины , используя для этого формулу

г). найти предварительное значение средней сезонной волны: .

д). получить ряд, лишенный сезонной волны: .

е). полученный ряд сгладить с использованием простой скользящей средней с интервалом сглаживания, равным пяти, и получить новую оценку тренда .

ж). вычислить отклонения ряда от исходного эмпирического ряда :

.

з). полученные отклонения подвергнуть обработке в соответствии с пп. в). и г). для выявления новых значений сезонной волны.

и). произвести вычисление коэффициента напряженности сезонной волны по формулам и далее (сам коэффициент):

.

Коэффициент напряженности не вычисляется для первого и последнего года.

к). Используя коэффициент напряженности, вычислить окончательные значения сезонной компоненты временного ряда: .

Задание 3. Временной ряд задан в таблице:

Осуществить предварительный выбор наилучшей кривой роста:

а). методом конечных разностей (Тинтнера);

б). методом характеристик прироста.

2. Для исходного ряда построить линейную модель , определив ее параметры методом наименьших квадратов.

3. Для исходного временного ряда построить адаптивную модель Брауна с параметром сглаживания и ; выбрать наилучшую модель Брауна , где период упреждения (количество шагов вперед).

4. Оценить адекватность моделей на основе исследований:

а). близости математического ожидания остаточной компоненты нулю; критическое значение статистики Стьюдента принять (для доверительной вероятности 0,70);

б). случайности отклонений остаточной компоненты по критерию пиков (поворотных точек); расчеты выполнить на основе соотношения ;

в). независимости (отсутствия автокорреляции) уровней рядя остатков либо по критерию Дарбина-Уотсона (в качестве критических используйте уровни и ), либо по первому коэффициенту автокорреляции (критический уровень принять равным );

г). нормальности закона распределения остаточной компоненты на основе RS-критерия (в качестве критических уровней принять интервал (2,7 – 3,7)).

5. Оценить точность моделей используя показатели среднего квадратического отклонения и средней относительной ошибки аппроксимации.

6. На основе сравнительного анализа адекватности и точности моделей выбрать лучшую модель, по которой построить точечный и интервальный прогнозы на два шага вперед (). Результаты прогнозирования отразить графически.

Задание 4. Проведена оценка процессоров 10-ти рабочих станций локальной сети, построенной на базе машин приблизительно одного типа, но разных производителей (что предполагает некоторые отклонения параметров работы машин от базовой модели). Для тестирования работы процессоров использована смесь типа ICOMP 2.0 в основу которой положены два основных теста:

1. 125.turb3D – тест моделирования турбулентности в кубическом объеме (прикладное ПО);

2. NortonSI32 – инженерная программа типа AutoCaD

и вспомогательный тест для нормирования времени обработки данных SPECint_base95. Оценка процессоров производилась по взвешенному времени выполнения смеси, нормированному по эффективности базового процессора, в соответствии с формулой

где время выполнения го теста;

вес го теста;

эффективность базового процессора на м тесте.

Если выражение (1) логарифмировать, то получим:

и после переобозначения переменных:

базовое время обработки теста SPECint_base95 ;

логарифм времени обработки первого теста,

логарифм времени обработки второго теста, регрессионный коэффициент, получаемый в оценках (вес теста);

регрессионный коэффициент – вес теста обработки арифметических операций в целых числах (базовый тест).

1. По данным измерений, приведенным в таблице, построить регрессионную (эмпирическую) функцию, оценить коэффициенты регрессии и проверить модель на адекватность (вычислить ковариационную матрицу, коэффициенты парной корреляции, коэффициент детерминации).

Варианты данных:

Вариант 1.

Вариант 2.

Вариант 3.

Вариант 4.

Задача 19.1 Трещина расположенав поле действия максимальных растягивающих напряжений, вызванных взрывом одиночного цилиндрического заряда.Определить расстояние от заряда до трещины, при котором возможен ее рост.

Исходные данные : длина трещины 2l =0,1м; порода – кварциты с вязкостью разрушения К I =2,6∙10 6 Н/м 3/2 ; максимальное давление заряда в скважине P 0 =1,2∙10 10 Па.

Решение. Распределение максимальных квазистатических напряжений приближенно описывается зависимостями:

где и - радиальные и окружные напряжения;

Р 0 – максимальное давление при взрыве заряда в скважине;

r 0 – радиус заряда, м;

r – расстояние до рассматриваемой точки, м;

n – показатель степени, принимающий значения n =2 в упругой среде; в реальной среде с учетом формирования множества трещин в зонах измельчения и дробления показатель степени больше двух; экспериментальное значение находится в пределах n =2.1...2,3. В расчете используем среднюю величину n =2,2.

В соответствии с критерием Ирвина рост трещины происходит в случае, когда коэффициент интенсивности напряжений достигает значения вязкости разрушения:

К 1 = К c , (19.3)

где К I – коэффициент интенсивности напряжений, величина которого в рассматриваемом случае, с учетом знака растягивающих напряжений, вычисляется по формуле

. (19.4)

Подставляя (19.4) с учетом (19.1) и (19.2) в (19.3) после преобразований получим:

(19.5)

На рисунке 19.1 представлены результат расчета. При заданных условиях расстояние от заряда до трещины, при котором возможен ее рост, составляет 3,8 м. На очновании расчетной зависимости (19.5) можно утверждать, что чем больше радиус заряда, давление и полудлина трещины, тем больше радиус зоны дробления.

Параметры l и K I являются технологически неуправляемыми и характеризуют свойства породного массива. Управляемыми параметрами являются радиус заряда r 0 и величина максимального давления P 0 . Так, например, увеличение радиуса заряда в два раза приводит к линейному увеличению радиуса r зоны дробления также в два раза. Если же максимальное давление P 0 в скважине увеличить в два раза, то радиус r зоны дробления увеличивается примерно в 1,4 раза. Такой практический вывод следует из механики разрушения с использованием критерия Ирвина.

Задача 19.2 На контуре горизонтальной подземной горной выработки, пройденной в песчанике, действуют горизонтальные напряжения σ z , направленные вдоль оси выработки и окружные напряжения σ θ . В поверхностном слое выработки имеются хаотично расположенные трещины длиной 2l . Установить критические размеры трещин, при которых происходит их рост.

Исходные данные : σ z =10 МПа, σ θ =20 МПа. Вязкость разрушения песчанника для трещины в поле сдвиговых напряжений (трещина второго рода) составляет K II =0,96∙10 6 Н/м 3/2 .

Решение. На контуре выработки действуют следующие главные напряжения: σ 1 =20 МПа; σ 2 =10 МПа; σ 3 =0. Максимальные касательные напряжения, действующие в плоскости под углом 45ْ к поверхности выработки, составляют:

. (19.5)

Если трещина расположена в плоскости действия максимальных касательных напряжений, то ее предельный устойчивый размер можно определить, используя критерий Ирвина.

При относительном скольжении деталей пар трения происходит повреждение контактирующих поверхностей. Этот вид повреждения поверхностных объемов детали называют износом. Потеря всего одной тысячной массы машины в результате изнашивания приводит к полной утрате работоспособности. Каждые три года...
(Механика. Основы расчёта и проектирования деталей машин)
  • КРИТЕРИИ УСТОЙЧИВОСТИ СИСТЕМ И МЕТОДЫ ОПРЕДЕЛЕНИЯ КРИТИЧЕСКИХ НАГРУЗОК
    Известны три основных критерия устойчивости сооружений: динамический, статический и энергетический, которые определяют и методику расчета сооружений на устойчивость. 1. Динамический (по Ляпунову) критерий основан на исследовании решений уравнений динамического движения отклоненной от начального...
    (Строительная механика плоских стержневых систем)
  • КРИТЕРИИ ВЫБОРА КАНАЛОВ РАСПРОСТРАНЕНИЯ РЕКЛАМЫ
    Среди всех решений, которые принимаются в процессе планирования, наиболее важным является выбор конкретных медианосителей внутри каждого медиа. Как правило, медиапланеры стремятся выбирать те носители, которые позволяют добиться следующих целей: 1) добиться заданной частоты предъявления рекламного сообщения...
    (Психология массовых коммуникаций)
  • Корреляционно-регрессионный анализ
    Корреляция и регрессия относятся к методам выявления статистической зависимости между исследуемыми переменными. “На основе анализа эмпирических данных, собранных в ходе проведения исследования, описывается не только сам факт существования статистической зависимости, но и математическая формула функции...
    (Маркетинговые исследования)
  • КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ МЕТОД ИССЛЕДОВАНИЯ
    Одним из методов моделирования экономических процессов является корреляционно-регрессионный метод исследования. Моделирование представляет собой процесс выражения сложных взаимосвязанных экономических явлений средствами математических формул и символов. Сочетание качественного анализа с применением математических...
    (Общая и прикладная статистика)
  • КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
    Статистическое исследование экономических и технологических процессов в настоящее время является одним из важнейших инструментов при разработке систем управления процессами. Знание связей между параметрами позволяет выделить ключевые факторы, влияющие на качество готовой продукции или на исследуемые...
    (Математика и экономико-математические модели)


  • Понравилась статья? Поделиться с друзьями: