Статистическое изучение вариационных рядов и расчет средних величин. Статистическая совокупность, ее виды

Информатика и математика - Теоретические материалы для первого коллоквиума

1. Предмет математической статистики, её основные разделы. Понятие о статистическом распределении. Нормальное распределение. В каких условиях случайная величина распределена нормально?

Статистика – наука, узучающая совокупн. масс. явл-я с целью выявления закономерн. и изуч-я их с помощью обобщенных показателей.

Все методы математической статистики можно отнести к двум основным ее разделам: теории статистического оценивания параметров и теории проверки статистических гипотез .

Разделы :

1. дескриптивная статистика

2. выборочный метод, доверительные интервалы

3. корреляционный анализ

4. регрессионный анализ

5. анализ качественных признаков

6. многомерный статистический анализ:

а) кластерный

б) факторный

7. анализ временных рядов

8. дифференциальные уравнения

9. математическое моделирование исторических процессов

Распределение:

Теоретическое (бесконечно много объектов и они ведут себя идеально)

Эмпирическое (реальные данные, которые можно выстроить в гистограмму)

Нормальное распределение – когда характер распределения влияют много факторов, и ни один из них не является определяющим. Особенно часто используется на практике.


2. Нормальное распределение можно изобразить графически в виде симметричной одновершинной кривой, напоминающей по форме колокол. Высота (ордината) каждой точки этой кривой показывает, как часто встречается соответствующее значение. Дескриптивная статистика. Средние значения - среднее арифметическое, медиана, мода. В каких ситуациях эти три меры дают близкие значения, а в каких они сильно различаются?

Дескриптивная статистика - Это описательная статистика.

среднее арифметическое, медиана, мода – меры среднего – коэф-ты, которые могут охарактеризовать совокупность объектов

· среднее (арифметическое) значение ‑ сумма всех значений, отнесенная к общему числу наблюдений (принятые обозначения: Mean или ), т.е. средним арифметическим значением признака называется величина

где - значение признака у i -го объекта, n - число объектов в совокупности.

· мода – наиболее часто встречающееся значение переменной (M)

· медиана – среднее по порядку значение (принятые обозначения: Median, m). Медиана - это "серединное" значение признака в том смысле, что у половины объектов совокупности значения этого признака меньше, а у другой половины - больше медианы. Приближенно вычислить медиану можно, упорядочив все значения признака по возрастанию (убыванию) и найдя число в этом вариационном ряду, которое либо имеет номер (n +1)/2 - в случае нечетного n , либо находится посередине между числами с номерами n /2 и (n +1)/2 - в случае четного n .

Не все из перечисленных характеристик можно вычислять для качественных признаков. Если признак качественный и номинальный, то для него можно найти только моду (ее значением будет название наиболее часто встречающейся категории номинального признака). Если признак ранговый, то кроме моды для него можно найти еще и медиану. Среднее арифметическое значение можно вычислять только для количественных признаков.

В случае количественных данных все характеристики среднего уровня измеряются в тех же единицах, что и сам исходный признак.

Значения коэф-тов совпадают, если график распределения симметричен.


3. Показатели неоднородности - дисперсия, среднее квадратическое (стандартное) отклонение, коэффициент вариации. В каких единицах они измеряются? Зачем вводится понятие коэффициента вариации?

· среднее квадратическое или стандартное отклонение ‑ мера разброса значений признака около среднего арифметического значения (принятые обозначения: Std.Dev. (standard deviation ), s или s). Величина этого отклонения вычисляется по формуле

.

· дисперсия признака (s 2 или s 2 )

· коэффициент вариации ‑ отношение стандартного отклонения к среднему арифметическому, выраженное в процентах (обозначается в статистике буквой V ). Коэффициент вычисляется по формуле: .

Все эти меры можно вычислять только для количественных признаков. Все они показывают, насколько сильно варьируют значения признака (а точнее - их отклонения от среднего) в данной совокупности. Чем меньше значение меры разброса, тем ближе значения признака у всех объектов к своему среднему значению, а значит, и друг к другу. Если величина меры разброса равна нулю, значения признака у всех объектов одинаковы.

Наиболее часто используется среднее квадратическое (или стандартное) отклонение s. Оно измеряется, как и среднее арифметическое, в тех же единицах, что и сам исходный признак. При изменении всех значений признака в несколько раз, точно так же изменится и стандартное отклонение, однако если все значения признака увеличить (уменьшить) на некоторую величину, его стандартное отклонение не изменится . Наряду со стандартным отклонением часто пользуются дисперсией (=его квадрату), однако на практике она является менее удобной мерой, т.к. единицы измерения дисперсии не соответствуют единицам измерения.

Смысл коэффициента вариации состоит в том, что он, в отличие от s, измеряет не абсолютную, а относительную меру разброса значений признака в статистической совокупности.

Чем больше V , тем совокупность менее однородна.

Однородная Переходная Неоднородная

V =0 – 30% V =30 – 50% V =50 – 100%

Может быть »100% (слишком неоднородная совокупность).


4. Понятие о выборочном методе. Репрезентативная выборка, методы её формированияю Два вида ошибок выборки. Доверительная вероятность.

Выборка:

Репрезентативная

Случайная

Механическая выборка – сходна со случайной выборкой (кажд. 10й, 20й и т.п.).

Естественная(то, что осталось от ГС с течением времени) выборки.

Репрезентативная выборка – точно отражает свойства генеральной совокупности.

Чтобы выборка правильно отражала основные свойства, присущие генеральной совокупности, она должна быть случайной , т.е. все объекты генеральной совокупности должны иметь равные шансы попасть в выборку

Выборки формируются с помощью спец. методик. Наиболее простым является случайный отбор, например, при помощи обычной жеребьевки (для небольших совокупностей) или с использованием таблиц случайных чисел. Для более обширных, но достаточно однородных совокупностей используется механический отбор (применявшийся еще в земской статистике). Для неоднородных совокупностей с определенной структурой чаще применяется типический отбор. Существуют и другие методы, в том числе - комбинации разных способов отбора на нескольких этапах построения выборочной совокупности.

В выборочных результатах всегда присутствуют ошибки. Эти ошибки можно разделить на два класса: случайные и систематические. К первым относятся случайные отклонения выборочных характеристик от генеральных, обусловленные самой природой выборочного метода. Величина случайной ошибки поддается вычислению (оценке). Систематические ошибки, наоборот, не носят случайного характера; они связаны с отклонением структуры выборки от реальной структуры генеральной совокупности. Систематические ошибки появляются тогда, когда нарушается основное правило случайного отбора - обеспечение для всех объектов равных шансов поапсть в выборку. Ошибки этого рода статистика не умеет оценивать.

Основными источниками систематических ошибок являются: а) неадекватность сформированной выборки задачам исследования; б) незнание характера распределения в генеральной совокупности и, как следствие, нарушение в выборке структуры генеральной совокупности; в) сознательный отбор наиболее удобных и выигрышных элементов генеральной совокупности.

Доверительная вероятность –


5. Доверительная вероятность. Средняя (стандартная) и предельная ошибки выборки. Доверительный интервал для оценки среднего значения в генеральной совокупности. Проверка гипотезы о статистической значимости различия двух выборочных средних.

Доверительный интервал - тот значений рассчитываемого коэф-та, в к-й, мы считаем,должно попасть это значение для ген. Совокуп-ти.

Доверительная вероятность – вероятность того, что значение рассчитываемого коэф-та для ген. Совокупности попадет в доверительный интервал. Чеи больше ДВ, тем больше ДИ.

Неизбежный разброс выборочных средних вокруг генеральной средней (т.е. стандартное отклонение выборочных средних) называется стандартной ошибкой выборки m , которая выражается формулой (s - среднее квадратическое отклонение, n - объем выборки). стандартная ошибка выборки тем меньше, чем меньше величина s (которая характеризует разброс значений признака) и чем больше объем выборки n .

Если выборочный метод используется для работы с неколичественными данными, то роль среднего арифметического значения в совокупности играет доля или частота q признака. Доля вычисляется как отношение числа объектов, обладающих данным признаком (), к числу объектов во всей совокупности: . Роль меры разброса играет величина .

В этом случае стандарная ошибка выборки m вычисляется по формуле:

Точность и надежность оценки параметров генеральной совокупности по выборке находятся в обратной зависимости: чем больше точность (т.е. чем меньше предельная ошибка и чем уже доверительный интервал), тем меньше надежность такой оценки (степень уверенности). И наоборот - чем ниже точность оценки, тем выше ее надежность. Часто доверительный интервал строят для надежности 95%, соответственно предельная ошибка выборки обычно равна удвоенной средней ошибке m ..

Доверительный интервал для оценки среднего значения в генеральной совокупности:

X (г.с.) = x (выб.) +-Δ = x (выб.) +- = X (выб.) +- σ(г.с.)/√ n

Критерий для разности средних значений

Часто возникает задача сравнения двух выборочных средних с целью проверки гипотезы о том, что эти выборки получены из одной и той же генеральной совокупности, а реальные расхождения в значениях выборочных средних объясняются случайностями выборок.

Испытуемую гипотезу можно сформулировать следующим образом: различие между выборочными средними случайно, т.е. генеральные средние в обоих случаях равны. В качестве статистической характеристики снова используется величина t , предсталяющая собой разность выборочных средних, деленную на усредненную стандартную ошибку среднего по обеим выборкам.

Фактическое значение статистической характеристики сравнивается с критическим значением, соответсвующим выбранному уровню значимости. Если фактическое значение больше, чем критическое, испытуемая гипотеза отклоняется, т.е. различие между средними считается значимым (существенным).


7. Корреляционная связь. Линейный коэффициент корреляции, его формула, пределы его значений. Коэффициент детерминации, его содержательный смысл. Понятие о статистической значимости коеффициента корреляции.

Коэффициент корреляции показывает, насколько тесно две переменных связаны между собой .

Коэффициент корреляции r принимает значения в диапазоне от -1 до +1. Если r = 1, то между двумя переменными существует функциональная положительная линейная связь, т.е. на диаграмме рассеяния соответствующие точки лежат на одной прямой с положительным наклоном. Если r = -1, то между двумя переменными существует функциональная отрицательная зависимость. Если r = 0, то рассматриваемые переменные линейно независимы , т.е. на диаграмме рассеяния облако точек "вытянуто по горизонтали".

Уравнение регрессии и коэффициент корреляции целесообразно вычислять лишь в том случае, когда зависимость между переменными может хотя бы приближенно считаться линейной. В противном случае результаты могут быть совершенно неверными, в частности коэффициент корреляции может оказаться близким к нулю при наличии сильной взаимосвязи. В особенности это характерно для случаев, когда зависимость имеет явно нелинейный характер (например, зависимость между переменными приблизительно описывается синусоидой или параболой). Во многих случаях эту проблему можно обойти, преобразовав исходные переменные. Однако, чтобы догадаться о необходимости подобного преобразования, т.е. для того чтобы узнать, что данные могут содержать сложные формы зависимости, их желательно “увидеть”. Именно поэтому исследование взаимосвязей между количественными переменными обычно должно включать просмотр диаграмм рассеяния.

Коэффициенты корреляции можно вычислять и без предварительного построения линии регрессии. В этом случае вопрос о интерпретации признаков как результативных и факторных, т.е. зависимых и независимых, не ставится, а корреляции понимается как согласованность или синхронность одновременного изменения значений признаков при переходе от объекта к объекту.

Если объекты характеризуются целым набором количественных признаков, можно сразу построить т.н. матрицу корреляции, т.е. квадратную таблицу, число строк и столбцов которой равно числу признаков, а на пересечении каждых строки и столбца стоит коэффициент корреляции соответствующей пары признаков.

Коэффициент корреляции не имеет содержательной интерпретации. Однако его квадрат, называемый коэффициентом детерминации (R 2 ), имеет.

коэффициентом детерминации (R 2) – это показатель того, насколько изменения зависимого признака объясняются изменениями независимого. Более точно, это доля дисперсии независимого признака, объясняемая влиянием зависимого .

Если две переменные функционально линейно зависимы (точки на диаграмме рассеяния лежат на одной прямой), то можно сказать, что изменение переменной y полностью объясняется изменением переменной x, а это как раз тот случай, когда коэффициент детерминации равен единице (при этом коэффициент корреляции может быть равен как 1, так и -1). Если две переменные линейно независимы (метод наименьших квадратов дает горизонтальную прямую), то переменная y своими вариациями никоим образом "не обязана" переменной x – в этом случае коэффициент детерминации равен нулю. В промежуточных случаях коэффициент детерминации указывает, какая часть изменений переменной y объясняется изменением переменной x (иногда удобно представлять эту величину в процентах).


8. Парная и множественная линейная регрессия. Коэффициент множественной корреляции. Содержательный смысл коэффициента регрессии, его значимость, понятие о t -статистике. Содержательный смысл коэффициента детерминации R 2.

Регрессионный анализ - Статистический метод, позволяющий строить объясняющие модели на основе взаимодействия признаков.

Самым простым случаем взаимосвязи является парная взаимосвязь , т.е. связь между двумя признаками. При этом предполагается, что взаимосвязь двух переменных носит, как правило, причинный характер т.е. одна из них зависит от другой. Первая (зависимая) называется в регрессионном анализе результирующей, вторая (независимая) - факторной . Следует заметить, что не всегда можно однозначно определить, какая из двух переменных является независимой, а какая - зависимой. Часто связь может рассматриваться как двунаправленная.

Уравнение парной регрессии : y = kx + b .

Чаще всего на зависимую переменную действуют сразу несколько факторов, среди которых трудно выделить единственный или главный Так, к примеру, доход предприятия зависит одновременно от двух факторов производства - числа рабочих и энерговооруженности. Причем оба этих фактора сами не являются независимыми друг от друга.

Уравнение множественной регрессии : y = k 1 · x 1 + k 2 · x 2 + … + b,

где x 1 , x 2 , . . . – независимые переменные, от которых в той или иной степени зависит исследуемая (результирующая) переменная y;

k 1 , k 2 . . . – коэффициенты при соответствующих переменных (коэффициенты регрессии ), показывающие, насколько изменится значение результирующей переменной при изменении отдельной независимой переменной на единицу.

Уравнение множественной регрессии задает регрессионную модель , объясняющую поведение зависимой переменной. Никакая регрессионная модель не в состоянии указать, какая переменная является зависимой (следствием), а какие – независимыми (причинами).

R – множественный коэф. корреляции, измеряет совокупность воздействия независимых признаков, тесноту связи результирующего признака со всей совокупностью независимых признаков, выраженных в %.

Показывает какова доля учтенных признаков в отделении результата, т.е. на сколько % вариация признака у объясняется вариациями учтенных признаков Х1, Х2, Х3.

T -статистика показывает уровень стат. значимости кажд. ккоэф-та регресии, т.е. его устойчивость по отношению к выборке.

T = b / Δb

Статистически значимыми явл-ся t >2. Чем больше коэф-т, тем лучше.

через R ² мы делаем заключение о том, на сколько % учтенные признаки объясняют результат.


9.Методы многомерного статистического анализа. Кластер-анализ. Понятие об иерархическом методе и о методе К-средних. Многомерная классификация с использованием нечетких множеств.

МСА :

Кластерный анализ

Факторный анализ

Многомерное шкалирование

Кластерный анализ – объединение объектов в группу с единой целью (признаков много).

Способы кластерного анализа:

1. иерархический (дерево иерархического анализа):

основная идея иерархического метода заключается в последовательном объединении группируемых объектов - сначала самых близких, а затем все более удаленных друг от друга. Процедура построения классификации состоит из последовательных шагов, на каждом из которых производится объединение двух ближайших групп объектов (кластеров ).

2. метод К-средних .

Требует заранее заданных классов (кластеров). Подчеркивает внутриклассовую дисперсию. основан на гипотезе о наиболее вероятном количестве классов. Задачей метода является построение заданного числа кластеров, которые должны максимально отличаться друг от друга.

Процедура классификации начинается с построения заданного числа кластеров, полученных путем случайной группировки объектов. Каждый кластер должен состоять из максимально "похожих" объектов, причем сами кластеры должны быть максимально "непохожими" друг на друга.

Результаты этого метода позволяют получить центры всех классов (а также и другие параметры дескриптивной статистики) по каждому из исходных признаков, а также увидеть графическое представление о том, насколько и по каким параметрам различаются полученные классы.

Если рез-ты классификаций, полученные разными методами совпадают, то это подтверждает реальн. Сущ-е групп (надежность, достоверность).


10. Методы многомерного статистического анализа. Факторный анализ, цели его использования. Понятие о факторных весах, пределы их значений; доля суммарной дисперсии, объясняемой факторами.

Многомерный статистический анализ. Его цель: построение упрощенного укрупненного ряда объектов.

МСА :

Кластерный анализ

Факторный анализ

Многомерное шкалирование

В основе факторного анализа лежит идея о том, что за сложными взаимосвязями явно заданных признаков стоит относительно более простая структура, отражающая наиболее существенные черты изучаемого явления, а "внешние" признаки являются функциями скрытых общих факторов, определяющих эту структуру.

Цель: переход от большего числа признаков к небольшому числу факторов.

в факторном анализе все величины, входящие в факторную модель, стандартизированы, т.е. являются безразмерными величинами со средним арифметическим значением 0 и средним квадратическим отклонением 1.

Коэффициент взаимосвязи между некоторым признаком и общим фактором, выражающий меру влияния фактора на признак, называется факторной нагрузкой данного признака по данному общему фактору . Это число в интервале от -1 до 1. Чем дальше от 0, тем более сильная связь. Значение факторной нагрузки по некоторому фактору, близкое к нулю, говорит о том, что этот фактор практически на данный признак не влияет.

Значение (мера проявления) фактора у отдельного объекта называется факторным весом объекта по данному фактору. Факторные веса позволяют ранжировать, упорядочить объекты по каждому фактору. Чем больше факторный вес некоторого объекта, тем больше в нем проявляется та сторона явления или та закономерность, которая отражается данным фактором. Факторы являются стандартизованными величинами, не могут быть = нулю. Факторные веса, близкие к нулю, говорят о средней степени проявления фактора, положительные – о том, что эта степень выше средней, отрицательные – о том. что она ниже средней.

Таблица факторных весов имеет n строк по числу объектов и k столбцов по числу общих факторов. Положение объектов на оси каждого фактора показывает, с одной стороны, тот порядок, в котором они ранжированы по этому фактору, а с другой стороны, равномерность или же неравномерность в их расположении, наличие скоплений точек, изображающих объекты, что дает возможность визуально выделять более или менее однородные группы.


11. Виды качественных признаков. Номинальные признаки, примеры из исторических источников. Таблица сопряженности. Коэффициент связи номинальных признаков, пределы его значений.

Номинальные данные представлены категориями, для которых порядок абсолютно не важен. Для них не определен никакой другой способ сравнения, кроме как на буквальное совпадение/несовпадение.

Примеры номинальных переменных:

· Национальность: англичанин, белорус, немец, русский, японец и пр.

· Род занятий: служащий, врач, военный, учитель и т.д.

· Профиль образования: гуманитарное, техническое, медицинское, юридическое и т.д.

Если в случае с уровнем образования мы еще могли сравнивать людей в терминах "лучше-хуже" или "выше-ниже", то теперь мы лишены даже этой возможности; единственный корректный способ сравнения ‑ это говорить, что данные персоналии "все являются историками", или "все не являются юристами".

Таблицы сопряженности

Таблицей сопряженности называется прямоугольная таблица, по строкам которой указываются категории одного признака (например, разные социальные группы), а по столбцам - категории другого (например, партийная принадлежность). Каждый объект совокупности попадает в какую-либо из клеток этой таблицы в соответствии с тем, в какую категорию он попадает по каждому из двух признаков. Таким образом, в клетках таблицы стоят числа, представляющие собой частоты совместной встречаемости категорий двух признаков (число людей, принадлежащих конкретной социальной группе и входящих в определенную партию). В зависимости от характера распределения этих частот внутри таблицы можно судить о том, существует ли связь между признаками. Что означает связь между социальным статусом и партийной принадлежностью? В данном случае о наличии связи свидетельствовало бы наличии определенных политических пристрастий у членов разных социальных групп. Формально говоря, эта связь понимается как более частая (или наоборот, редкая) совместная встречаемость отдельных комбинаций категорий по сравнению с ожидаемой встречаемостью - ситуацией чисто случайного попадания объектов туда (например, более высокая доля крестьян в партии трудовиков, а дворян - в партии кадетов, чем доли этих социальных групп во всей совокупности депутатов Думы).


12. Виды качественных признаков. Ранговые признаки, примеры из исторических источников. В каких пределах находятся значения коэффициента ранговой корреляции? Какие коэффициенты следует использовать для оценки связи рангового и номинального признаков?

качественные (или категориальные) данные делятся на два типа: ранговые и номинальные.

Ранговые данные представлены категориями, для которых можно указать порядок, т.е. категории сравнимы по принципу "больше-меньше" или "лучше-хуже".

Примеры ранговых переменных:

· Оценки на экзаменах имеют явно выраженную ранговую природу и выражаются категориями типа: "отлично", "хорошо", "удовлетворительно" и т.д.

· Уровень образования может быть представлен как набор категорий: "высшее", "среднее" и т.п.

Несомненно, мы можем ввести ранговую шкалу и с ее помощью упорядочить всех людей, для которых мы знаем их уровень образования или балл на экзамене. Однако, верно ли, что оценка "хорошо" на столько же хуже, чем "отлично", насколько оценка "удовлетворительно" хуже, чем "хорошо"? Несмотря на то, что формально, в случае с оценками, можно получить разницу в баллах, вряд ли корректно измерять расстояние от "отличника" до "хорошиста" пользуясь теми же правилами, что для расстояния от Москвы до Петербурга. В случае с уровнем образования особенно отчетливо видно, что простые вычисления невозможны, поскольку не существует единого правила вычитания "среднего" уровня образования из "высшего", даже, если мы присвоим высшему образованию код "3", а среднему – код "2".

Своеобразие качественных данных не означает, что их нельзя анализировать с помощью математических и статистических методов.

Ряд объектов, упорядоченных в соответствии со степенью проявления некоторого свойства, называют ранжированным, каждому числу такого ряда присваивается ранг .

Меры взаимосвязи между парой признаков, каждый из которых ранжирует изучаемую совокупность объектов, называются в статистике коэффициентами ранговой корреляции .

Эти коэффициенты строятся на основе следующих трех свойств:

· если ранжированные ряды по обоим признакам полностью совпадают (т.е. каждый объект занимает одно и то же место в обоих рядах), то коэффициент ранговой корреляции должен быть равен +1, что означает полную положительную корреляцию:

· если объекты в одном ряду расположены в обратном порядке по сравнению со вторым, коэффициент равен -1, что означает полную отрицательную корреляцию;

· в остальных ситуациях значения коэффициента заключены в интервале [-1, +1]; возрастание модуля коэффициента от 0 до 1 характеризует увеличение соответствия между двумя ранжированными рядами.

Указанными свойствами обладают коэффициенты ранговой корреляции Спирмена r и Кедалла t .

Коэффициент Кедалла дает более осторожную оценку корреляции, чем коэффициент Спирмена (числовое значение t всегда меньше, чем r ).

Коэффициенты взаимосвязи качественных признаков

Для оценки связи качественных признаков необходим коэффициент, к-й имел бы определенный максимум в случае максимальной связи и позволял бы сравнивать между собой разные таблицы по силе связи между признаками. В данном случае нам подходит коэффициент Крамера V .

Базируясь на значении критерия хи-квадрат, коэффициент Крамера позволяет измерять силу связи между двумя категоризованными переменными - измерить ее числом, принимающим значения от 0 до 1, т.е. от полного отсутствия связи до максимальной сильной связи. Коэффициент позволяет сравнить зависимости разных признаков, с тем, чтобы выявить более и менее сильные связи.


13. Математическое моделирование исторических процессов и явлений. Определение понятия «модель». Три типа моделей, примеры их использования в исторических исследованиях.

14. Дифференциальные уравнения как основной инструмент построения математических моделей теоретического типа. Их особенности в сравнении с моделями иммитационного и статистического типа. Пример такой модели.

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину.

Известно, что единицы каждого массового явления обладают многочисленными признаками. Какой бы из этих признаков мы ни взяли, его значения у отдельных единиц будут различными, они изменяются, или, как говорят в статистике , варьируют от одной единицы к другой. Так, например, заработная плата работника определяется его квалификацией, характером труда, стажем работы и целым рядом других факторов, поэтому изменяется в весьма широких пределах. Совокупное влияние всех факторов определяет размер заработка каждого работника, тем не менее можно говорить о среднемесячной заработной плате работников разных отраслей экономики . Здесь мы оперируем типичным, характерным значением варьирующего признака, отнесенным к единице многочисленной совокупности.

Средняя величина отражает то общее, что характерно для всех единиц изучаемой совокупности. В то же время она уравновешивает влияние всех факторов, действующих на величину признака отдельных единиц совокупности, как бы взаимно погашая их. Уровень (или размер) любого общественного явления обусловлен действием двух групп факторов. Одни из них являются общими и главными, постоянно действующими, тесно связанными с природой изучаемого явления или процесса, и формируют то типичное для всех единиц изучаемой совокупности, которое и отражается в средней величине. Другие являются индивидуальными, их действие выражено слабее и носит эпизодический, случайный характер. Они действуют в обратном направлении, обусловливают различия между количественными признаками отдельных единиц совокупности, стремясь изменить постоянную величину изучаемых признаков. Действие индивидуальных признаков погашается в средней величине. В совокупном влиянии типичных и индивидуальных факторов, которое уравновешивается и взаимно погашается в обобщающих характеристиках, проявляется в общем виде известный из математической статистики фундаментальный закон больших чисел.

В совокупности индивидуальные значения признаков сливаются в общую массу и как бы растворяются. Отсюда и средняя величина выступает как «обезличенная», которая может отклоняться от индивидуальных значений признаков, не совпадая количественно ни с одним из них. Средняя величина отражает общее, характерное и типичное для всей совокупности благодаря взаимопогашению в ней случайных, нетипичных различий между признаками отдельных ее единиц, так как ее величина определяется как бы общей равнодействующей из всех причин.

Однако для того, чтобы средняя величина отражала наиболее типичное значение признака, она должна определяться не для любых совокупностей, а только для совокупностей, состоящих из качественно однородных единиц. Это требование является основным условием научно обоснованного применения средних величин и предполагает тесную связь метода средних величин и метода группировок в анализе социально-экономических явлений. Следовательно, средняя величина - это обобщающий показатель, характеризующий типичный уровень варьирующего признака в расчете на единицу однородной совокупности в конкретных условиях места и времени.

Определяя, таким образом, сущность средних величин, необходимо подчеркнуть, что правильное исчисление любой средней величины предполагает выполнение следующих требований:

  • качественная однородность совокупности, по которой вычислена средняя величина. Это означает, что исчисление средних величин должно основываться на методе группировок, обеспечивающем выделение однородных, однотипных явлений;
  • исключение влияния на вычисление средней величины случайных, сугубо индивидуальных причин и факторов. Это достигается в том случае, когда вычисление средней основывается на достаточно массовом материале, в котором проявляется действие закона больших чисел, и все случайности взаимно погашаются;
  • при вычислении средней величины важно установить цель ее расчета и так называемый определяющий показа-телъ (свойство), на который она должна быть ориентирована.

Определяющий показатель может выступать в виде суммы значений осредняемого признака, суммы его обратных значений, произведения его значений и т. п. Связь между определяющим показателем и средней величиной выражается в следующем: если все значения осредняемого признака заменить средним значением, то их сумма или произведение в этом случае не изменит определяющего показателя. На основе этой связи определяющего показателя со средней величиной строят исходное количественное отношение для непосредственного расчета средней величины. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Средняя величина, рассчитанная в целом по совокупности, называется общей средней; средние величины, рассчитанные для каждой группы, - групповыми средними. Общая средняя отражает общие черты изучаемого явления, групповая средняя дает характеристику явления, складывающуюся в конкретных условиях данной группы.

Способы расчета могут быть разные, поэтому в статистике различают несколько видов средней величины, основными из которых являются средняя арифметическая, средняя гармоническая и средняя геометрическая.

В экономическом анализе использование средних величин является основным инструментом для оценки результатов научно-технического прогресса, социальных мероприятий, поиска резервов развития экономики. В то же время следует помнить о том, что чрезмерное увлечение средними показателями может привести к необъективным выводам при проведении экономико-статистического анализа. Это связано с тем, что средние величины, будучи обобщающими показателями, погашают, игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Виды средних величин

В статистике используют различные виды средних величин, которые делятся на два больших класса:

  • степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадра-тическая, средняя кубическая);
  • структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения, поэтому их называют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней величины - средняя арифметическая. Под средней арифметической понимается такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. Вычисление данной величины сводится к суммированию всех значений варьирующего признака и делению полученной суммы на общее количество единиц совокупности. Например, пять рабочих выполняли заказ на изготовление деталей, при этом первый изготовил 5 деталей, второй - 7, третий - 4, четвертый - 10, пятый- 12. Поскольку в исходных данных значение каждого варианта встречалось только один раз, для определения средней выработки одного рабочего следует применить формулу простой средней арифметической:

т. е. в нашем примере средняя выработка одного рабочего равна

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную. Например, рассчитаем средний возраст студентов в группе из 20 человек , возраст которых варьируется от 18 до 22 лет, где xi - варианты осредняемого признака, fi - частота, которая показывает, сколько раз встречается i-е значение в совокупности (табл. 5.1).

Таблица 5.1

Средний возраст студентов

Применяя формулу средней арифметической взвешенной, получаем:


Для выбора средней арифметической взвешенной существует определенное правило: если имеется ряд данных по двум показателям, для одного из которых надо вычислить

среднюю величину, и при этом известны численные значения знаменателя ее логической формулы, а значения числителя неизвестны, но могут быть найдены как произведение этих показателей, то средняя величина должна высчитывать-ся по формуле средней арифметической взвешенной.

В некоторых случаях характер исходных статистических данных таков, что расчет средней арифметической теряет смысл и единственным обобщающим показателем может служить только другой вид средней величины - средняя гармоническая. В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность при расчете обобщающих статистических показателей в связи с повсеместным внедрением электронно-вычислительной техники. Большое практическое значение приобрела средняя гармоническая величина, которая тоже бывает простой и взвешенной. Если известны численные значения числителя логической формулы, а значения знаменателя неизвестны, но могут быть найдены как частное деление одного показателя на другой, то средняя величина вычисляется по формуле средней гармонической взвешенной.

Например, пусть известно, что автомобиль прошел первые 210 км со скоростью 70 км/ч, а оставшиеся 150 км со скоростью 75 км/ч. Определить среднюю скорость автомобиля на протяжении всего пути в 360 км, используя формулу средней арифметической, нельзя. Так как вариантами являются скорости на отдельных участках xj = 70 км/ч и Х2 = 75 км/ч, а весами (fi) считаются соответствующие отрезки пути, то произведения вариантов на веса не будут иметь ни физического, ни экономического смысла. В данном случае смысл приобретают частные от деления отрезков пути на соответствующие скорости (варианты xi), т. е. затраты времени на прохождение отдельных участков пути (fi/ xi). Если отрезки пути обозначить через fi, то весь путь выразиться как Σfi, а время, затраченное на весь путь, - как Σ fi/ xi , Тогда средняя скорость может быть найдена как частное от деления всего пути на общие затраты времени:

В нашем примере получим:

Если при использовании средней гармонической веса всех вариантов (f) равны, то вместо взвешенной можно использовать простую (невзвешенную) среднюю гармоническую:

где xi - отдельные варианты; n - число вариантов осредняемого признака. В примере со скоростью простую среднюю гармоническую можно было бы применить, если бы были равны отрезки пути, пройденные с разной скоростью.

Любая средняя величина должна вычисляться так, чтобы при замене ею каждого варианта осредняемого признака не изменялась величина некоторого итогового, обобщающего показателя, который связан с осредняемым показателем. Так, при замене фактических скоростей на отдельных отрезках пути их средней величиной (средней скоростью) не должно измениться общее расстояние.

Форма (формула) средней величины определяется характером (механизмом) взаимосвязи этого итогового показателя с осредняемым, поэтому итоговый показатель, величина которого не должна изменяться при замене вариантов их средней величиной, называется определяющим показателем. Для вывода формулы средней нужно составить и решить уравнение, используя взаимосвязь осредняемого показателя с определяющим. Это уравнение строится путем замены вариантов осредняемого признака (показателя) их средней величиной.

Кроме средней арифметической и средней гармонической в статистике используются и другие виды (формы) средней величины. Все они являются частными случаями степенной средней. Если рассчитывать все виды степенных средних величин для одних и тех же данных, то значения

их окажутся одинаковыми, здесь действует правило мажо-рантности средних. С увеличением показателя степени средних увеличивается и сама средняя величина. Наиболее часто применяемые в практических исследованиях формулы вычисления различных видов степенных средних величин представлены в табл. 5.2.

Таблица 5.2


Средняя геометрическая применяется, когда имеется n коэффициентов роста, при этом индивидуальные значения признака представляют собой, как правило, относительные величины динамики, построенные в виде цепных величин, как отношение к предыдущему уровню каждого уровня в ряду динамики. Средняя характеризует, таким образом, средний коэффициент роста. Средняя геометрическая простая рассчитывается по формуле

Формула средней геометрической взвешенной имеет следующий вид:

Приведенные формулы идентичны, но одна применяется при текущих коэффициентах или темпах роста, а вторая - при абсолютных значениях уровней ряда.

Средняя квадратическая применяется при расчете с величинами квадратных функций, используется для измерения степени колеблемости индивидуальных значений признака вокруг средней арифметической в рядах распределения и вычисляется по формуле

Средняя квадратическая взвешенная рассчитывается по другой формуле:

Средняя кубическая применяется при расчете с величинами кубических функций и вычисляется по формуле

средняя кубическая взвешенная:

Все рассмотренные выше средние величины могут быть представлены в виде общей формулы:

где - средняя величина; - индивидуальное значение; n - число единиц изучаемой совокупности; k - показатель степени, определяющий вид средней.

При использовании одних и тех же исходных данных, чем больше k в общей формуле степенной средней, тем больше средняя величина. Из этого следует, что между величинами степенных средних существует закономерное соотношение:

Средние величины, описанные выше, дают обобщенное представление об изучаемой совокупности и с этой точки зрения их теоретическое, прикладное и познавательное значение бесспорно. Но бывает, что величина средней не совпадает ни с одним из реально существующих вариантов, поэтому кроме рассмотренных средних в статистическом анализе целесообразно использовать величины конкретных вариантов, занимающие в упорядоченном (ранжированном) ряду значений признака вполне определенное положение. Среди таких величин наиболее употребительными являются структурные, или описательные, средние - мода (Мо) и медиана (Ме).

Мода - величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда, т. е. вариант, обладающий наибольшей частотой. Мода может применяться при определении магазинов, которые чаще посещаются, наиболее распространенной цены на какой-либо товар. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле

где х0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; fm_ 1 - частота предшествующего интервала; fm+ 1 - частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности. Задача нахождения медианы для дискретного вариационного ряда решается просто. Если всем единицам ряда придать порядковые номера, то порядковый номер медианного варианта определяется как (п +1) / 2 с нечетным числом членов п. Если же количество членов ряда является четным числом, то медианой будет являться среднее значение двух вариантов, имеющих порядковые номера n / 2 и n / 2 + 1.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле

где X0 - нижняя граница интервала; h - величина интервала; fm - частота интервала; f - число членов ряда;

∫m-1 - сумма накопленных членов ряда, предшествующих данному.

Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на 4 равные части, а децили - на 10 равных частей. Квартилей насчитывается три, а децилей - девять.

Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристиками статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака. Эти, не очень характерные для совокупности значения вариантов, влияя на величину средней арифметической, не влияют на значения медианы и моды, что делает последние очень ценными для экономико-статистического анализа показателями.

Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения - атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум - это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k - число вариантов значений признака. Частоты удобно заменять частостями - wi. Частость - относительный показатель частоты - может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax - Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


Абсолютное значение (модуль) отклонения варианта от средней арифметической; f- частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая - в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации - дисперсию.

Дисперсия (σ 2) - средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (σ) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков - среднее линейное и среднее квадртическое отклонение - не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


Наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

где – соответственно максимальное и минимальное значение признака в совокупности;

– число групп.

Наглядно ряды распределения можно представить при помощи их графического изображения. Для этой цели строят полигон, гистограмму, кумулятивную кривую, огиву.

ТЕМА 4. Абсолютные и относительные величины

Понятие статистического показателя и его виды

Статистический показатель – это количественно-качественная обобщающая характеристика, какого-то свойства группы единиц или совокупности в целом в конкретных условиях места и времени. В отличие от признака, статистический показатель получается расчетным путем. Это может быть простой подсчет единиц совокупности, суммирование значений признака, сравнение двух и нескольких величин, более сложные сравнения.

1. По охвату единиц совокупности статистические показатели подразделяются:


2. По способу расчета статистические показатели подразделяются:

3. По пространственной определенности статистические показатели подразделяются:


По форме выражения статистические показатели подразделяются:

Абсолютные величины

Абсолютная величина (показатель) – это число, которое выражает размер, объем явления в конкретных условиях места и времени. Абсолютные величины всегда являются именованными величинами, т. е. имеют какую-либо единицу измерения. В зависимости от выбранной единицы измерения различают следующие виды абсолютных величин:

1. Натуральные – характеризуют объем и размер явления в мерах длины, веса, объема, количеством единиц, числом событий. Натуральные показатели используются для характеристики объема, размера отдельных одноименных видов продукции, в связи, с чем их использование ограничено.

2. Условно-натуральные – используются в том случае, если необходимо перевести разные виды продукции, но одинакового значения в один условный показатель. Условно-натуральный показатель рассчитывают путем перемножения натурального показателя на коэффициент перевода (пересчета). Коэффициенты перевода пересчета берутся из справочников или рассчитываются самостоятельно. Условно-натуральные показатели используются для характеристики объема, размера однородной продукции, в связи, с чем их использование ограничено.

3. Трудовые – имеют такие единицы измерения, как чел.-час., чел.-день. Используются для определения затрат рабочего времени, для расчета заработной платы и производительности труда.

4. Стоимостные (универсальные) измеряются в денежных единицах соответствующей страны. Стоимостные показатели = количество продукции в натуральном выражении * цена единицы продукции. Стоимостные показатели являются универсальными, так как позволяют определить объем, размер разного вида продукции.

Недостатки абсолютных показателей: нельзя охарактеризовать качественные особенности и структуру изучаемого явления, для этого используются относительные показатели, которые рассчитываются на основе абсолютных показателей.

Относительные величины

Относительный показатель – это показатель, который представляет собой частное от деления одного абсолютного показателя на другой и дает числовую меру соотношения между ними.


Неименованные О. П.

1. Коэффициент получается в том случае, если база сравнения равна 1. Если коэффициент больше 1, то он показывает во сколько раз сравниваемая величина больше, базы сравнения . Если коэффициент меньше 1 , то он показывает какую часть базы сравнения составляет сравниваемая величина .

2. Процент, получатся в том случае, если база сравнения равна 100. Процент получают умножением коэффициента на 100.

3. Промилле (‰) – если база сравнения равна 1000. Получают умножением коэффициента на 1000. Промилле используются для того, чтобы избежать дробных значений показателей. Они широко используются в демографической статистике, где показатели смертности, рождаемости, браков определяются на 1000 человек.

4. Продецимилле (‰0)если база сравнения равна 10000. Получают умножением коэффициента на 10000. Например, сколько приходится врачей, больничных коек на 10000 человек.

Виды относительных величин (показателей):

1. Относительный показатель структуры:

Данный показатель рассчитывается по группированным данным и показывает долю отдельных частей в общем объеме совокупности. Может выражаться в форме коэффициента (доли) или процента (удельные веса). Пример, 0,4 – доля, 40% – удельный вес. Сумма всех долей равна 1, а удельных весов 100%.

2. Относительный показатель динамики:

.

Данный показатель показывает изменение явления во времени. Выражается в форме коэффициента – коэффициент роста, и форме процента – темп роста.

3. Относительный показатель выполнения плана:

Данный показатель показывает степень выполнения плана и выражается в форме %.

Относительный показатель планового задания:

Данный показатель показывает, какое планируется изменение показателя в будущем по сравнению с предшествующем периодом и выражается в форме процента.

Взаимосвязь между показателями: .

5. Относительный показатель координации:

Данный показатель может рассчитываться на 1, 10, 100 единиц и показывает, сколько единиц одной части приходится в среднем на 1, 10, 100 единиц другой части. Например, численность городского населения на 1, 10, 100 жителей села

6. Относительный показатель интенсивности:

Данный показатель рассчитывается путем сравнения разноименных показателей, находящихся в определенной взаимосвязи между собой. Данный показатель может рассчитываться на 1, 10, 100 единиц и является именованным показателем. Например, плотность населения – чел./1, 10, 100 км2.

7. Относительный показатель сравнения:

Данный показатель рассчитывается путем сравнения одноименных показателей относящихся к одному и тому же периоду времени, но к разным объектам или территориям. Выражается в форме коэффициента и процента.

ТЕМА 5. Средние величины и показатели вариации

1. Средняя величина: понятие и виды

Средняя величина – это обобщающий показатель, характеризующий типичный уровень варьирующего количественного признака на единицу совокупности в определенных условиях места и времени.

Условия расчета средней величины:

1. Совокупность, по которой рассчитывается средняя величина, должна быть достаточно большой, иначе случайные отклонения в величине признака не будут погашаться и средняя не проявит закономерности, свойственной данному процессу.

2. Совокупность, по которой рассчитывается средняя величина, должна быть качественно однородной, иначе они не только не будут иметь научной ценности, но и могут принести вред, искажая истинный характер изучаемого явления.

3. Общая средняя величина должна дополняться групповыми средними. Общая средняя показывает типический размер всей совокупности, а групповые средние − отдельных ее частей со специфическими свойствами.

4. Для всесторонней характеристики явления должна быть рассчитана система средних показателей, по наиболее существенным признакам.

Средняя величина всегда именованная, она имеет ту же размерность, что и усредняемый признак.

Виды средних величин:

1. Степенные средние (к ним относятся средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая);

2. Структурные средние (мода и медиана).

Степенные средние рассчитываются по формуле (корень в степени R из средних всех вариантов взятых в какой-то степени):

где − степенная средняя величина исследуемого признака;

− индивидуальное значение усредняемого признака;

− показатель степени средней;

− число признаков (единичной совокупности);

− сумма.

В зависимости от степени получают различные виды простых средних.

Значение

Наименование простой средней

простая гармоническая

где П – произведение

простая геометрическая

простая арифметическая

простая квадратическая

Чем выше показатель степени () в степенной средней, тем больше величина самой средней. Если рассчитать все эти средние по одним и тем же данным получим следующее соотношение:

Это свойство степенных средних возрастать с повышением показателя степени определяющей функции называется правилом мажорантности средних.

Из этих видов средних наиболее часто используется средняя арифметическая и средняя гармоническая. Выбор вида средней зависит от исходной информации.

Средняя арифметическая: способы расчета и ее свойства

Средняя арифметическая – это частное от деления суммы индивидуальных значений признака всех единиц совокупности на число единиц совокупности.

Средняя арифметическая применяется в форме простой средней и взвешенной средней. Средняя арифметическая простая рассчитывается по формуле:

где − среднее значение признака;

− индивидуальные значения признака (варианты);

− число единиц совокупности (вариант).

Средняя арифметическая простая применяется в двух случаях:

· когда каждая варианта встречается только один раз в ряду распределения;

· когда все частоты равны между собой.

Средняя арифметическая взвешенная используется, когда частоты не равны между собой:

где − частоты или веса (числа, показывающие, сколько

раз встречаются индивидуальные значения

признака).

Свойства средней арифметической (без доказательств):

1. Средняя величина от постоянной величины равна ей самой: .

2. Произведение средней величины на сумму частот равно сумме произведения вариантов на их частоты: .

3. Если каждую варианту увеличить или уменьшить на одну и ту же величину, то средняя величина увеличится или уменьшится на эту же величину: .

4. Если каждую варианту увеличить или уменьшить в одно и то же число раз, то средняя величина увеличится или уменьшится в то же число раз: .

5. Если все частоты увеличить или уменьшить в одинаковое число раз, средняя величина не изменится: .

6. Средняя величина суммы равна сумме средних величин: .

7. Сумма отклонений всех значений признака от средней величины рана нулю.

3. Способы расчета средней гармонической

В некоторых случаях характер исходных данных такой, что расчет средней арифметической теряет смысл и единственным обобщающим показателей может быть средняя гармоническая.

Виды средней гармонической:

1. Средняя гармоническая простая рассчитывается по формуле:

Средняя гармоническая простая используется очень редко, только для расчета средних затрат времени на изготовление единицы продукции при условии, если частоты всех вариант равны.

2. Средняя гармоническая взвешенная рассчитывается по формуле:

.

где – весь объем явления.

Средняя гармоническая взвешенная используется, если известен весь объем явления, но не известны частоты. Эта гармоническая используется для расчета средних качественных показателей: средней заработной платы, средней цены, средней себестоимости, средней урожайности, средней производительности труда.

4. Структурные средние: мода и медиана

Структурные средние (мода, медиана) применяются для изучения внутреннего строения и структуры рядов распределения значений признака.

Мода − наиболее часто встречающееся значение признака у единиц совокупности. В ряду распределения, где каждая варианта встречается один раз, мода не рассчитывается. В дискретном ряду модой является варианта с наибольшей частотой . Для интервального ряда с равными интервалами мода рассчитывается по формуле:

.

где − начальная (нижняя) граница модального интервала;

− величина соответственно модального, до – и послемодального интервалов

− частота модального, до – и послемодального интервалов соответственно.

Модальный интервал – это интервал, который имеет наибольшую частоту.

Медиана – это значение признака, которое лежит в середине ранжированного ряда и делит этот ряд на две равные части по числу единиц: одна часть имеет значения признака меньше медианы, а другая больше медианы.

Ранжированный ряд – это расположение значений признака в порядке возрастания или убывания.

В дискретном ранжированном ряду, где каждая варианта встречается один раз, а число вариант не четное номер медианы определяется по формуле:

где – число членов ряда.

В дискретном ранжированном ряду, где каждая варианта встречается один раз и число вариант четное медианой будет средняя арифметическая из двух вариант, расположенных в середине ранжированного ряда.

В дискретном ранжированном ряду, где каждая варианта встречается несколько раз, номер медианы определяется по формуле:

Затем, начиная с первой варианты, последовательно суммируются частоты, до тех пор пока не получите .

Для интервального ряда медиана рассчитывается по формуле:

,

где − нижняя граница медианного интервала;

− величина медианного интервала;

общее число единиц совокупности;

− накопленная частота до медианного интервала;

− частота медианного интервала.

Медианный интервал – это такой интервал, в котором его накопленная частота равна или превышает полусумму всех частот ряда.

5. Показатели вариации

Вариация признака – это различие индивидуальных значений признака внутри изучаемой совокупности. Вариация признака характеризуется показателями вариации. Показатели вариации дополняют средние величины, характеризуют степень однородности статистической совокупности по данному признаку, границы вариации признака. Соотношение показателей вариации определяет взаимосвязь между признаками.

Показатели вариации подразделяются на:

1) Абсолютные: размах вариации; среднее линейное отклонение; среднее квадратическое отклонение; дисперсия. Они имеют те же единицы измерения, что и значения признака

2) Относительные: коэффициент осцилляции, коэффициент вариации, относительное линейное отклонение.

Размах вариации показывает, на какую величину изменяется значение признака:

где – максимальное значение признака;

– минимальное значение признака.

Среднее линейное отклонение и среднее квадратическое отклонение показывают, на сколько в среднем отличаются индивидуальные значения признака от среднего его значения.

Среднее линейное отклонение определяется:

– простое; – взвешенное.

Дисперсия определяются:

– простая; – взвешенная;

– простое; – взвешенное.

Если средняя величина признака рассчитывалась по простой арифметической, тогда рассчитываются по простой формуле, если средняя рассчитывалась по взвешенной, тогда рассчитываются по взвешенной формуле.

Дисперсия и среднее квадратическое отклонение также могут рассчитываться по другой формуле:

– простая; – взвешенная.

Для сравнения вариации различных признаков в одной и той же совокупности или же одного и того же признака в разных совокупностях рассчитывается относительный показатель вариации, именуемый коэффициентом вариации :

Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем менее однородна совокупность по своему составу и тем менее представительна средняя. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

6. Виды дисперсий и закон (правило) сложения дисперсий

Если изучаемая совокупность состоит из нескольких групп, образованных на основе какого-либо признака, то помимо общей дисперсии определяют также межгрупповую дисперсию

Согласно правилу сложения дисперсий общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью – неизвестную, а также судить о силе влияния группировочного признака.

Эмпирический коэффициент детерминации показывает долю, обусловленную вариацией группировочного признака, в общей вариации изучаемого признака:

Эмпирическое корреляционное отношение показывает влияние признака, положенного в основание группировки, на вариацию результативного признака:

Эмпирическое корреляционное отношение варьирует в пределах от 0 до 1. При связи нет, при – связь полная. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.

ТЕМА 6. Ряды динамики

1. Ряды динамики: понятие и виды

Ряд динамики (хронологический ряд, динамический ряд, временной ряд) – это ряд числовых значений статистического показателя расположенных в хронологической последовательности. Ряд динамики состоит из двух элементов (граф):

1. время (t) – это моменты (даты) или периоды (годы, кварталы, месяцы, сутки) времени, к которым относятся статистические показатели (уровни ряда).

2. уровень ряда (y) – значения статистического показателя, характеризующие состояние явления на указанный момент времени или за период времени.

Уровень ряда y

Виды рядов динамики:

1. По времени:

А) интервальные – ряды, уровни которых характеризуют размер явления за период времени (сутки, месяц, квартал, год). Примером такого ряда могут служить данные о динамике производства продукции, количества отработанных человеко-дней и т. д. Абсолютные уровни интервального ряда суммировать можно, сумма имеет смысла, что позволяет получать ряды динамики более укрупненных периодов.

Б) моментные – ряды, уровни которых характеризуют размер явления на дату (момент) времени. Примером такого ряда могут служить данные о динамике численности населения, численности скота, величины запаса, стоимости основных средств, оборотных активов и т. д. Уровни моментного ряда суммировать нельзя, сумма не имеет смысла, так как последующий уровень полностью или частично включает в себя предыдущий уровень.

2. По форме представления (способу выражения) уровней:

А) ряды абсолютных величин.

Б) ряды относительных величин. Относительными величинами характеризуются, например, динамика доли городского и сельского населения (%) и уровня безработицы.

В процессе обработки и обобщения статистических данных существует необходимость определения средних величин. Каждая однородная статистическая совокупность состоит из достаточно большого числа единиц, которые отличаются размерами количественных признаков. Вместе с тем, каждая единица совокупности по определению несет черты, свойственные всей совокупности. Расчёт средних величин позволяет выявить типичный уровень признаков и черт изучаемой совокупности.

Средними величинами называются обобщающие показатели, характеризующие типичный уровень варьирующего признака в расчёте на единицу совокупности в конкретных условиях места и времени.

Правильное понимание сущности средней величины определяет её особую значимость в условиях рыночной экономики, когда среднее через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития. В условиях реальной экономической, в том числе коммерческой, деятельности постоянные причины (факторы) действуют одинаково на каждое изучаемое явление и именно они делают эти явления похожими друг на друга и создают общие для всех закономерности. Результатом учения об общих и индивидуальных причинах явлений стало выделение средних величин в качестве основного приёма статистического анализа, базирующегося на утверждении, что статистические средние величины представляют собой не просто меру математического измерения, а категорию объективной действительности. В статистической теории типическая реально существующая средняя величина отожествляется с истинной для данной совокупности величиной, отклонения от которой могут быть только случайными.

Например, выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, воспитания, здоровья и т.д. А средняя выработка (продажа) на одного продавца отражает общее типичное свойство всей совокупности продавцов. Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.

Таким образом, средние величины – обобщающие показатели, в которых находит выражение действие общих условий, закономерность изучаемого явления.

В практике статистической обработки данных возникают различные задачи, имеются особенности изучаемых явлений, и поэтому для их решения требуются различные средние.

По уровню обобществления данных изучаемой совокупности средние могут быть общими и групповыми. Средняя, рассчитанная по совокупности в целом, называется общей средней, а средние, исчисленные для каждой группы, - групповыми средними.

Различают степенные и структурные средние.

Степенные средние выводятся из общей формулы вида:



С изменением показателя степени приходим к определенному виду средней:

при - средняя гармоническая ;

при - средняя геометрическая ;

при - средняя арифметическая ;

при - средняя квадратическая .

Вопрос о том, какой вид средней необходимо применять в отдельном случае, решается путём конкретного анализа изучаемой совокупности, материальным содержанием изучаемого явления, осмыслением результатов осреднения. Только тогда средняя величина применена правильно, когда в результате осреднения получают величины, имеющие реальный смысл.

Вводятся следующие обозначения:

– количественный признак, по которому находится средняя, называется осредняемым признаком;

среднее значение признака (с чертой сверху), представляющее результат осреднения;

Индивидуальные значения признака у единиц совокупности называемые вариантами;

– общее число единиц совокупности;

- частота или повторяемость индивидуального значения признака (его вес);

Усредняющий признак (индекс).

В зависимости от наличия исходных данных средние можно рассчитать различным образом. В случае, если индивидуальные значения осредняемого признака (варианты) не повторяются при конкретных значениях усредняющего признака применяются формулы простых степенных средних. Однако, когда в практических исследованиях отдельные значения изучаемого признака встречаются несколько раз у единиц исследуемой совокупности, тогда частота повторения индивидуальных значений признака (- вес признака) присутствует в формулах степенных средних. В этом случае они называются формулами взвешенных степенных средних. В формулах взвешенных средних вместо частот может содержаться частость

определяемая как отношение частоты признака к сумме частот.

В табл.9 приведены формулы расчёта различных видов степенных простых и взвешенных средних величин.

Табл.9. Формулы расчёта степенных средних величин

Значение Название средней Формула средней
простая взвешенная
- 1 Средняя гармоническая
Средняя геометрическая
Средняя арифметическая
Средняя квадратическая

Средняя арифметическая – наиболее распространённый вид средней. Она исчисляется в случаях, когда объём осредняемого признака образуется как сумма его значений у отдельных единиц совокупности. Например, требуется вычислить средний стаж десяти работников предприятия, причём дан ряд одиночных значений признака 6, 5, 4, 3, 3, 4, 5, 4, 5, 4. Тогда объём осредняемого признака

а среднее значение вычисляется по формуле простой средней

Если те же данные сгруппированы по величине признака, то среднее значение вычисляется по формуле взвешенной средней

Средняя гармоническая величина чаще всего вычисляется, когда статистическая информация не содержит частот по отдельным вариантам совокупности, а имеются данные по объёмам осредняемого признака, относящимся к отдельным вариантам совокупности. Например, необходимо вычислить среднюю цену единицы товара, причём даны объёмы реализации по каждому виду товара в виде ряда 600, 1000, 850 (тыс. руб.) и соответствующие цены по каждому виду товара в виде ряда 20, 40, 50 (тыс. руб./шт.). Тогда средняя цена вычисляется по формуле средней гармонической взвешенной

Можно видеть, что средняя гармоническая является превращённой (обратной) формой средней арифметической. Вместо средней гармонической всегда можно рассчитать среднюю арифметическую, но для этого сначала нужно определить веса отдельных значений признака.

При использовании формулы средней геометрической индивидуальные значения признака, как правило, представляют собой относительные величины динамики, построенные в виде цепных величин (как отношения последующих уровней показателя к предыдущим уровням в ряду динамики), причём временные отрезки ряда динамики одинаковы (сутки, месяц, год). Средняя геометрическая величина характеризует, таким образом, средний коэффициент роста. Например, для данных ряда динамики, представленных в табл.10,

Табл.10. Ряд динамики роста доходов населения

средний темп роста доходов населения вычисляется по формуле средней геометрической простой

Формула средней квадратической величины используется для измерения средней степени колеблемости значений признака около среднего арифметического значения в рядах распределения. Так, например, при расчёте такого показателя вариации, как дисперсия, среднюю вычисляют из квадратов отклонений индивидуальных значений признака от средней арифметической величины (см. в главе 6).

Степенные средние разных видов, исчисленные по одной и той же совокупности, имеют различные количественные значения, причём чем больше показатель степени тем больше и величина соответствующей средней

Это свойство степенных средних называется мажорантностью средних.

Для характеристики структуры совокупности применяются особые показатели, которые называют структурными средними. К таким показателям относятся мода и медиана.

Модой называется наиболее часто встречающееся значение признака у единиц данной совокупности. Она соответствует определенному значению признака.

Например, выборочное обследование 8 пунктов обмена валюты позволило зафиксировать различные цены за доллар (табл.11). В этом случае модальной ценой за доллар является величина поскольку в обследованной совокупности пунктов обмена валюты она встречается наиболее часто (3 раза).

№ пункта
Цена за 1 $

Медиана – это величина признака, которая делит численность упорядоченного вариационного ряда на две равные части.

Для примера возьмём данные табл.10 и расположим индивидуальные значения признака в возрастающем порядке.

2150 2155 2155 2155 2160 21652165 2175

Порядковый номер медианы определяется по формуле

а) В случае чётного числа номер медианы имеет не целое значение (в нашем случае 4,5). Медиана будет равна средней арифметической из соседних значении и

б) В случае нечётного числа индивидуальных признаков (допустим, )

Следовательно, в этом случае

В рассмотренном примере нахождение таких средних, как мода и медиана, было целесообразно, поскольку исследователь не располагал объёмом продаж по каждому пункту и не мог поэтому с хорошей точностью провести расчёт средней арифметической цены за доллар. Также рассмотренный пример иллюстрирует положение о том, что выбор вида соответствующей средней всегда зависит от имеющихся в наличии данных.

4.3. Свойства и методы расчёта средних величин

Наиболее часто используемая в экономико-статистической практике средняя арифметическая величина обладает рядом математических свойств, которые иногда упрощают её расчёт. Эти свойства следующие:

1. Если варианты уменьшить или увеличить на некоторое постоянное число, то

средняя арифметическая величина соответственно уменьшится или увеличится на это

2. Если варианты изменить в постоянное число раз то средняя тоже изменится во

столько же раз

3. Если частоты разделить или умножить на некоторое постоянное число, то средняя не изменится

4. Произведение средней арифметической на сумму частот равно сумме произведений вариантов на частоты

5. Алгебраическая сумма отклонения вариантов от средней величины равна нулю

Все перечисленные свойства следуют из определения средней арифметической взвешенной (см.раздел 4.2).

Иногда расчёт средней арифметической величины удобно упростить, используя её математические свойства. Для этого нужно из всех вариант вычесть произвольную постоянную величину, полученную разность разделить на общий множитель, а затем исчисленную среднюю величину умножить на общий множитель и прибавить произвольную постоянную. В результате формула средней арифметической взвешенной получит следующий вид.

Реферат

Средние величины и показатели вариации

1.Сущность средних в статистике

2.Виды средних величин и способы их расчёта

3.Основные показатели вариации и их значение в статистике

1. Сущность средних ве личин в статистике

В процессе изучения массовых социально-экономических явлений возникает необходимость выявления их общих свойств, типичных размеров и характерных признаков. Необходимость в обобщающем среднем показателе возникает в том случае, когда признаки, характеризующие единицы изучаемой совокупности, количественно варьируют. Например, размер дневной выработки ткачей на текстильной фабрике зависит от общих условий производства, ткачи используют одинаковое сырьё, работают на одинаковых станках и т.д. В то же время часовая выработка отдельных ткачей колеблется, т.е. варьирует, так как зависит от индивидуальных особенностей каждого ткача (его квалификации, профессионального опыта и т.д.). Чтобы характеризовать дневную выработку всех ткачей предприятия, необходимо исчислить среднюю величину дневной выработки, так, как, только, в, этом, показателе найдут отражение общие для ткачей условия производства.

Таким образом, исчисление средних обобщающих показателей означает отвлечение (абстрагирование) от особенностей, отражающихся в величине признака у отдельных единиц, и выявление общих для данной совокупности типичных черт и свойств.

Таким образом, средней величиной в статистике является обобщённая, количественна характеристика признака и статистической совокупности. Она выражает характерную, типичную величину признака у единиц совокупности, образующихся в данных условиях места и времени под влиянием всей совокупности факторов. Действие разнообразных факторов порождает колебание, вариацию усредняемого признака. Средняя величина является общей мерой их действия, равнодействующей всех этих факторов. Средняя величина характеризует совокупность по усредняемому признаку, но относится к единице совокупности. Например, средняя выработка продукции на одного рабочего данного предприятия представляет собой отношение всей выработки (за любой период времени) к общей (средней за тот же период) численности его рабочих. Она характеризует производительность труда данной совокупности, но относится к одному рабочему. В средней величине массового явления погашаются индивидуальные различия единиц статистической совокупности в значениях усредняемого признака, обусловленные случайными обстоятельствами. Вследствие этого взаимопогашения в средней проявлявляется общее, закономерное свойство данной статистической совокупности явлений. Между средней и индивидуальными значениями осреднённого признака существует диалектическая связь как между общим и отдельным. Средняя является важнейшей категорией статистической науки и важнейшей формой обобщающих показателей. Многие явления общественной жизни становятся ясными, определёнными, лишь, будучи обобщенными, в форме средних величин. Таковы, например, упомянутая выше производительность труда, совокупность рабочих, урожайность сельскохозяйственных культур и т.д. Средняя выступает в статистике важнейшим методом научного обобщения. В этом смысле говорят о методе средних величин, который широко применяется в экономической науке. Многие категории экономической науки определяются с использованием понятия средней.

Основным условием правильного применения средней величины является однородность статистической совокупности по усредняемому признаку. Однородной статистической совокупностью называется такая совокупность, в которой её составные элементы (единицы) сходны между собой по существенным для данного исследования признакам и относятся к одному и тому же типу явлений. Однородная совокупность, будучи однородна по одним признакам, может быть разнородной по другим. Только в средних для таких совокупностей проявляются специфические особенности, закономерности развития анализируемого явления. Средняя вычисленная для неоднородной статистической совокупности, т.е. такой в которой объединены качественно различные явления, теряет своё научное значений. Такие средние являются фиктивными, не только не дающими представления о действительности, но и искажающими её. Для формирования однородных статистических совокупностей производится соответствующая группировка. С помощью группировок и в качественно однородной совокупности могут быть выделены характерные в количественном отношении группы. Для каждой из них может быть вычислена своя средняя, называемая средней групповой (частной) в отличие от общей средней (для совокупности в целом).

2. Виды средних величин

Большое значение в методологии средних величин имеют вопросы выбора формы средней, т.е. формулы по которой можно правильно вычислить среднюю величину, и выбора весов средней. Наиболее часто в статистике применяются средняя агрегатная, средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратичная, мода и медиана. Применение той или иной формулы зависит от содержания усредняемого признака и конкретных данных, по которым её необходимо рассчитать. Для выбора формы средней можно воспользоваться так называемым средним исходным соотношением.

2.1 Средняя арифметическая

Средняя арифметическая - одна из наиболее распространенных форм средней величины. Средняя арифметическая рассчитывается как частное от деления суммы индивидуальных значений (вариантов) варьирующего признака на их число. Средняя арифметическая применяется в тех случаях, когда объём варьирующего признака явлений однородной статистической совокупности, образуется путём суммирования значений признака всех единиц явлений статистической совокупности. Различают следующие средне арифметические величины:

1) Простая средняя арифметическая , которая определяется путём простого суммирования количественных значений варьирующего признака и деления этой сумы на их варианты и рассчитывается по следующей формуле:

Х - средняя величина статистической совокупности,

x i - сумма отдельных варьирующих вариантов явлений статистической совокупности,

n i - количество варьирующих вариантов явлений статистической совокупности.

2) Среднеарифметическая взвешенная - средняя величина признака явления, вычисленная с учётом весов. Веса средних величин - частоты, с которыми отдельные значения признака осредняемого принимаются в расчёт при исчислении его средней величины. Выбор весов средней величины зависит от сущности усредняемого признака и характера данных, которыми располагают для вычисления средних величин. В качестве весов средних величин могут быть показатели численности единиц или размеры частей статистической совокупности (в форме абсолютных или относительных величин), обладающих данным вариантом (значением) усредняемого признака явления статистической совокупности, а также величины показателя связанного с усредняемым признаком. Среднеарифметическая взвешенная рассчитывается по следующей формуле:

X- средняя арифметическая взвешенная,

х - величина отдельных варьирующих вариантов явлений статистической совокупности,

Назначение простой, и взвешенной средней арифметической является определение среднего значения варьирующего признака. Если в изучаемой статистической совокупности варианты значений признака встречаются по одному разу или имеют одинаковый вес, то применяется простая средняя арифметическая, если же варианты значений данного признака встречаются в изучаемой совокупности по несколько раз или имеют различные веса, для определения среднего значения варьирующего признака применяется средняя арифметическая взвешенная.

2.2 Средняя гармоническая

Средняя гармоническая применяется для расчёта средней величины тогда, когда непосредственные данные о весах отсутствуют, а известны варианты усредняемого признака (х) и произведения значений вариантов на количество единиц, обладающих данным его значением w (w = xf).

Данная средняя рассчитывается по следующим формулам:

1.) Среднегармоническая простая:

Х - средняя гармоническая простая,

n - количество варьирующих вариантов явлений статистической совокупности.

2) Среднегармоническая взвешенная:

Х - средняя гармоническая взвешенная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

При использовании гармонической взвешенной выявляют веса и таким образом получают тот же результат, который дал бы расчёт по средней арифметической взвешенной, если бы были известны все необходимые для этого данные.

2.3 Средняя агрегатная

Средняя агрегатная рассчитывается по формуле:

X - средняя агрегатная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

Средняя агрегатная вычисляется в тех случаях, когда известны (имеются) значения числителя и значения знаменателя исходного соотношения средней.

2.4 Средняя геометрическая

Средняя геометрическая является одной из форм средней величины и вычисляется как корень n-й степени из произведения отдельных значений - вариантов признака (х) и определяется по следующей формуле:

Средняя геометрическая применяется в основном при расчётах средних темпов роста.

2.5 Мода и медиана

Наряду с рассмотренными выше средними в качестве статистических характеристик вариационных рядов рассчитываются так называемые структурные средние - мода и медиана.

Модой (Мо) называется наиболее часто встречающееся значение признака у единиц совокупности . Для дискретных рядов - этот вариант, имеющий наибольшую частоту.

В интервальных вариационных рядах можно определить, прежде всего, интервал, в котором находится мода, т.е. так называемый модальный интервал. В вариационном ряду с равными интервалами модальный интервал определяется по наибольшей частоте, в рядах с неравными интервалами по наибольшей плотности распределения.

Для определения моды в рядах с равными интервалами пользуются формулой следующего вида:

Хн - нижняя граница модального интервала,

h - величина интервала,

f 1 , f 2 , f 3 - частоты (или частности) соответственно предмодального, модального и послемодального интервалов.

В интервальном ряду моду можно найти графически. Для этого в самом высоком столбце гистограммы от границ двух смежных столбцов проводят две линии. Затем из точки их пересечения опускают перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее перпендикуляру, и будет модой.

Во многих случаях при характеристике совокупности в качестве обобщённого показателя отдаётся предпочтение моде, а не средней арифметической.

Так, при изучении цен на рынке фиксируется и изучается в динамике не средняя цена на определённую продукцию, а модальная; при изучении спроса населения на определённый размер обуви или одежды представляет интерес определение модального размера обуви, а средний размер как таковой здесь вообще не имеет значения. Мода представляет не только самостоятельный интерес, но и исполняет роль вспомогательного показателя при средней, характеризуя её типичность. Если средняя арифметическая близка по значению к моде, значит она типична.

Медианой (Ме) называется значение признака у средней единицы ранжированного ряда. (Ранжированным называют ряд, у которого значения признака записаны в порядке возрастания или убывания.)

Чтобы найти медиану, сначала определяется её порядковый номер. Для этого при нечётном числе единиц к сумме всех частот прибавляется единица, и всё делится на два. При чётном числе единиц в ряду будет две средних единицы, и по всем правилам медиана должна определяться как средняя из значений этих двух единиц. При этом практически при чётном числе единиц медиана отыскивается как значение признака у единицы, порядковый номер которой определяется по общей сумме частот, делённой на два. Зная порядковый номер медианы, легко по накопленным частотам найти её значение.

В интервальных рядах после определения порядкового номера медианы по накопительным частотам (частностям) отыскивается медиальный интервал, а затем при помощи простейшего интерполяционного приёма определяется значение самой медианы. Этот расчёт выражает следующая формула:

X n - нижняя граница медианного интервала,

h - величина медианного интервала,

Порядковый номер медианы,

S Me - 1 частота (частотность), накопленная до медианного интервала,

F Me - частота (частность) медианного интервала.

Согласно записанной формуле к нижней границе медианного интервала прибавляется такая часть величины интервала, которая приходится на долю единиц этой группы, недостающих до порядкового номера медианы. Другими словами, расчёт медианы построен на предположении, что нарастание признака среди единиц каждой группы происходит равномерно. На основе сказанного можно рассчитать медиану и по иному. Определив медианный интервал, можно из верхней границы медианного интервала (Хв) вычесть ту часть интервала, которая приходится на долю единиц, превышающих порядковый номер медианы, т.е. по следующей формуле:

Медиану можно также определить и графически. Для этого строиться кумулята и из точки на шкале накопленных частот (частностей), соответствующей порядковому номеру медианы, проводится прямая, параллельная оси х до пересечения с кумулятой. Затем из точки пересечения указанной прямой с куммулятой опускается перпендикуляр на ось абсцисс. Значение признака на оси абсцисс, соответствующее проведённой ординате (перпендикуляру), и будет медианой.

По такому же принципу легко найти значение признака у любой единицы ранжированного ряда.

Таким образом, для расчёта средней величины вариационного ряда можно использовать целую совокупность показателей.

3. Основные показатели вари ации и их значение в статистике

При изучении варьирующего признака у единиц совокупности нельзя ограничиваться лишь расчётом средней величины из отдельных вариантов, так как одна и та же средняя может относиться далеко не к одинаковым по составу совокупностям. Это можно проиллюстрировать следующим условным примером, отражающим данные о числе дворов в агрохозяйствах двух районов:

Среднее число дворов в агрохозяйствах двух районов одинаково - 160. При этом состав этих агрохозяйств в двух районах далеко не одинаков. Поэтому возникает необходимость измерить вариацию признака в совокупности.

Для этой цели в статистике рассчитывают ряд характеристик, т.е. показателей. Самым элементарным показателем вариации признака является размах вариации R , представляющий собой разность между максимальными и минимальными значениями признака в данном вариационном ряду, т.е. R = Xmax - Xmin. В нашем примере в 1 районе R = 300 - 80 - 220, а во втором районе R = 180 - 145 = 35.

Показатель размаха вариации не всегда применим, так как он учитывает только крайние значения признака, которые могут сильно отличаться от всех других единиц. Иногда находят отношение размаха вариации к средней арифметической и пользуются этой величиной, именуя её показателем осцилляции.

Более точно можно определить вариацию в ряду при помощи показателей, учитывающих отклонения всех вариантов от средней арифметической. Таких показателей в статистике два - среднее линейное и среднее квадратическое отклонение.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных величин отклонений вариантов от средней. Знаки отклонений в данном случае игнорируются, в противном случае сумма всех отклонений будет равна нулю. Данный показатель рассчитывается по формуле:

б) для вариационного ряда:

Следует иметь в виду, что среднее линейное отклонение будет минимальным, если отклонения рассчитаны от медианы, т.е. по формуле:

Среднее квадратическое отклонение () исчисляется следующим образом - каждое отклонение от средней возводится в квадрат, все квадраты суммируются (с учётом весов), после чего сумма квадратов делиться на число членов ряда и из частного извлекается корень квадратный.

Все данные действия выражаются следующими формулами:

а) для несгрупированных данных:

б) для вариационного ряда:

f, т.е. среднее квадратическое отклонение предятавляет собой корень квадратный из средней арифметической квадратов отклонений средней. Выражение под корнем носит название дисперсии. Дисперсия имеет самостоятельное выражение в статистике и относится к числу важнейших показателей вариации.



Понравилась статья? Поделиться с друзьями: