Несистематизированные данные, собранные в процессе статистического наблюдения, образуют первичный ряд данных. При достаточно большом объеме совокупности первичный ряд данных становится трудно обозримым и непосредственное его рассмотрение не может дать представления о распределении единиц совокупности по величине признака.

Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов ряда (значений признака) в возрастающем или убывающем порядке. Ранжирование данных позволяет:

сразу увидеть максимальное и минимальное значения признака в совокупности и оцепить разницу между ними (Х тах - X min);
определить число повторений отдельных вариантов ряда (частоту).

В результате первичный неупорядоченный ряд данных преобразуется в упорядоченный ряд, в котором будет отражено число повторений каждой варианты:

Этот ряд называется статистическим рядом распределения. Он характеризует состав и структуру изучаемого явления, позволяет судить о степени однородности изучаемой совокупности, закономерности и границах варьирования анализируемого признака.

Элементами статистического ряда распределения являются варианты X, и частоты / (абсолютная величина числа повторений г-й варианты).

Для характеристики структуры совокупности используется показатель, который называется частостью (4) и определяется по формуле

Из определения частоты и частости следуют следующие равенства: где N - объем совокупности.

Ряд распределения может быть получен в результате группировки. Ряды распределения могут быть атрибутивными и вариационными.

Атрибутивным рядом является статистический ряд распределения, который построен по атрибутивному признаку. В качестве примера такого ряда можно рассматривать, в частности, распределение рабочих цеха предприятия по профессиям (табл. 3.2).

Распределение рабочих цеха по профессиям

Вариационным рядом является статистический ряд распределения, который построен по количественному признаку. Вариационный ряд можно считать дискретным рядом, если признак, по котором}" он построен, соответственно является дискретным. Вариационный ряд распределения также может быть и интервальным, если признак, по которому он построен, является непрерывным. В качестве примера такого ряда можно привести распределение рабочих цеха или предприятия по уровню квалификации (табл. 3.3).

Таблица 3.3

Распределение рабочих цеха по уровню квалификации

В качестве примера интервального ряда распределения можно привести пример распределения предприятий по объему производства (см. параграф 3.3). Интервальное распределение при этом выполняется в процессе построения соответствующей аналитической группировки, представленной в табл. 3.4.

Интервальный ряд распределения, наряду с дискретным рядом распределения, позволяет выявить и исследовать структуру изучаемого явления (объекта наблюдения).

Таблица 3.4

Распределение предприятий по объему производства продукции

Группы предприятий но объему производства, млн руб.	Количество предприятий (частота)	Удельный вес в общем количестве пред!хриятий		Накопленная
Группы предприятий но объему производства, млн руб.	Количество предприятий (частота)		/о	Накопленная
Xi	А	А	d,

Статистический ряд распределения можно рассматривать как обязательный итог любой статистической группировки. При построении рядов распределения число групп и длина интервала определяются по правилам, применяемым при выполнении статистических группировок (см. параграф 3.2).

Для наглядности и лучшего понимания статистические ряды распределения могут быть представлены не в табличном, а в графическом виде.

Наиболее часто графический вид рядов распределения используется для отображения вариационных статистических рядов распределения.

Для отображения дискретного ряда используют линейные диаграммы, которые называются полигонами распределения. При построении полигона распределения в прямоугольной системе координат на оси абсцисс откладывают варианты (значения) анализируемого признака. На оси ординат откладывают частость распределения вариантов или значений признака. Целесообразность отображения на оси ординат частостей объясняется следующим:

это наиболее удобный способ при большом объеме исследуемой статистической совокупности;
это дает возможность в рамках одного графика изображать статистические ряды распределения двух и более признаков с разным числом единиц совокупности.

Пересечение точек по оси абсцисс и оси ординат образует ломаную линию, которая и представляет собой полигон распределения (рис. 3.1 - на основе данных табл. 3.3).

Для графического отображения интервального ряда, как правило, используют столбиковые диаграммы, которые принято в данном случае называть гистограммами.

Можно построить гистограмму интервального ряда распределения предприятий по объему производства продукции (см. габл. 3.4). Ось абсцисс в данном случае представляет собой отрезки, равные величине интервалов ряда распределения (в принятом масштабе). Далее на этих отрезках строят прямоугольники, которые по высоте, откладываемой по оси ординат, равны частоте или частости каждого интервала (рис. 3.2).

Рис. 3.1.

Рис. 3.2.

Для решения таких задач, как определение структурных средних, наблюдение за процессом концентрации изучаемого явления и т.п., ряды распределения принято преобразовывать в кумулятивные ряды, которые выстраиваются в зависимости от накопленных частот или частостей. Правило расчета накопления частот (частостей) каждого интервала ряда распределения достаточно простое. Накопление частот (частостей) рассчитывается как сумма частоты (частости) данного интервала и частот (частостей) всех интервалов, предшествующих данному интервалу.

В качестве примера построения кумулятивного ряда возьмем данные табл. 3.4 из последней графы (см. накопленная частота s,) и построим соответствующую диаграмму (рис. 3.3).

При построении кумулятивных рядов в прямоугольной системе координат на оси абсцисс откладывают верхние границы интервалов ряда распределения, а на оси ординат - накопленные частоты (частости), которые соответствуют этим интервалам.

Рис. 3.3.

С использованием кумуляты может быть проиллюстрирован процесс концентрации, где наряду с накоплением частот (частостей) имеются в статистическом ряду распределения и суммы накопленных группировочных (или иных важных) признаков изучаемого явления. Такие кривые, которые отражают процесс концентрации, называют кривыми Лоренца.

Так, если обратиться к данным табл. 3.4 и рис. 3.3, то можно отметить, что накопленная частота второго интервала свидетельствует о том, что семь предприятий из 25 производят около 19% всего объема продукции, при этом каждое из семи предприятий имеет объем производства не более 8,2 млн руб. и эти семь предприятий составляют 28% общего количества рассмотренных предприятий.

Самым важным требованием из всех, которые могут быть предъявлены к построению статистических рядов распределения, является требование сопоставимости во времени и в пространстве данных об интервалах. При этом вполне понятно, что в рядах с равными интервалами это требование выполняется автоматически. В тех рядах распределения, интервалы которых не равны, принято рассчитывать плотность распределения как частное от деления частоты интервала на его длину. В графическом отображении рядов распределения с неравными интервалами на оси ординат принято откладывать нс частоты (частости), а значения плотности распределения.

Для облегчения построения группировок и графических отображений статистических рядов могут быть использованы редакторы электронных таблиц (например, Excel ).

См.: Макарова Н. В., Трофимец В. С. Статистика в Excel. М.: Финансы и статистика,2009; и другие подобные издания.

Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, психолог провел тестирование интеллекта по тесту Векслера у 25 школьников, и сырые баллы по второму субтесту оказались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита.f i и имеют индекс “i”, соответствующий номеру переменной в вариационном ряду.

Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человека соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.

Приведенный выше ряд (3.1) можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Подобная форма представления (3.3) более предпочтительна, чем (3.1), поскольку лучше иллюстрирует закономерность варьирования признака.

Частоты, характеризующие ранжированный вариационный ряд, можно складывать, или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.

В качестве примера вновь обратимся к ряду 3.3. Преобразуем его в ряд 3.4 в котором введем дополнительную строчку и назовем ее «кумуляты частот»:

Рассмотрим подробно как получилась последняя строчка. В начале ряда частот стоит 1. В кумулятивном ряду на втором месте стоит 2 - это сумма первой и второй частоты, т.е. 1 + 1, на третьем месте стоит 4 это сумма второй (уже накопленной частоты) и третьей частоты, т.е. 2 + 2, на четвертом 8 = 4 + 4 и т.д.

Размах (иногда эту величину называют разбросом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Таблицы и графики распределения частот

Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот. Нередко они являются основой для получения ценных содержательных выводов исследования.

Если признак принимает всего лишь несколько возможных значений (до 10-15), то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это - таблица абсолютных частот распределения, если указывается доля наблюдений, приходящихся на то или иное значение признака, то говорят об относительных частотах распределения.

Во многих случаях признак может принимать множество различных значений, например, если мы измеряем время решения тестовой задачи. В этом случае о распределении признака позволяет судить таблица сгруппированных частот, в которых частоты группируются по разрядам или интервалам значений признака.

Еще одной разновидностью таблиц распределения являются таблицы распределения накопленных частот. Они показывают, как накапливаются частоты по мере возрастания значений признака. Напротив каждого значения (интервала) указывается сумма частот встречаемости всех тех наблюдений, величина признака у которых не превышает данного значения (меньше верхней границы данного интервала). Накопленные частоты содержатся в правых столбцах табл. 3.2 и 3.3.

Для более наглядного представления строится график распределения частот или график накопленных частот - гистограмма или сглаженная кривая распределения.

Гистограмма распределения частот - это столбиковая диаграмма, каждый столбец которой опирается на конкретное значение признака или разрядный интервал (для сгруппированных частот). Высота столбика пропорциональна частоте встречаемости соответствующего значения. На рис. 3.1 изображена гистограмма распределения частот для примера из табл. 3.2.

Гистограмма накошенных частот отличается от гистограммы распределения тем, что высота каждого столбика пропорциональна частоте, накопленной к данному значению (интервалу). На рис. 3.2 изображена гистограмма накопленных частот для данных табл. 3.2.

Построение полигона распределения частот напоминает построение гистограммы. В гистограмме вершина каждого столбца, соответствующая частоте встречаемости данного значения (интервала) признака, - отрезок прямой. А для полигона отмечается точка, соответствующая середине этого отрезка. Далее все точки соединяются ломаной линией (рис. 3.3). Вместо гистограммы или полигона часто изображают сглаженную кривую распределения частот. На рис. 3.4 изображена гистограмма распределения для примера из табл. 3.3 (столбики) и сглаженная кривая того же распределения частот.

Таблицы и графики распределения частот дают важную предварительную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Обычно выделяют следующие типичные формы распределения. Равномерное распределение – когда все значения встречаются одинаково (или почти одинаково) часто. Симметричное распределение - когда одинаково часто встречаются крайние значения. Нормальное распределение - симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям признака. Асимметричные распределения - левосторонние (с преобладанием частот малых значений), правосторонние (с преобладанием частот больших значений).

Уже сами по себе таблицы и графики распределения признака позволяют делать некоторые содержательные выводы при сравнении групп испытуемых между собой. Сравнивая распределения, мы можем не только судить о том, какие значения встречаются чаще в той или иной группе, но и сравнивать группы по степени выраженности индивидуальных различий - изменчивости по данному признаку.

Таблицы и графики накопленных частот позволяют быстро получить дополнительную информацию о том, сколько испытуемых (или какая их доля) имеют выраженность признака не выше определенного значения.

Раздел 4. Описательные статистики
(Статистическое распределение и его числовые характеристики)

Переменная может принимать много значений. На начальном этапе обработки данных вместо того, чтобы рассматривать все значения переменной, рекомендуется проанализировать т. к. описательные статистики. Они дают общее представление о значениях или разбросе значений, которые принимает переменная.

К первичным описательным статистикам (Descriptive Statistics) обычно относят числовые характеристики распределения измеренного на выборке признака. Каждая такая характеристика отражает в одном числовом значении свойство распределения множества результатов измерения: с точки зрения их расположения на числовой оси либо с точки зрения их изменчивости. Основное назначение каждой из первичных описательных статистик - замена множества значений признака, измеренного на выборке, одним числом (например, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений, в частности, путем сравнения первичных статистик разных групп.

Наиболее простым способом обобщения статистического материала является построение рядов. Результатом сводки статистического исследования могут быть ряды распределения.

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.

Ряд распределния является одним из видов группировок.

Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.

Виды рядов распределения

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

атрибутивными называют ряды распределения, построенные по качественными признакам;

вариационными называют ряды распределения, построенные в порядке возрастания или убывания значений количественного признака.

Вариационный ряд распределения состоит из двух столбцов. В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются. Дискретная варианта - выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд. Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

частоты - это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака; сумма всех частот должна быть равна численности единиц всей совокупности;

частости - это частоты выраженные в процентах к итогу; сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Вариационный ряд характеризуется двумя элементами: вариантой (Х) и частотой (f). Варианта – это отдельное значение признака отдельной единицы или группы совокупности. Число, показывающее, сколько раз встречается то или иное значение признака, называется частотой. Если частота выражена относительным числом, то она называется частостью.

Вариационный ряд может быть:

интервальным, когда определены границы «от» и «до», интервальные ряды распределения можно представить графически в виде гистограммы;

дискретным, когда изучаемый признак характеризуется определенным числом.

Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:

полигона;

гистограммы;

кумуляты;

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) - частоты или частости.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат - накопленные частоты или частости.

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака - на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат - накопленные значения доли (в процентах) по объему признака.

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

Всероссийский заочный финансово-экономический институт

Кафедра Статистики

Курсовая работа

по дисциплине Статистика

Статистические ряды распределения в изучении структуры рынка

Руководитель: Пуляшкин В.В.

Введение

Статистические ряды распределения являются одним из наиболее важных элементов статистики. Они представляют собой составную часть метода статистических сводок и группировок, но, по сути, ни одно из статистических исследований невозможно произвести, не представив первоначально полученную в результате статистического наблюдения информацию в виде статистических рядов распределения. Первичные данные обрабатываются в целях получения обобщенных характеристик изучаемого явления по роду существенных признаков для дальнейшего осуществления анализа и прогнозирования; производится сводка и группировка; статистические данные оформляются с помощью рядов распределения в таблицы, в результате чего информация представляется в наглядном рационально изложенном виде, удобном для использования и дальнейшего исследования; строятся различного рода графики для наиболее наглядного восприятия и анализ информации. На основе статистических рядов распределения вычисляются основные величины статистических исследований: индексы, коэффициенты; абсолютные, относительные, средние величины и т.д., с помощью которых можно проводить прогнозирование, как конечный итог статистических исследований. Таким образом статистические ряды распределения являются базисным методом для любого статистического анализа. Понимание данного метода и навыки его использования необходимы для проведения статистических исследований.

В теоретической части курсовой работы рассмотрены следующие аспекты:

1) Понятие статистических рядов распределения, их виды;

2) Расчет средних величин, моды и медианы и представление рядов распределения графически;

Расчетная часть курсовой работы включает решение задачи по теме из варианта расчетного задания: Работа с таблицей «Выборочные данные торговых предприятий района: товарооборот и средние товарные запасы». Предметом исследования в работе будут служить так же торговые предприятия района (каждое предприятие, из которых, со своим товарооборотом). Работа содержит расчеты всех данных по ним, так же полное описание шагов действий для достижения конечного результата (вывода).

При написании курсовой работы использовались учебники курса, дополнительная литература, Интернет-ресурсы; при работе с табличными данными - персональный компьютер конфигурации:

Процессор – ADM Sempron 28000+S754

Память – DDR 512Mb PC3200 (DDR400)

Жесткий диск – 120Gb 7200/8 Mb/SATA

Принтер – hp deskjet 3325, струйный

OC – Windows XP Professional

ППП – Microsoft Word 2002, Excel

1. Теоретическая часть

1) Понятие статистических рядов распределения и их виды

Результаты сводки и группировки материалов статистического наблюдения оформляются в виде статистических рядов распределения. Статистические ряды распределения представляют собой упорядоченное распределение единиц изучаемой совокупности на группы по группировочному (варьирующему) признаку. Они характеризуют состав изучаемого явления, позволяют судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. В зависимости от признака статистические ряды распределения делятся на следующие:

Атрибутивные (качественные);

Вариационные (количественные):

a) дискретные;

b) интервальные.

а) Атрибутивные ряды распределения

Атрибутивные ряды образуются по качественным признакам, которыми могут выступать занимаемая должность работников торговли, профессия, пол, образование и т.д. В правовой статистике - это виды преступлений (убийства, грабежи, разбои); занимаемая должность лиц, совершивших административные правонарушения; образование и т.д.

Пример атрибутивных рядов распределения:

Таблица 1.Распределение преступлений в г. Москве за сутки по видам

Виды преступлений	Количество преступлений
	абсолютное	в % к итогу
Убийства
Тяжкие телесные повреждения
Изнасилования



Изъятия наркотиков

В данном примере группировочным признаком выступают виды преступлений. Данный ряд распределения является атрибутивным, поскольку варьирующий признак представлен не количественными, а качественными показателями. Наибольшее число правонарушений составляют кражи 56%; далее правонарушения распределяются поровну между грабежами и случаями изъятия наркотиков (16%) и убийствами и случаями нанесения тяжких телесных повреждений (3%); разбои составили 4.5%, и наименьшее число зарегистрированных правонарушений составили изнасилования -1%.

б) Вариационные ряды распределения

Вариационные ряды строятся на основе количественного группировочного признака. При этом вариационные ряды по способу построения бывают дискретными (прерывными) и интервальными (непрерывными).

Дискретный ряд распределения - ряд, который основан на прерывной вариации признака, т.е. в котором значение признака выражено целым числом (число раскрытых преступлений и т.д.). Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признака, а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, а в другой - частоты.

Интервальный ряд распределения - ряд, базирующийся на непрерывно изменяющемся значении признака, имеющего любые количественные выражения, т.е. значение признаков таких рядах задается в виде интервала.

При наличии достаточно большого количества вариантов значений признака первичный ряд является труднообозримым, и непосредственное рассмотрение его не дает представления о распределении единиц по значению признака в совокупности. Поэтому первым шагом в упорядочении первичного ряда является его ранжирование – расположение всех вариантов в возрастающем (убывающем) порядке

Вариационные ряды состоят из двух элементов: вариант и частот.

Варианта - это отдельное значение варьируемого признака, которое он принимает в ряду распределения.

Частота - это численность отдельных вариант или каждой группы вариационного ряда. Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями. Сумма частот составляет объем ряда распределения.

Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов, необходимо установить оптимальное число интервалов, на которые следует разбить все единицы изучаемой совокупности.

2) Графическое изображение статистических данных

Статистический график– это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.

Значение графического метода в анализе и обобщении данных велико. Графическое изображение позволяет осуществить контроль достоверности статистических показателей, так как, представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможны изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности в случае установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры явлений, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравнительные характеристики и отчетливо виды основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.

Таблица 2. Распределение студентов по возрасту

Расчет показателей вариации .

Вариация – это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Показатели вариации характеризуют колеблемость отдельных значений вариант около средних величин. Показатели вариации определяют различия индивидуальных значений признака внутри изучаемой совокупности. Существует несколько видов показателей вариации:

а) Размах вариации R представляет собой разность между максимальным и минимальным значениями признака:

R = Xmax – Xmin

Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

б) Среднее линейное отклонение

(7) - невзвешенное;

(8) - взвешенное,

где: Х - варианты;

`Х - средняя величина;

n - число признаков;

f - частоты.

Линейное отклонение учитывает различия всех единиц изучаемой совокупности.

в) Дисперсия - показатель вариации, выражающий средний квадрат отклонений вариант от средних величин в зависимости от образующего вариационного фактора.

(9) - невзвешенная;

(10) - взвешенная.

Показатель дисперсии более объективно отражает меру вариации на практике.

г) Среднее квадратическое отклонение

(11) - взвешенное;

(12) - невзвешенное.

Среднее квадратическое отклонение является показателем надежности средней: чем меньше среднее квадратическое отклонение, тем лучше средняя арифметическая отражает собой всю статистическую совокупность.

д) Показатель вариации.

Показатель вариации отражает тенденцию развития явления, т.e. действие главных факторов. Показатель вариации выражается в % или коэффициентах.

Расчет моды и медианы .

Особым видом средних величин являются структурные средние. Они применяются для изучения внутреннего строения и структуры рядов распределения значений признака. К таким показателям относятся мода и медиана.

Мода - это величина признака (варианта), который наиболее часто встречается в данной совокупности, т.e. это варианта, имеющая наибольшую частоту.

В интервальном ряду распределения мода находится по следующей формуле:

где: минимальная граница модального интервала;

Величина модального интервала;

{частоты модального интервала, предшествующего и следующего за ним

Модальный интервал определяется по наибольшей частоте. Мода широко используется в статистической практике при изучении покупательского спроса, регистрации цен и т.д.

Медиана - варианта, находящаяся в середине ряда распределения.

Медиана делит ряд на две равные (по числу единиц) части – со значениями признака меньше медианы и со значениями признака больше медианы.

В случае если вариационный ряд имеет число значений вариант четное, то расчет медианы производится по следующей формуле:

где - варианты, находящиеся в середине ряда

В интервальном ряду распределения медиана рассчитывается следующим образом:

где: - нижняя граница медианного интервала;

Величина медианного интервала;

Полусумма частот ряда;

Сумма накопленных частот, предшествующих медианному интервалу;

Частота медианного интервала.

Структурные средние величины (мода и медиана) имеют довольно большое значение в статистике и широкое применение. Мода является именно тем числом, которое в действительности встречается наиболее часто. Медиана имеет важные свойства для анализа явлений: она обнаруживает типичные черты индивидуальных признаков явления, и, вместе с тем, учитывает влияние крайних значений совокупности. Медиана находит практическое применение в маркетинговой деятельности вследствие особого свойства – сумма абсолютных отклонений чисел ряда от медианы есть величина наименьшая:

2. Расчетная часть

По результатам 20%-ного выборочного обследования торговых предприятий района, проведенного на основе случайной бесповторной выборки, получены следующие данные за отчетный месяц (тыс. руб.)

Таблица 1. Исходные данные

Товарооборот	Средние товарные запасы	Товарооборот	Средние товарные запасы

Цель статистического исследования - анализ совокупности предприятий по признакам Товарооборот и Средние товарные запасы , включая:

· изучение структуры совокупности по признаку Товарооборота ;

· выявление наличия корреляционной связи между признаками Товарооборота и Средними товарными запасами предприятий, установление направления связи и оценка её тесноты;

· применение выборочного метода для определения статистических характеристик генеральной совокупности фирм.

Задание 1

По исходным данным (табл. 1) необходимо выполнить следующее:

1. Построить статистический ряд распределения предприятий по товарообороту , образовав пять групп с равными интервалами.

2. Графическим методом и путем расчетов определить значения моды и медианы полученного ряда распределения.

4. Вычислить среднюю арифметическую по исходным данным (табл. 1), сравнить её с аналогичным показателем, рассчитанным для интервального ряда распределения. Объяснить причину их расхождения.

Сделать выводы по результатам выполнения Задания 1.

Выполнение Задания 1

является изучение состава и структуры выборочной совокупности предприятий путем построения и анализа статистического ряда распределения фирм по признаку Товарооборот.

1. Построение интервального ряда распределения предприятий по товарообороту

Для построения интервального ряда распределения определяем величину интервала h по формуле:

где –наибольшее и наименьшее значения признака в исследуемой совокупности, k - число групп интервального ряда.

При заданных k = 5, x max = 795 тыс.руб. и x min = 375тыс руб.

h = тыс.руб.

При h = 5 чел. границы интервалов ряда распределения имеют следующий вид (табл. 2):

Таблица 2

Номер группы	Нижняя граница, тыс.руб.	Верхняя граница, тыс.руб

Определяем число предприятий, входящих в каждую группу, используя принцип полуоткрытого интервала [) , согласно которому предприятия со значениями признаков, которые служат одновременно верхними и нижними границами смежных интервалов (459, 543, 627, и 711 тыс.руб), будем относить ко второму из смежных интервалов.

Для определения числа предприятий в каждой группе строим разработочную таблицу 3 (данные графы 4 потребуются при выполнении Задания 2).

Таблица 3. Разработочная таблица для построения интервального ряда распределения и аналитической группировки

предприятия	Товарооборот,	Средние товарные запасы,

На основе групповых итоговых строк «Всего» табл. 3 формируем итоговую таблицу 4, представляющую интервальный ряд распределения предприятий по товарообороту.

Таблица 4. Распределение предприятий по товарообороту

Приведем еще три характеристики полученного ряда распределения - частоты групп в относительном выражении, накопленные (кумулятивные) частоты S j , получаемые путем последовательного суммирования частот всех предшествующих (j -1) интервалов, и накопленные частости , рассчитываемые по формуле

Таблица 5. Структура предприятий по товарообороту

Группы предприятий по товарообороту, тыс.руб.x	Число предприятий,		Накопленная частота	Накопленная частость, %
Группы предприятий по товарообороту, тыс.руб.x	в абсолютном выражении	в % к итогу	Накопленная частота	Накопленная частость, %

Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по товарообороту не является равномерным: преобладают предприятия с товарооборотом от 543 тыс.руб. до 627 тыс.руб. (это 11 предприятий, доля которых составляет 36,7%); самые малочисленная группа предприятий имеет 711-795 тыс.руб.. Группа включает 3 предприятия, что составляет по 10% от общего числа фирм.

2. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов

Для определения моды графическим методом строим по данным табл. 4 (графы 2 и 3) гистограмму распределения фирм по изучаемому признаку.

Рис. 1.Определение моды графическим методом

Расчет конкретного значения моды для интервального ряда распределения производится по формуле:

где х Мo – нижняя граница модального интервала,

h – величина модального интервала,

f Mo – частота модального интервала,

f Mo-1 – частота интервала, предшествующего модальному,

f Mo+1 – частота интервала, следующего за модальным.

Согласно табл. 4 модальным интервалом построенного ряда является интервал 35 - 40 чел., т.к. он имеет наибольшую частоту (f 4 =10). Расчет моды:

Вывод. Для рассматриваемой совокупности предприятий наиболее распространенный товарооборот характеризуется средней величиной 593,4 тыс. руб.

Для определения медианы графическим методом строим по данным табл. 5 кумуляту распределения предприятий по изучаемому признаку.

Рис. 2. Определение медианы графическим методом

Расчет конкретного значения медианы для интервального ряда распределения производится по формуле

где х Ме – нижняя граница медианного интервала,

h – величина медианного интервала,

– сумма всех частот,

f Ме – частота медианного интервала,

S Mе-1 – кумулятивная (накопленная) частота интервала, предшествующего медианному.

Определяем медианный интервал. Медианным интервалом является интервал 543-627 тыс.руб., т.к. именно в этом интервале накопленная частота S j =20 впервые превышает полусумму всех частот ().

Расчет медианы:

Вывод . В рассматриваемой совокупности предприятий половина из них имеют товарооборот не более 588,3 тыс.руб., а другая половина – не менее 588,3 тыс.руб.

3. Расчет характеристик ряда распределения

Для расчета характеристик ряда распределения, σ , σ 2 , V σ на основе табл. 5 строим вспомогательную таблицу 6 (– середина интервала).

Таблица 6. Расчетная таблица для нахождения характеристик ряда распределения

Группы предприятий по товарообороту, тыс.руб.	Середина интервала,	Число предприятий, *f j*

Рассчитаем среднюю арифметическую взвешенную:

Рассчитаем среднее квадратическое отклонение:

Рассчитаем дисперсию:

σ2 = 972 = 9409

Рассчитаем коэффициент вариации:

Вывод . Анализ полученных значений показателей и σ говорит о том, что средняя величина товарооборота составляет 585 тыс.руб., отклонение от этой величины в ту или иную сторону составляет в среднем 97 тыс. руб. (или 16,5%), наиболее характерный товарооборот находится в пределах от 488 до 628 тыс. руб. (диапазон).

Значение V σ = 16,5% не превышает 33%, следовательно, вариация товарооборота в исследуемой совокупности предприятий незначительна и совокупность по данному признаку однородна. Расхождение между значениями, Мо и Ме незначительно (=585 тыс. руб., Мо =593,4 тыс. руб., Ме =588,3 чел.), что подтверждает вывод об однородности совокупности фирм. Таким образом, найденное среднее значение среднесписочной численности менеджеров (585тыс.руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.

4. Вычисление средней арифметической по исходным данным о среднесписочной численности менеджеров фирм

Для расчета применяется формула средней арифметической простой:

Причина расхождения средних величин, рассчитанных по исходным данным (17550 тыс. руб.) и по интервальному ряду распределения (17670 тыс. руб.), заключается в том, что в первом случае средняя определяется по фактическим значениям исследуемого признака для всех 30-ти фирм, а во втором случае в качестве значений признака берутся середины интервалов и, следовательно, значение средней будет менее точным. Вместе с тем, при округлении обеих рассматриваемых величин их значения совпадают, что говорит о достаточно равномерном распределении товарооборота внутри каждой группы интервального ряда.

Задание 2

По исходным данным (табл. 1) с использованием результатов выполнения Задания 1 необходимо выполнить следующее:

1. Установить наличие и характер корреляционной связи между признаками товарооборот и средние товарные запасы , образовав шесть групп с равными интервалами по каждому из признаков, используя методы:

а) аналитической группировки;

б) корреляционной таблицы.

2. Измерить тесноту корреляционной связи, используя коэффициент детерминации и эмпирическое корреляционное отношение .

Сделать выводы по результатам выполнения задания 2.

Выполнение задания 2

Целью выполнения данного задания является выявление наличия корреляционной связи между факторным и результативным признаками, а также установление направления связи и оценка ее тесноты.

По условию Задания 2 факторным является признак товарооборот , результативным – признак средние товарные запасы .

1. Установление наличия и характера корреляционной связи между признаками товарооборотом и средними товарными запасами методами аналитической группировки и корреляционных таблиц

1а. Применение метода аналитической группировки

Аналитическая группировка строится по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y . Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.

Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х - товарооборот и результативным признаком Y – средние товарные запасы . Макет аналитической таблицы имеет следующий вид (табл. 7):

Таблица 7. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы	Группы предприятий по товарообороту, тыс. руб. x	Число предприятий, *f j*
Номер группы	Группы предприятий по товарообороту, тыс. руб. x	Число предприятий, *f j*







	ИТОГО

Групповые средние значения получаем из таблицы 3, основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8:

Таблица 8. Зависимость объема продаж от среднесписочной численности менеджеров

Номер группы	Группы предприятий по товарообороту, тыс. руб. x	Число предприятий, *f j*	Средние товарные запасы, тыс. руб.
Номер группы	Группы предприятий по товарообороту, тыс. руб. x	Число предприятий, *f j*		в среднем на одно предприятие,

Вывод. Анализ данных табл. 8 показывает, что с увеличением товарооборота от группы к группе систематически возрастает и средний товарный запас по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.

1б. Применение метода корреляционных таблиц

Корреляционная таблица строится как комбинация двух рядов распределения по факторному признаку Х и результативному признаку Y . На пересечении j -ой строки и k -ой графы таблицы указывается число единиц совокупности, входящих в j -ый интервал по признаку X и в k -ый интервал по признаку Y . Концентрация частот около диагонали построенной таблицы свидетельствует о наличии корреляционной связи между признаками - прямой или обратной. Связь прямая, если частоты располагаются по диагонали, идущей от левого верхнего угла к правому нижнему, обратная - по диагонали от правого верхнего угла к левому нижнему.

Для построения корреляционной таблицы необходимо знать величины и границы интервалов по двум признакам X и Y . Для факторного признака Х – Товарооборот эти величины известны из табл. 4 Определяем величину интервала для результативного признака Y – средние товарные запасы при k = 5 , у max = 301 тыс. руб., у min = 150 тыс. руб.:

Границы интервалов ряда распределения результативного признака Y имеют вид:

Таблица 9

Номер группы	Нижняя граница, Тыс. руб.	Верхняя граница, Тыс. руб.

Подсчитывая для каждой группы число входящих в нее фирм с использованием принципа полуоткрытого интервала [) , получаем интервальный ряд распределения результативного признака (табл. 10).

Таблица 10. Интервальный ряд распределения фирм по объёму продаж

Используя группировки по факторному и результативному признакам, строим корреляционную таблицу (табл. 11).

Таблица 11. Корреляционная таблица зависимости объема продаж от среднесписочной численности менеджеров

Группы предприятий по товарообороту, тыс. руб.	Группы предприятий по среднему товарному запасу, тыс. руб.
Группы предприятий по товарообороту, тыс. руб.

Вывод . Анализ данных табл. 11 показывает, что распределение частот групп произошло вдоль диагонали, идущей из левого верхнего угла в правый нижний угол таблицы. Это свидетельствует о наличии прямой корреляционной связи между среднесписочной численностью менеджеров и объемом продаж фирмами.

2. Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения

Коэффициент детерминации характеризует силу влияния факторного (группировочного) признака Х на результативный признак Y и рассчитывается как доля межгрупповой дисперсии признака Y в его общей дисперсии:

где – общая дисперсия признака Y ,

– межгрупповая (факторная) дисперсия признака Y .

Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных ) и вычисляется по формуле

где y i – индивидуальные значения результативного признака;

– общая средняя значений результативного признака;

n – число единиц совокупности.

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка) и вычисляется по формуле

где –групповые средние,

– общая средняя,

–число единиц в j-ой группе,

k – число групп.

Для расчета показателей и необходимо знать величину общей средней , которая вычисляется как средняя арифметическая простая по всем единицам совокупности:

Значения числителя и знаменателя формулы имеются в табл. 8. Используя эти данные, получаем общую среднюю:

228 тыс. руб.

Для расчета общей дисперсии применяется вспомогательная таблица 12.

Таблица 12. Вспомогательная таблица для расчета общей дисперсии

предприятия	Средние товарные запасы, тыс.руб.

Рассчитаем общую дисперсию:

Для расчета межгрупповой дисперсии строится вспомогательная таблица 13, При этом используются групповые средние значения из табл.

Таблица 13ю Вспомогательная таблица для расчета межгрупповой дисперсии

Группы предприятий по товарообороту, тыс. руб. x	Число предприятий, f j	Среднее значение в группе,

Рассчитаем межгрупповую дисперсию:

Определяем коэффициент детерминации:

Вывод. 81% вариации объёма продаж товаров фирмами обусловлено вариацией среднесписочной численности менеджеров по продажам, а 19% – влиянием прочих неучтенных факторов.

Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле

Рассчитаем показатель:

Вывод : согласно шкале Чэддока связь между товарооборотом и средними товарными запасами предприятий является весьма тесной.

Задание 3

По результатам выполнения Задания 1 с вероятностью 0,954 необходимо определить:

1) ошибку выборки для средней величины товарооборота торгового предприятия, а также границы, в которых будет находиться генеральная средняя.

2) ошибку выборки доли торговых предприятий с объемом товарооборота 627 и более тыс. руб., а также границы, в которых будет находиться генеральная доля фирм.

Выполнение Задания 3

Целью выполнения данного Задания является определение для генеральной совокупности предприятий района границ, в которых будут находиться средняя величина товарооборота, и доля предприятий с товарооборотом не менее 627 тыс. руб.

1. Определение ошибки выборки для величины товарооборота, а также границ, в которых будет находиться генеральная средняя

Применяя выборочный метод наблюдения, необходимо рассчитать ошибки выборки (ошибки репрезентативности), т.к. генеральные и выборочные харак- теристики, как правило, не совпадают, а отклоняются на некоторую величину ε .

Принято вычислять два вида ошибок выборки - среднюю и предельную .

Для расчета средней ошибки выборки применяются различные формулы в зависимости от вида и способа отбора единиц из генеральной совокупности в выборочную.

Для собственно-случайной и механической выборки с бесповторным способом отбора средняя ошибка для выборочной средней определяется по формуле

где – общая дисперсия изучаемого признака,

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная средняя:

где – выборочная средняя,

– генеральная средняя.

Предельная ошибка выборки кратна средней ошибке с коэффициентом кратности t (называемым также коэффициентом доверия):

Коэффициент кратности t зависит от значения доверительной вероятности Р , гарантирующей вхождение генеральной средней в интервал, называемый доверительным интервалом .

Наиболее часто используемые доверительные вероятности Р и соответствующие им значения t задаются следующим образом (табл. 14):

Таблица 14

По условию Задания 2 выборочная совокупность насчитывает 30 фирм, выборка 20% механическая, следовательно, генеральная совокупность включает 150 фирм . Выборочная средняя, дисперсия определены в Задании 1. Значения параметров, необходимых для решения задачи, представлены в табл. 15:

Таблица 15

Рассчитаем среднюю ошибку выборки:

Рассчитаем предельную ошибку выборки:

Определим доверительный интервал для генеральной средней:

Вывод. На основании проведенного выборочного обследования с вероятностью 0,954 можно утверждать, что для генеральной совокупности предприятий средняя величина товарооборота находится в пределах от 553 до 616 тыс. руб.

2. Определение ошибки выборки для доли фирм товарооборотом 627 тыс. руб. и более, а также границ, в которых будет находиться генеральная доля

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой

где m – число единиц совокупности, обладающих заданным свойством;

n – общее число единиц в совокупности.

Для собственно-случайной и механической выборки с бесповторным способом отбора предельная ошибка выборки доли единиц, обладающих заданным свойством, рассчитывается по формуле

где w – доля единиц совокупности, обладающих заданным свойством;

(1- w ) – доля единиц совокупности, не обладающих заданным свойством,

N – число единиц в генеральной совокупности,

n – число единиц в выборочной совокупности.

Предельная ошибка выборки определяет границы, в пределах которых будет находиться генеральная доля р единиц, обладающих исследуемым признаком:

По условию Задания 3 исследуемым свойством фирм является равенство или превышение товарооборота величины 627 тыс. руб .

Число предприятий с данным свойством определяется из табл. 3: m=7

Рассчитаем выборочную долю:

Рассчитаем предельную ошибку выборки для доли:

Определим доверительный интервал генеральной доли:

Вывод. С вероятностью 0,954 можно утверждать, что в генеральной совокупности предприятий района доля предприятий с товарооборотом 627 тыс. руб. и более будет находиться в пределах от 18% до 48,5%.

Задание 4

Имеются данные о продаже товара А на трех городских рынках:

Таблица 16

Базисный период		Отчетный период
	Продано, т	Изменение цены, %	Индекс физического объема(q 1)

		Без изменений

Определите:

2. Абсолютное изменение средней цены товара в результате влияния отдельных факторов.

Таблица 17

Базисный период		Отчетный период		Расчетные графы
Средняя цена за 1 кг., руб. (р 0)	Продано, т	Изменение цены, %	Индекс физического объема (q 1)

Вычислим индекс цен переменного состава:

Из таблицы видно, что цена продукции на каждом рынке в отчетном периоде по сравнению с базисным изменилась. В целом же средняя цена выросла на 4 % .Это объясняется влиянием изменений структуры реализации продукции по торговым городским рынкам. В базисном периоде по более низкой цене продавали продукцию меньше, чем в отчетном периоде по более высокой цене.

Рассчитываем индекс структурных сдвигов:

Первая часть приведенной формулы позволяет ответить на вопрос, какой была бы средняя цена в отчетном периоде. Вторая часть формулы отражает фактическую среднюю цену базисного периода.

Рассчитанный индекс показал, что за счет структурных сдвигов цены значительно не изменились.

Определим индекс фиксированного или постоянного состава, который не учитывает изменения структуры продаж:

Индекс цен фиксированного состава равен 104,1%, что позволяет сделать следующий вывод: если бы структура продаж продукции на городских рынках не изменилась, средняя цена возросла бы на 4,1%., что и произойдет в дальнейшем.

Между данными индексами существует следующая взаимосвязь:

Ip фс * I cc т = Ip пс;

1,041 * 0,99 =1,040

Определим абсолютное изменение средней цены товара в результате влияния отдельных факторов:

D pq = åp 1 q 1 - å p 0 q 0

D pq = 141407,9 – 134400 =7008 руб.

Заключение

Статистические ряды распределения являются базисным методом для любого статистического анализа.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку, характеризует структуру изучаемого явления. Анализируя рассчитанные показатели статистического ряда распределения, можно делать выводы об однородности или неоднородности совокупности, закономерности распределения и границах варьирования единиц совокупности. Изучив основные приемы исследования и практики применения рядов распределения, а также методику вычисления наиболее важных статистических величин, необходимо отметить, что конечная цель изучения статистики в целом - анализ изучаемого явления - крайне важен для всех сфер человеческой жизни. Анализ отображает явления в целом и вместе с этим учитывает влияние каждого фактора в отдельности. На основании проведенного анализа можно учитывать и прогнозировать факторы, негативно влияющие на развитие событий.

Социально-экономическая статистика обеспечивает предоставление важной цифровой информации об уровне и возможностях развития страны: ее экономическом положении, уровне жизни населения, его составе и численности, рентабельности предприятий, динамике безработице и т.д. Статистическая информация является одним из решающих ориентиров государственной экономической политики.

Статистические методы используют комплексно. Выделяют три основные стадии экономико-статистического исследования: сбор первичной статистической информации, статистическая сводка и обработка первичной информации, обобщение и интепретация статистической информации.

Качество, достоверность статистической информации определяют эффективность использования статистики на любом уровне и в любой сфере.

Литература

1. Статистика: Учеб. пособие/А.В. Багат, М.М. Конкина, В.М. Симчера и др.; Под ред. В.М. Симчеры.- М.: Финансы и статистика, 2005.

2. Громыко Г.Л. Теория статистики: Учебник. - М.: ИНФРА-М, 2006.

3. Практикум по статистике: Учеб. пособие для вузов/ Под ред. В.М. Симчеры. - М.: Финстатинформ, 1999.

4. Гусаров В.М. Статистика: Учеб. пособие для вузов. - М.: ЮНИТИ - ДАНА, 2001.

5. Гусаров В.М. Статистика: Учеб пособие/ В.М. Гусаров, Е.И. Кузнецова. – 2-е изд., перераб. и доп. – М.: ЮНИТИ-ДАНА, 2007.

6. Общая теория статистики: Статистическая методология в изучении коммерческой деятельности: Учебник / Под. ред. Башиной О.Э., Спирина А.А. – М.: Финансы и статисика, 2005.

7. Практикум по теории статистики: Учебное пособие/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2004.

8. Теория статистики: Учебник/Под. ред. Шмойловой Р.А. – М.: Финансы и статистика, 2001; 2003; 2006.

9. http://www.gks.ru

Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Тема 9. Ряды распределения

Статистические ряды распределения – это первичная характеристика массовой статистической совокупности, упорядоченное разложение единиц изучаемой совокупности на группы по группировочному признаку. Любой статистический ряд распределения состоит из двух элементов:

1) отдельных значений варьирующего признака (вариантов );

2) величин, которые показывают, сколько раз повторяется данная варианта (частот ).

Примечание . Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями ; это численность ряда распределения выражается суммой частот .

Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным (распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.). Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным . Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).

Выделяют три формы вариационного ряда :

1) ранжированный ряд - это распределение отдельных единиц совокупности в порядке возрастания или убывания исследуемого признака; ранжирование позволяет легко разделить количественные данные по группам, сразу обнаружить наименьшее и наибольшее значения признака, выделить значения, которые чаще всего повторяются; другие формы вариационного ряда - групповые таблицы , составленные по характеру вариации значений изучаемого признака;

2) дискретный ряд - это такой вариационный ряд, в основу построения которого положены признаки с прерывным изменением, между которыми нет промежуточных значений (дискретные признаки - тарифный разряд, количество детей в семье, число работников на предприятии и т.д.); эти признаки могут принимать только конечное число определенных значений;

Дискретный ряд представляет собой групповую таблицу , которая состоит из двух граф: в первой графе указывается конкретное значение признака, а во второй - число единиц совокупности с определенным значением признака;

3) если признак имеет непрерывное изменение (размер дохода, стаж работы, стоимость основных фондов предприятия и т.д., которые в определенных границах могут принимать любые значения), то для этого признака нужно строить интервальный ряд (с равными или неравными интервалами).

Групповая таблица здесь также имеет две графы. В первой указывается значение признака в интервале «от - до» (варианты), во второй - число единиц, входящих в интервал (частота). Очень часто таблица дополняется графой, в которой подсчитываются накопленные частоты S, которые показывают, какое количество единиц совокупности имеет значение признака не большее, чем данное значение. Частоты ряда f могут заменяться частностями w , выраженными в относительных числах (долях или процентах). Они представляют собой отношения частот каждого интервала к их общей сумме (9.1):

(9.1)

При построении вариационного ряда с интервальными значениями, прежде всего, необходимо установить величину интервала i, которая определяется как отношение размаха вариации R к числу групп n (9.2):

где R = x max - x min ; n = 1 + 3,322 lgN(формула Стерджесса ); N - общее число единиц совокупности.

Интервальные вариационные ряды могут быть построены и для признаков с дискретной вариацией. Нередко в статистическом исследовании указывать отдельное значение дискретного признака нецелесообразно, т.к. это, как правило, затрудняет рассмотрение вариации признака. Поэтому возможные дискретные значения признака распределяются по группам и подсчитываются соответствующие им частоты (частности). При построении интервального ряда по дискретному признаку границы смежных интервалов не повторяют друг друга: следующий интервал начинается со следующего по порядку (после верхнего значения предыдущего интервала) дискретного значения признака.

При сравнении частот ряда с неравными интервалами для характеристики их наполненности рассчитывают плотность распределения. Средняя плотность в интервале – это частное от деления частоты и частности на величину интервала. В первом случае плотность абсолютная, во втором – относительная. Средняя плотность показывает, сколько единиц или их процентов приходится на единицу измерения варианты. Частота, частность, плотность и накопленная частота – это различные функции от величины варианты.

В процессе анализа статистических данных , представленных рядами распределения, кроме знания о характере распределения (или структуре совокупности) могут вычисляться различные статистические показатели (числовые характеристики), которые в обобщенном виде отражают особенности распределения изучаемых признаков. Эти характеристики (показатели) могут быть разделены на 3 основные группы

1) характеристики центра распределения (средняя, мода, медиана);

2) характеристики степени вариации (вариационный размах, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации);

3) характеристики формы (типа) распределения (показатели эксцесса и асимметрии, ранговые характеристики, кривые распределения).

Наиболее надежный путь выявления закономерности распределения состоит в следующем:
1) увеличить количество наблюдаемых случаев (в соответствии с законом больших чисел, в таких рядах случайные отклонения от общей закономерности у индивидуальных значений будут взаимно погашаться);

2) первоначально совокупность разбить на максимальное возможное число групп, затем, постепенно сокращая число групп, оптимизировать группировку с точки зрения выявления закономерности распределения.

При реализации такого подхода закономерность, характерная для данного распределения будет выступать все более и более ясно, а ломаная линия, изображающая полигон, будет приближаться к некоторой плавной линии и в пределе должна превратиться в кривую линию.

Виды рядов распределения

Графическое изображение рядов распределения

Введение

Таблица 13ю Вспомогательная таблица для расчета межгрупповой дисперсии

Репетиторство