18 Март 2011

Социально-экономическая статистика




пе групповая дисперсия:

,

а по совокупности в целом – средняя из внутригрупповых дисперсий:

.

Следовательно, общая вариация признака в совокупности должна определяться как сумма вариации групповых средних (за счет одного выделенного фактора) и остаточной вариации (за счет остальных факторов). Это равенство находит отражение в правиле сложения дисперсий .

Отношение межгрупповой дисперсии к общей дает коэффициент детерминации , который характеризует долю вариации результативного признака, обусловленную вариа-цией факторного признака (положенного в основу группировки).

Коэффициент эмпирического корреляционного отноше-ния характеризует тесноту связи между результативным и факторным признаками.

Для получения представления о форме распределения строят графики распределения (полигон и гистограмму). Число на-блюдений, по которому строится эмпирическое распределение, обычно невелико и представляет собой выборку из исследуемой генеральной совокупности. С увеличением числа наблюдений и одновременно уменьшением величины интервала зигзаги полигона начинают сглаживаться, и в пределе мы приходим к плавной кривой, которая называется кривой распределения.

В статистике исследуются различные виды распределения. Как правило, они одновершинные. Многовершинность свиде-тельствует о неоднородности изучаемой совокупности. Появление двух и более вершин говорит о необходимости перегруппировки данных с целью выделения более однородных групп.

Симметричным называется распределение, в котором частоты любых двух вариантов, равностоящих в обе стороны от центра распределения, равны между собой. Для симметричных распре-делений средняя арифметическая, мода и медиана равны между собой. Простейший показатель асимметрии основан на соотно-шении показателей центра распределения: чем больше разность между средней арифметической и модой (медианой), тем больше асимметрия ряда.

Показатель асимметрии:

или .

Для сравнения асимметрии в нескольких рядах используют относительный показатель асимметрии.

или .

Величина может быть положительной и отрицательной. Если , то на графике такой ряд будет иметь вытяну-тость вправо (правосторонняя асимметрия), если , то вытянутость влево (левосторонняя асимметрия) (рис. 7 и 8).

Рассчитывается также показатель характеристики крутости распределения. Это показатель эксцесса. При одной и той же средней арифметической эмпирический ряд может быть остро-вершинным или низковершинным по сравнению с кривой нор-мального распределения. Показатель эксцесса отражает эту осо-бенность:

.

Если >0, то эксцесс считают положительным (распреде-ление островершинно), если < 0, то эксцесс считается отрица-тельным (распределение низковершинно) (рис. 9 и 10).

Среди различных кривых распределения особое место зани-мает нормальное распределение. Нормальное распределение на графике представляет собой симметричную колоколообразную кривую, имеющую максимум в точке . Эта точка является модой и медианой. Точка перегиба у нормальной кривой находится на расстоянии ± от . Кривая нормального распределения вы-ражается уравнением Лапласа:

,

где t – нормированное отклонение, .

Установлено, что если площадь, ограниченную кривой нор-мального распределения, принять за 100%, то можно рассчитать площадь, заключенную между кривой и любыми двумя ордина-тами. Установлено, что площадь между ординатами, проведен-ными на расстоянии с каждой стороны от , составляет 0,683 всей площади. Это означает, что 68,3% всех частот (единиц) от-клоняются от не более, чем на , т.е. находятся в пределах . Площадь, заключенная между ординатами, проведенными на расстоянии 2 от в обе стороны, составляет 0,954, т.е. 95,4% всех единиц совокупности находятся в пределах . 99,7% всех единиц находятся в пределах . Это правило трех сигм, характерное для нормального распределения.

Нормальное распределение характерно для явлений в био-логии и технике. В экономике чаще встречаются умеренно асим-метричные распределения.

Имея дело с эмпирическими распределениями, можно пред-положить, что каждому эмпирическому распределению соответ-ствует определенная, характерная для него теоретическая кривая. Знание формы теоретической кривой может быть использовано в различных расчетах и прогнозах. Для этого необходимо опреде-лить:

• общий характер распределения;

• по эмпирическим данным построить теоретическую кри-вую;

• определить, насколько эмпирические частоты близки теоретическим.

Введем обозначения:

, ,

где = 2,7182 (основание натурального логарифма);

= 3,14.

Для построения теоретической кривой нормального распре-деления по