Автоматизированный априорный анализ статистической совокупности в среде MS Excel. 4
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ БЮДЖЕТНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ
ФИНАНСОВЫЙ УНИВЕРСИТЕТ
ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ
Липецкий филиал
Кафедра «Бухгалтерский учет, аудит, статистика» |
О Т Ч Е Т
о результатах выполнения
компьютерной лабораторной работы №1
Автоматизированный априорный анализ статистической совокупности в среде MS Excel
Вариант № 5
Выполнил: ст. II курса гр.3Б3-ЭФ
Липецк 2015г.
Постановка задачи
При проведении статистического наблюдения за деятельностью предприятий корпорации получены выборочные данные о среднегодовой стоимости основных производственных фондов и выпуске продукции за год по 32-м предприятиям, выпускающим однотипную продукцию (выборка 10%-ная, механическая).
В статистическом исследовании эти предприятия выступают как единицы выборочной совокупности. Генеральную совокупность образуют все предприятия корпорации. Анализируемые признаки предприятий – Среднегодовая стоимость основных производственных фондов и Выпуск продукции – изучаемые признаки единиц совокупности.
Для автоматизации статистических расчетов используются средства электронных таблиц процессора Excel.
Выборочные данные представлены на Листе 1 Рабочего файла в табл.1 (ячейки B4:C35):
В процессе исследования совокупности необходимо решить ряд задач.
I. Статистический анализ выборочной совокупности
- Выявить наличие среди исходных данных резко выделяющихся значений признаков (аномалий в данных) и исключить их из выборки.
- Рассчитать обобщающие статистические показатели совокупности по изучаемым признакам: среднюю арифметическую ( ), моду (Мо), медиану (Ме), размах вариации (R), дисперсию( ), среднее квадратическое отклонение ( ), коэффициент вариации (Vσ).
- На основе рассчитанных показателей в предположении, что распределения единиц по обоим признакам близки к нормальному, оценить:
а) степень колеблемости значений признаков в совокупности;
б) степень однородности совокупности по изучаемым признакам;
в) количество попаданий индивидуальных значений признаков в диапазоны ( ), ( ), ( )..
- Сравнить распределения единиц совокупности по двум изучаемым признакам на основе анализа:
а) колеблемости признаков;
б) однородности единиц;
в) надежности (типичности) средних значений признаков.
- Построить интервальный вариационный ряд и гистограмму распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов и установить характер (тип) этого распределения.
II. Статистический анализ генеральной совокупности
- Рассчитать генеральную дисперсию , генеральное среднее квадратическое отклонение и ожидаемый размах вариации признаков RN. Сопоставить значения генеральной и выборочной дисперсий.
- Для изучаемых признаков рассчитать:
а) среднюю ошибку выборки;
б) предельные ошибки выборки для уровней надежности P=0,683, P=0,954 и границы, в которых будут находиться средние значения признака в генеральной совокупности при заданных уровнях надежности.
- Рассчитать коэффициенты асимметрии As и эксцесса Ek. На основе полученных оценок охарактеризовать особенности формы распределения единиц генеральной совокупности по каждому из изучаемых признаков.
III. Экономическая интерпретация результатов статистического исследования предприятий
В этой части исследования необходимо ответить на ряд вопросов.
- Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?
- Каковы наиболее характерные для предприятий значения показателей среднегодовой стоимости основных фондов и выпуска продукции?
- Насколько сильны различия в экономических характеристиках предприятий выборочной совокупности? Можно ли утверждать, что выборка сформирована из предприятий с достаточно близкими значениями по каждому из показателей?
- Какова структура предприятий выборочной совокупности по среднегодовой стоимости основных фондов? Каков удельный вес предприятий с наибольшими, наименьшими и типичными значениями данного показатели? Какие именно это предприятия?
- Носит ли распределение предприятий по группам закономерный характер и какие предприятия (с более высокой или более низкой стоимостью основных фондов) преобладают в совокупности?
- Каковы ожидаемые средние величины среднегодовой стоимости основных фондов и выпуска продукции на предприятиях корпорации в целом? Какое максимальное расхождение в значениях каждого показателя можно ожидать?
2. Выводы по результатам выполнения лабораторной работы
I. Статистический анализ выборочной совокупности
Задача 1.
Вывод:
Количество аномальных единиц наблюдения (табл.2) равно 750 и 250, номера предприятий 11 и 30.
Задача 2. Рассчитанные выборочные показатели представлены в двух таблицах — табл.3 и табл.5. На основе этих таблиц формируется единая таблица (табл.8) значений выборочных показателей, перечисленных в условии Задачи 2.
При этом следует учитывать следующие особенности инструмента Описательная статистика табличного процессора Excel.
- Между терминологией инструмента Описательная статистика и терминами, принятыми в отечественной статистике, имеется ряд расхождений. Согласование терминологии приводится в нижеследующей таблице 2-M.
Статистическая интерпретация параметров Описательной статистики
Параметр инструмента Описательная статистика |
Статистический показатель |
Обозна-чение |
Среднее |
Средняя арифметическая величина признака в выборке, вычисленная по несгруппированным данным |
|
Стандартная ошибка |
Средняя ошибка выборки - среднее квадратическое отклонение выборочной средней от математического ожидания генеральной средней |
|
Медиана |
Значение признака, приходящееся на середину ранжированного ряда выборочных данных |
Me |
Мода |
Значение признака, повторяющееся в выборке с наибольшей частотой |
Mo |
Стандартное отклонение |
Генеральное среднее квадратическое отклонение, оцененное по выборке |
σ N |
Дисперсия выборки |
Генеральная дисперсия, оцененная по выборке |
σ 2 N |
Эксцесс |
Коэффициент эксцесса, оценивающий по выборке значение эксцесса в генеральной совокупности |
Ek N |
Асимметричность |
Коэффициент асимметрии, оценивающий по выборке величину асимметрии в генеральной совокупности |
As N |
Интервал |
Размах вариации в выборке |
R |
Минимум |
Минимальное значение признака в выборке |
xmin |
Максимум |
Максимальное значение признака в выборке |
xmax |
Сумма |
Суммарное значение элементов выборки |
|
Счет |
Объем выборки |
n |
Уровень надежности (95,0%) |
Предельная ошибка выборки, оцененная с заданным уровнем надежности |
- Для нижеследующих четырех параметров Excel генерирует оценки не для выборки, а для генеральной совокупности:
Стандартное отклонение,
Дисперсия выборки,
Эксцесс,
Асимметричность
Значения выборочных показателей представлены в табл. 8.
Таблица 8
Описательные статистики выборочной совокупности
Обобщающие статистические показатели совокупности по изучаемым признакам |
Признаки | |
Среднегодовая стоимость основных производственных фондов |
Выпуск продукции | |
Средняя арифметическая ( ), млн. руб. |
690 |
652,1666667 |
Мода (Мо), млн. руб. |
715 |
650 |
Медиана (Ме), млн. руб. |
697,5 |
647,5 |
Размах вариации (R), млн. руб. |
500 |
600 |
Дисперсия ( ) |
14625,86207 |
20813,24713 |
Среднее квадратическое отклонение ( ), млн. руб. |
120,9374304 |
144,2679699 |
Коэффициент вариации (Vσ), % |
46,03273865 |
54,91310449 |
Задача 3.
3а). Степень колеблемости признака определяется по значению коэффициента вариации Vs в соответствии с оценочной шкалой колеблемости признака:
0%<Vs 40% - колеблемость незначительная;
40%< Vs 60% - колеблемость средняя (умеренная);
Vs>60% - колеблемость значительная.
Вывод:
Для признака Среднегодовая стоимость основных производственных фондов показатель Vs =22,482033765 . Так как значение показателя лежит в диапазоне 68,3% оценочной шкалы, следовательно, колеблемость значительная.
Для признака Выпуск продукции показатель Vs =26,81914044 . Так как значение показателя лежит в диапазоне 68,3% оценочной шкалы, следовательно, колеблемость значительная .
3б). Степень однородности совокупности по изучаемому признаку для нормального и близких к нормальному распределений устанавливается по значению коэффициента вариации Vs. Если Vs 33%, то по данному признаку расхождения между значениями признака невелико. Если при этом единицы наблюдения относятся к одному определенному типу, то изучаемая совокупность однородна.
Вывод:
Для признака Среднегодовая стоимость основных производственных фондов показатель , следовательно, по данному признаку выборочная совокупность однородна .
Для признака Выпуск продукции показатель , следовательно, по данному признаку выборочная совокупность однородна .
3в). Для оценки количества
Таблица 9
Распределение значений признака по диапазонам рассеяния признака относительно
Границы диапазонов, млн. руб. |
Количество значений xi, находящихся в диапазоне |
Процентное соотношение рассеяния значений xi по диапазонам, % | ||||
Первый признак |
Второй признак |
Первый признак |
Второй признак |
Первый признак |
Второй признак | |
А |
1 |
2 |
3 |
4 |
5 |
6 |
[569, 0625696;810,9374304] |
[507, 8986968;796,4346366] |
241,8748608 |
288,5359398 |
806,249536 |
86,56078194 | |
[448,1251392; 931,8748608] |
[363,6307269;940,7026065] |
483,7497216 |
577,0718796 |
1612,499072 |
173,12156388 | |
[327,1877088;1052,8122912] |
[219,362757;1084,970564] |
725,6245824 |
865,607807 |
217,68737472 |
259,6823421 | |
На основе данных табл.9 структура рассеяния значений признака по трем диапазонам (графы 5 и 6) сопоставляется со структурой рассеяния по правилу «трех сигм», справедливому для нормальных и близких к нему распределений:
68,3% значений располагаются в диапазоне ( ),
95,4% значений располагаются в диапазоне ( ),
99,7% значений располагаются в диапазоне ( ).
Если полученная в табл. 9 структура рассеяния хi по 3-м диапазонам незначительно расходится с правилом «трех сигм», можно предположить, что распределение единиц совокупности по данному признаку близко к нормальному.
Расхождение с правилом «трех сигм» может быть существенным. Например, менее 60% значений хi попадают в центральный диапазон ( ) или значительно более 5% значения хi выходит за диапазон ( ). В этих случаях распределение нельзя считать близким к нормальному.
Вывод:
Сравнение данных графы 5 табл.9 с правилом «трех сигм» показывает на их незначительно расхождение, следовательно, распределение единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов можно считать близким к нормальному.
Сравнение данных графы 6 табл.9 с правилом «трех сигм» показывает на незначительное расхождение, следовательно, распределение единиц совокупности по признаку Выпуск продукции можно считать близким к нормальному.
Задача 4. Для ответа на вопросы 4а) – 4в) необходимо воспользоваться табл.8 и сравнить величины показателей для двух признаков.
Для сравнения степени колеблемости значений изучаемых признаков, степени однородности совокупности по этим признакам, надежности их средних значений используются коэффициенты вариации Vs признаков.
Вывод:
Так как Vs для первого признака больше , чем Vs для второго признака, то колеблемость значений первого признака больше колеблемости значений второго признака, совокупность более однородна по первому признаку, среднее значение первого признака является более надежным, чем у второго признака.
Задача 5. Интервальный вариационный ряд распределения единиц совокупности по признаку Среднегодовая стоимость основных производственных фондов представлен в табл.7, а его гистограмма и кумулята – на рис.2.
Возможность отнесения распределения признака «Среднегодовая стоимость основных производственных фондов» к семейству нормальных распределений устанавливается путем анализа формы гистограммы распределения. Анализируются количество вершин в гистограмме, ее асимметричность и выраженность «хвостов», т.е. частоты появления в распределении значений, выходящих за диапазон ( ).
1. При анализе формы гистограммы прежде всего следует оценить распределение вариантов признака по интервалам (группам). Если на гистограмме четко прослеживаются два-три «горба» частот вариантов, это говорит о том, что значения признака концентрируются сразу в нескольких интервалах, что не соответствует нормальному закону распределения.
Если гистограмма имеет одновершинную форму, есть основания предполагать, что выборочная совокупность может иметь характер распределения, близкий к нормальному.
2. Для дальнейшего анализа формы распределения используются описательные параметры выборки – показатели центра распределения ( , Mo, Me) и вариации ( ). Совокупность этих показателей позволяет дать качественную оценку близости эмпирических данных к нормальной форме распределения.
Нормальное распределение является симметричным, и для него выполняются соотношения:
Нарушение этих соотношений свидетельствует о наличии асимметрии распределения. Распределения с небольшой или умеренной асимметрией в большинстве случаев относятся к нормальному типу.
3. Для анализа длины «хвостов» распределения используется правило «трех сигм». Согласно этому правилу в нормальном и близким к нему распределениях крайние значения признака (близкие к хmin и хmax) встречаются много реже (5-7 % всех случаев), чем лежащие в диапазоне ( ). Следовательно, по проценту выхода значений признака за пределы диапазона ( ) можно судить о соответствии длины «хвостов» распределения нормальному закону.
Вывод:
1. Гистограмма является одновершинной.
2. Распределение приблизительно симметрично , так как параметры , Mo, Me отличаются незначительно:
3. “Хвосты” распределения не очень длинны, т.к. согласно графе 5 табл.9 1612, 499072% вариантов лежат за пределами интервала ( )=(483,7497216 ; 577,0718796) млн. руб.
Следовательно, на основании п.п. 1,2,3, можно сделать заключение о близости изучаемого распределения к нормальному.
II. Статистический анализ генеральной совокупности
Задача 1. Рассчитанные в табл.3 генеральные показатели представлены в табл.10.
Таблица 10
Описательные статистики генеральной совокупности
Обобщающие статистические показатели совокупности по изучаемым признакам |
Признаки | |
Среднегодовая стоимость основных производственных фондов |
Выпуск продукции | |
Стандартное отклонение , млн. руб. |
120,9374304 |
144,2679699 |
Дисперсия |
14625,86207 |
20813,24713 |
Асимметричность As |
-0,152503649 |
-0,042954448 |
Эксцесс Ek |
-0,344943844 |
-0,205332365 |
Для нормального распределения справедливо равенство
RN=6sN.
В условиях близости распределения единиц генеральной совокупности к нормальному это соотношение используется для прогнозной оценки размаха вариации признака в генеральной совокупности.
Ожидаемый размах вариации признаков RN:
- для первого признака RN =725,6245824,
- для второго признака RN = 865,6078194.
Соотношение между генеральной и выборочной дисперсиями:
- для первого признака 1,03, т.е. расхождение между дисперсиями незначительное;
-для второго признака 1,03, т.е. расхождение между дисперсиями незначительное.
Задача 2. Применение выборочного метода наблюдения связано с измерением степени достоверности статистических характеристик генеральной совокупности, полученных по результатам выборочного наблюдения. Достоверность генеральных параметров зависит от репрезентативности выборки, т.е. от того, насколько полно и адекватно представлены в выборке статистические свойства генеральной совокупности.
Как правило, статистические характеристики выборочной и генеральной совокупностей не совпадают, а отклоняются на некоторую величину ε, которую называют ошибкой выборки (ошибкой репрезентативности). Ошибка выборки – это разность между значением показателя, который был получен по выборке, и генеральным значением этого показателя. Например, разность
определяет ошибку репрезентативности для средней величины признака.
Так как ошибки выборки всегда случайны, вычисляют среднюю и предельную ошибки выборки.
1. Для среднего значения
Для изучаемых признаков средние ошибки выборки даны в табл. 3:
- для признака Среднегодовая стоимость основных производственных фондов
=22,08005289,
- для признака Выпуск продукции
=26,33960714.
2. Предельная ошибка выборки определяет границы, в пределах которых лежит генеральная средняя . Эти границы задают так называемый доверительный интервал генеральной средней – случайную область значений, которая с вероятностью P, близкой к 1, гарантированно содержит значение генеральной средней. Эту вероятность называют доверительной вероятностью или уровнем надежности.
Для уровней надежности P=0,954; P=0,683 оценки предельных ошибок выборки даны в табл. 3 и табл. 4.
Для генеральной средней предельные значения и доверительные интервалы определяются выражениями:
,
Предельные ошибки выборки и ожидаемые границы для генеральных средних представлены в табл. 11.
Таблица 11
Предельные ошибки выборки и ожидаемые границы для генеральных средних
Доверительная вероятность Р |
Коэффи-циент доверия t |
Предельные ошибки выборки, млн. руб. |
Ожидаемые границы для средних | ||
для первого признака |
для второго признака |
для первого признака |
для второго признака | ||
0,683 |
1 |
46,03 |
54,91 |
628,76 |
512,67 |
0,954 |
2 |
22,48 |
26,81 |
616,98 |
598,63 |
Вывод:
Увеличение уровня надежности ведет к расширению ожидаемых границ для генеральных средних.
Задача 3. Рассчитанные в табл.3 значения коэффициентов асимметрии As и эксцесса Ek даны в табл.10.
1.Показатель асимметрии As оценивает смещение ряда распределения влево или вправо по отношению к оси симметрии нормального распределения.
Если асимметрия правосторонняя (As>0) то правая часть эмпирической кривой оказывается длиннее левой, т.е. имеет место неравенство >Me>Mo, что означает преимущественное появление в распределении более высоких значений признака (среднее значение больше серединного Me и модального Mo).
Если асимметрия левосторонняя (As<0), то левая часть эмпирической кривой оказывается длиннее правой и выполняется неравенство <Me<Mo, означающее, что в распределении чаще встречаются более низкие значения признака (среднее значение меньше серединного Me и модального Mo).
Чем больше величина |As|, тем более асимметрично распределение. Оценочная шкала асимметрии:
|As| 0,25 - асимметрия незначительная;
0,25<|As| 0,5 - асимметрия заметная (умеренная);
|As|>0,5 - асимметрия существенная.
Вывод:
Для признака Среднегодовая стоимость основных производственных фондов наблюдается незначительная левосторонняя асимметрия. Следовательно, в распределении преобладают более низкие значения признака.
Для признака Выпуск продукции наблюдается незначительная правосторонняя асимметрия. Следовательно, в распределении преобладают более высокие значения признака.
2.Показатель эксцесса Ek характеризует крутизну кривой распределения - ее заостренность или пологость по сравнению с нормальной кривой.
Как правило, коэффициент эксцесса вычисляется только для симметричных или близких к ним распределений.
Если Ek>0, то вершина кривой распределения располагается выше вершины нормальной кривой, а форма кривой является более островершинной, чем нормальная. Это говорит о скоплении значений признака в центральной зоне ряда распределения, т.е. о преимущественном появлении в данных значений, близких к средней величине.
Если Ek<0, то вершина кривой распределения лежит ниже вершины нормальной кривой, а форма кривой более пологая по сравнению с нормальной. Это означает, что значения признака не концентрируются в центральной части ряда, а рассеяны по всему диапазону от xmax до xmin.
Для нормального распределения Ek=0. Чем больше абсолютная величина |Ek|, тем существеннее распределение отличается от нормального.
При незначительном отклонении Ek от нуля форма кривой эмпирического распределения незначительно отличается от формы нормального распределения.
Вывод:
1. Так как для признака Среднегодовая стоимость основных производственных фондов Ek>0 (Ek<0), то кривая распределения является более островершинной по сравнению с нормальной кривой. При этом Ek незначительно отличается от нуля (Ek=|0,344943844|) Следовательно, по данному признаку форма кривой эмпирического распределения значительно отличается от формы нормального распределения.
2.Так как для признака Выпуск продукции Ek>0 (Ek<0), то кривая распределения является более островершинной по сравнению с нормальной кривой. При этом Ek незначительно отличается от нуля (Ek=|0,205332365|) .Следовательно, по данному признаку форма кривой эмпирического распределения значительно отличается от формы нормального распределения.
III. Экономическая интерпретация результатов статистического исследования предприятий1
- Типичны ли образующие выборку предприятия по значениям изучаемых экономических показателей?
Предприятия с резко выделяющимися значениями показателей приведены в табл.2. После их исключения из выборки оставшиеся 30 предприятий являются типичными по значениям изучаемых экономических показателей.

- Автоматизированный априорный анализ статистической совокупности в среде MS Excel
- Автоматизированный бухгалтерский учет
- Автоматизированный бухучет
- Автоматизированный комплекс индивидуального дозиметрического контроля АКИДК-201
- Автоматизированный контроль за исполнением документов
- Автоматизированный электропривод машин и аппаратов химических производств
- Автоматизированный электропривод сращивания пиломатериалов по длине
- Автоматизированные системы управления торговым предприятием
- Автоматизированные системы управления турфирмой
- Автоматизированные системы управления турфирмой
- Автоматизированные системы управления финансами
- Автоматизированные системы эргономического проектирования. Банки эргономических данных
- Автоматизированные экономические информационные системы и их элементы
- Автоматизированный априорный анализ статистической совокупности в среде MS Excel