Статистические сводки
Тема 4: Статистические сводки и группировки. Статистические таблицы.
1.Сводка
2.Группировка
3.Выполнение группировки по количественному признаку
1.Сводка
Сводка - особая стадия статистического исследования, в ходе которой систематизируются первичные материалы статистического наблюдения.
По глубине и точности обработки материала различают сводку простую и сложную.
Простая статистическая сводка – это операция по подсчету общих итоговых и групповых данных непосредственно по совокупности единиц наблюдения и оформление этого материала в таблицах.
Сложная статистическая сводка – это комплекс операций, включающая распределение единиц наблюдения на группы, составление системы показателей для характеристики типичных групп и подгрупп изучаемой совокупности явлений, подсчет числа единиц и итогов в каждой группе и подгруппах и оформление результатов этой работы в виде статистических таблиц.
Полнота, достоверность и обоснованность результатов сводки обеспечиваются программой и планом ее проведения.
Программа статистической сводки содержит перечень групп, на которые может быть разбита или разбивается совокупность единиц наблюдения, а также систему показателей, характеризующих изучаемую совокупность явлений и процессов как в целом, так и отдельных ее частей.
Программа статистической сводки зависит от целей и задач исследования. Она включает:
предварительный контроль материалов, т.е. проверки исходных данных;
выбор группировочных признаков;
определение порядка формирования групп;
разработка системы статистических показателей для характеристики групп и объекта в целом;
оформление результатов сводки в виде статистических таблиц, удобных для восприятия информации.
Наряду с программой статистической сводки составляется план ее проведения. План статистической сводки содержит информацию о последовательности, сроках и технике проведения сводки, ее исполнителях, о порядке и правилах оформления ее результатов в виде таблиц. По форме обработки материала сводка бывает децентрализованной и централизованной.
Децентрализованная статистическая сводка-это специфический способ организации сводки статистических данных. Он состоит в том, что обработка таких данных производится на местах, т.е. отчеты предприятий сводятся статистическими органами субъектов Российской Федерации. Полученные итоги поступают в Госкомстат РФ, а там выводятся итоговые показатели в целом по народному хозяйству страны. При этом все последовательные этапы децентрализованной сводки производятся по единому плану, утвержденному Госкомстатом России.
Централизованная статистическая сводка - это способ организации сводки статистических данных, при котором все первичные данные, полученные в результате статистического наблюдения, сосредотачиваются в одной, как правило, центральной организации и подвергаются в ней обработке от начала до конца.
По технике выполнения статистическая сводка бывает механизированная (с использованием электронно-вычислительной техники) и ручная.
Рассмотрим последовательно этапы проведения сводки.
Предварительный контроль включает логическую проверку данных, т.е. смысловую согласованность сведений исключение нелогичных данных и арифметическую согласованность.
Пример: В документах на предприятии обнаружены арифметическая и логическая рассогласованность (табл.1):
Арифметическая - неправильно определена сумма заработной платы.
В 3-й строке имеется логическая ошибка: человек 25 лет не может иметь общего стажа 45 лет и, кроме того, непрерывный стаж, как часть общего, не может его превосходить.
2.Группировка
Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию в виде, доступном для восприятия.
Группировка - объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.
Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой.
Статистическая таблица – система строк и столбцов, в которых в определенной последовательности и связи излагается статистическая информация о социально-экономических явлениях.
Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа (табл. 2).
Группировочная таблица содержит три вида заголовков: общий, верхний и боковые.
Заголовки таблиц должны быть краткими и раскрывать содержание показателей.
Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком.
Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) - строк.
Подлежащее статистической таблицы - объект, характеризующийся цифрами.
Сказуемое - система показателей, которыми характеризуется объект изучения, т.е. подлежащее.
В зависимости от строения подлежащего все статистические таблицы можно разделить на три группы:
• простые или перечневые;
• групповые;
• комбинационные.
В подлежащем простой таблицы объект изучения не подразделяется на группы, а дается либо перечень всех единиц совокупности, либо указывается совокупность в целом. В первом случае таблица называется простой перечневой. Единицы упорядочиваются по одному-двум признакам (по возрастанию или убыванию значений). Сказуемое должно содержать данные по каждой единице совокупности.
В подлежащем групповой таблицы объект изучения подразделяется на группы по одному признаку. В сказуемом указываются число единиц в группах (абсолютное и в процентах к итогу) и сводные показатели по группам
В подлежащем комбинационной таблицы совокупность подразделяется на группы не по одному, а по нескольким признакам.
При построении таблиц необходимо руководствоваться следующими общими правилами.
Подлежащее таблицы располагается в левой части, сказуемое – в правой, но могут быть исключения. В простой таблице (см. табл. 3) подлежащее, т. е. объект изучения, указано в заголовке таблицы; в комбинационной таблице подлежащее может располагаться в левой и верхней частях таблицы (см. табл. 4).
В таблице не должно быть ни одной лишней линии, только необходимые: линия, отделяющая заголовок таблицы от заголовков ее граф, заголовки граф от цифровых данных. Иногда используется линия, отделяющая итоговую строку. Вертикальное разграфление может быть, а может и отсутствовать.
Заголовки граф содержат названия показателей (без сокращения слов), их единицы измерения. Последние могут указываться как в заголовке соответствующей графы, так и в заголовке таблицы или над таблицей
(см., например, табл. 4.4), если все показатели таблицы выражены в одних и тех же единицах измерения и счета.
Итоговая строка завершает таблицу и располагается в конце таблицы, но иногда бывает первой: в этом случае во второй строке дается запись «в том числе», и последующие строки содержат составляющие итоговой строки, но не все, а основные.
Цифровые данные записываются с одной и той же степенью точности в пределах каждой графы; при этом обязательно разряды чисел располагаются под разрядами; целая часть числа отделяется от дробной запятой, например, 4,5, а не 4.5. Заметим, что в международных статистических публикациях используется вместо запятой «точка»; цифры целой части числа в два раза больше дробной.
В таблице не должно быть ни одной пустой клетки: если данные равны нулю, ставится знак « — » (прочерк); если данные не известно, делается запись «сведений нет» или ставится знак («...» (троеточие)). Если значение показателя не равно нулю, но первая значащая цифра появляется после принятой степени точности, то делается запись 0,0 (если, скажем, была принята степень точности 0,1). Если таблица имеет много граф, то графы подлежащего обозначаются заглавными буквами («А», «Б»), а графы сказуемого — цифрами (1, 2 и т.д.). Это бывает удобно; если таблица имеет много строк и печатается на нескольких страницах, то заголовки граф не повторяются, а указываются только их обозначения.
Если таблица основана на заимствованных данных, то под таблицей указывается источник данных (см. например, табл. 3). Если хотите, чтобы построенная вами таблица была понятна и удобна для пользования, не пренебрегайте ни одним из указанных правил.
Таким образом, группировка - это разделение единиц совокупности на группы по выбранным варьирующим признакам.
Для решения этих задач применяют (соответственно) три вида группировок: типологические, структурные аналитические (факторные).
Типологические группировки предназначаются для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности.
Структурные группировки - это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации.
Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие, которые изменяются, и факторные, зависимость от которых исследуется.
По числу группировочных признаков различают простые (по одному признаку) и сложные (по нескольким признакам - комбинированные и многомерные).
Комбинированные группировки строятся путем разбивки каждой группы на подгруппы в соответствии с дополнительными признаками.
Многомерные - строятся с помощью специальных алгоритмов, когда осуществляется поиск скопления в N-мерном пространстве, где каждый объект - точка, т.е. построить многомерную группировку - найти скопление точек.
По используемой информации различают первичные и вторичные группировки.
Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.
Вторичные - результат объединения или расщепления первичной группировки.
Особым видом группировок является классификация, представляющая собой устойчивую номенклатуру классов и групп, образованных на основе сходства и различия единиц изучаемого объекта.
3.Выполнение группировки по количественному признаку
При составлении структурных группировок на основе варьирующих количественных признаков необходимо определить количество групп и интервалы группировки.
Интервал — количественное значение, отделяющее одну единицу (группу) от другой, т.е. он очерчивает количественные границы групп.
Как правило, величина интервала представляет собой разность между максимальным и минимальным значениями признака в каждой группе.
Вопрос о числе групп и величине интервала следует решать с учетом множества обстоятельств, прежде всего исходя из целей исследования, значения изучаемого признака и т.д.
Количество групп и величина интервала связаны между собой: чем больше образовано групп, тем меньше интервал, и наоборот. Количество групп зависит от числа единиц исследуемого объекта и степени колеблемости группировочного признака. При небольшом объеме совокупности нельзя образовывать большое число групп, так как группы будут малочисленными.
При определении количества групп необходимо стремиться к тому, чтобы были учтены особенности изучаемого явления. Поэтому количество групп должно быть оптимальным.
На количество выделяемых групп существенное влияние оказывает степень колеблемости группировочного признака: чем она больше, тем больше следует образовать групп.
Ориентировочно определить оптимальное количество групп с равными интервалами можно по формуле американского ученого Стерджесса:
n =1+3,322 LgN, где N — число единиц совокупности.
Получаем следующее соотношение:
N | 15 – 24 | 25 - 44 | 45 - 89 | 90 - 179 | 180 - 359 | 360 - 719 |
n | 5 | 6 | 7 | 8 | 9 | 10 |
Формула Стерджесса пригодна при условии, что распределение единиц совокупности по данному признаку приближается к нормальному, и при этом применяются равные интервалы в группах. Чтобы получить группы, адекватные действительности, необходимо руководствоваться сущностью изучаемого явления.
Интервалы могут быть равные и неравные. При исследовании экономических явлений могут применяться неравные (прогрессивно возрастающие, прогрессивно убывающие) интервалы. Так, например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы: до 100 человек, 100 - 200, 200 - 300, 300 - 500, 500 - 1000, 1000 и более человек. Это объясняется тем, что количественные изменения размера признака имеют неодинаковые значения в низших и высших по размеру признака группах: изменение количества работающих на 50 - 100 человек имеет существенное значение для мелких предприятий, а для крупных - не имеет.
Для группировок с равными интервалами величина интервала
i = ,
где xmax, xmin наибольшее и наименьшее значения признака, n - число групп.
Если, например, требуется произвести группировку с равными интервалами по данным об уровне месячной заработной платы рабочих, которая в 1995 г. колебалась в пределах от 600 до 750 тыс. руб., и необходимо при этом выделить 5 групп, то величина интервала, тыс. руб.:
i = (750 – 600)/5 = 30
Если в результате деления получится нецелое число и возникнет необходимость в округлении, то округлять нужно, как правило, в большую сторону, а не в меньшую. Прибавляя к минимальному значению признака (в данном случае 600 тыс. руб.) найденное значение интервала, получаем верхнюю границу первой группы, тыс. руб.:
600 + 30 = 630.
Прибавляя далее значение интервала к верхней границе первой группы, получаем верхнюю границу второй группы
630 + 30 = 660, и т. д.
В результате получим такие группы рабочих по размеру заработной платы, тыс. руб.:
600 - 630; 630 - 660; 660 - 690; 690 - 720; 720 - 750.
В этом распределении имеет место неопределенность: к какой группе, например, отнести рабочего с заработком в 630 тыс. руб., к первой или второй? Для устранения неопределенности открывают один из крайних интервалов или используют принцип единообразия - левое число включает в себя обозначенное значение, а правое - не включает. Значит рабочий, получающий 630 тыс. руб., должен быть отнесен ко второй группе. Аналогично нужно поступать в отношении всех остальных групп.
Интервалы групп могут быть закрытыми, когда указаны нижняя и верхняя границы (как в приведенном примере), и открытыми, когда указана лишь одна из границ (первый или последний интервалы, величина которых принимается равной величине смежных с ними интервалов). Во втором случае, чтобы показать, что рабочий с заработной платой, равной, например, верхней границе интервала, включается в последнюю группу, ее следует обозначить «750 и выше». И наоборот, чтобы показать, что значение, равное верхней границе интервала, не входит в данную группу, последнюю группу нужно обозначить «свыше 750». Подобные функции выполняют слова «до», «менее» и «более».
Иногда приходится пользоваться уже имеющимися группировками, которые не удовлетворяют требованиям анализа. Для приведения таких группировок к сопоставимому виду в целях их дальнейшего сравнительного анализа используется метод вторичной группировки, являющейся особым видом группировки.
Вторичная группировка - образование новых групп на основе ранее осуществленной группировки.
Получение новых групп на основе имеющихся возможно двумя способами перегруппировки: объединением первоначальных интервалов (путем их укрупнения) и долевой перегруппировкой (на основе закрепления за каждой группой определенной доли единиц совокупности).
4.Статистический ряд распределения
После определения группировочного признака и границ групп строится ряд распределения.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку.
Ряды распределения, построенные по качественным признакам, называются атрибутивными.
Ряды распределения, построенные по количественному признаку (в порядке возрастания или убывания наблюдаемых значений), называются вариационными.
Вариационные ряды распределения состоят из двух элементов: вариантов и частот.
Числовые значения количественного признака в вариационном ряду распределения называются вариантами. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты - положительные (прибыль) или отрицательные (убыток) числа.
Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т. е. это числа, показывающие как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяет число элементов всей совокупности.
Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%.
Накопленные частоты – сумма частоты данного интервала и всех частот интервалов, предшествующих данному.
Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные. Дискретные вариационные ряды основаны на дискретных (прерывных) признаках, имеющих только целые значения (например, тарифный разряд рабочих, число детей в семье); на дискретных признаках, представленных в виде интервалов; интервальные - на непрерывных признаках (принимающих любые значения, в том числе и дробные).
Первым шагом в упорядочении первичного ряда является его ранжирование, т.е. расположение всех вариантов в возрастающем (или убывающем) порядке.
Например, стаж работы (годы) 22 рабочих бригады характеризуется следующими данными: 2,4,5,5,6,6,5, 6,6,7,7,8,8,9,10,11,4,3,3,4,4,
Ранжированный ряд, построенный по этим данным:
2, 3, 3, 4, 4, 4, 4, 5, 5, 5, 5, 6, 6, 6, 6, 7, 7, 8, 8, 9, 10, 11.
При рассмотрении первичных данных можно видеть, что одинаковые варианты признака у отдельных единиц повторяются (здесь и далее f - частота повторения; n - объем изучаемой совокупности).
Способы построения дискретных и интервальных рядов различны.
Для построения дискретного ряда с небольшим числом вариантов выписываются все встречающиеся варианты значений признаках, а затем подсчитывается частота повторения варианта. Ряд распределения принято оформлять в виде таблицы, состоящей из двух колонок (или строк), в одной из которых представлены варианты, в другой - частоты. Построение дискретного вариационного ряда не составляет труда.
Для построения ряда распределения непрерывно изменяющихся признаков, либо дискретных, представленных в виде интервалов («от - до»), необходимо установить оптимальное число групп (интервалов), на которое следует разбить все единицы изучаемой совокупности. При группировке внутри однокачественной совокупности появляется возможность применения равных интервалов, число которых зависит от вариации признака в совокупности и от количества обследованных единиц.
Проиллюстрируем построение интервального вариационного ряда по данным приведенного ранее примера распределения рабочих по стажу работы.
Для нашего примера, согласно формуле Стерджесса, при N =22 число групп n = 5. Зная число групп, определим интервал по формуле:
I=(xmax – xmin)/ n =(11 – 2) / 5=1,8 2
В результате получим следующий ряд распределения рабочих по стажу работы ( =22):
X 2-4 4-6 6-8 8-10 10-12
F 3 8 6 3 2
Как видно из данного распределения, основная масса рабочих имеет стаж работы от 4 до 8 лет.
Ряды распределения удобно изучать с помощью графического метода.

- Статистические службы международных организаций
- Статистические таблицы
- Статистические таблицы
- Статистические таблицы
- Статистические таблицы и графики
- Статистические таблицы и графики
- Статистические таблицы и графики
- Статистические показатели рынка труда РФ
- Статистические показатели травматизма
- Статистические показатели, характеризующие уровень жизни населения. Занятость и безработица
- Статистические признаки и их классификация
- Статистические ряды
- Статистические ряды распределения, их значение и применение в статистике
- Статистические сведения о состояние преступности в России