результат группировки данных наблюдения статистического, представленный в виде последовательности пар: «значение признака – частота» или «значение признака – частость», или «значение признака – плотность распределения». Частота – абсолютное количество элементов совокупности, которые имели значение варьирующего признака на заданном уровне. Частость – относительное количество элементов совокупности, которые имели значение варьирующего признака на заданном уровне, оцененное в соотношении с общим количеством элементов совокупности. Построение Р.р. – разновидность группировки данных статистического наблюдения. Построение Р.р. – составная часть сводной обработки данных статистического наблюдения. Его цель состоит в выявлении осн. свойств и закономерностей исследуемой статистической совокупности. В зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным, различают соответственно два типа Р.р.: атрибутивные и вариационные. Атрибутивными называют Р.р., построенные по качественным признакам. Пример атрибутивных рядов – распределение нас. по полу, характеру труда, национальности, профессии и т.д. Вариационными называют Р.р., построенные по количественному признаку. Величины того или иного количественного признака у отдельных единиц совокупности более или менее различаются между собой. Такое различие величине признака носит название вариации.
Числовые значения признака, встречающиеся в данной совокупности, называют вариантами значений. Наличие различий в величине признака у отдельных единиц совокупности обусловлено влиянием большого числа факторов, формирующих уровень признака. Часто эти факторы могут оказывать разнонаправленное воздействие на уровень анализируемого показателя. Напр., снижение цен на строительные материалы может привести к уменьшению цен на 1 кв. м жилья, а увеличение спроса на жилье может повысить эту цену и т.д. В результате совместного влияния различных факторов и складывается цена 1 кв. м муниципального жилья в определенное время. Но есть, напр., и такой фактор, как экологическая обстановка в разных ронах города, которая также обусловливает вариацию цен 1 кв. м жилья в разных р-онах города. Поэтому при изучении вариации различных показателей можно выделить две группы факторов, формирующих уровень признака в исследуемой совокупности единиц и обусловливающих существование различий в величине признака у отдельных единиц. Первую группу составляют факторы, общие для всех единиц изучаемой совокупности. Во вторую группу входят факторы, свойственные конкретным единицам совокупности и определяющие их индивидуальные особенности.
Изучение характера и степени вариации признаков у отдельных единиц, составляющих изучаемую совокупность, – важнейший вопрос всякого статистического исследования. Управление процессом развития в желаемом направлении требует определения роли не только каждой из выше названных групп факторов в вариации тех или иных признаков, но и роли отдельных факторов соответствующих групп. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которой измеряется вариация. Собранные в процессе наблюдения данные без какой-либо их систематизации образуют т. н. первичный ряд данных. При наличии достаточно большого количества единиц в обследованной совокупности первичный ряд становится трудно обозримым и непосредственное рассмотрение его не дает представления о распределении единиц по величине признака в совокупности. Первый шаг в упорядочении первичного ряда – его ранжирование, т.е. расположение всех вариантов ряда в возрастающем (или убывающем) порядке. Ранжирование данных позволяет сразу установить наименьшее и наибольшее значения признака в совокупности, определить расстояние между крайними значениями признака, а также выделить наиболее часто повторяющиеся значения в обследуемой совокупности. Использование ранжированного ряда также позволяет легко распределить все данные по группам. Число повторений отдельных вариантов значений признаков называют частотой повторения. В дальнейшем частоту повторения значения признака будем обозначать как i f , сумму частот, равную объему изучаемой совокупности,
img width="215" height="44" src="/upload/content/1582184185_22.files/image187.jpg"
– число вариантов значений признака. По характеру вариации различают дискретные и непрерывные признаки. Дискретные признаки отличаются друг от друга на некоторую конечную величину, т.е. даны в виде прерывных чисел, напр.: тарифный разряд рабочих, число детей в семье, число комнат в квартире и т.д. Непрерывные признаки могут отличаться один от другого на сколь угодно малую величину и в определенных границах принимать любые значения, напр.: заработная плата рабочих, размер среднедушевого денежного дохода, стоимость осн. фондов пр-тия и т.д. Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все встречающиеся варианты значений признака, обозначаемые через i x , а затем подсчитать частоту повторения каждого варианта i f , (напр., распределение рабочих по разрядам, студентов по успеваемости и т.п.). Р.р. принято оформлять в виде табл.
img width="316" height="137" src="/upload/content/1582184185_22.files/image188.jpg"
Частости могут быть выражены в долях единицы или в процентах. Замена частот частостями позволяет сопоставлять вариационные ряды с различным числом наблюдений. В случаях, когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака, когда значения признака у отдельных единиц могут вообще не повторяться, строятся интервальные Р.р. Интервал указывает определенные пределы значений варьирующего признака и обозначается нижней и верхней границами интервала, т.е. нижняя граница интервала показывает то значение, с– значение, на котором эта группа заканчивается. которого начинается данная группа, а верхняя Такие распределения наиболее распространены в практике статистической работы.
При построении интервальных Р.р. необходимо прежде всего установить число групп (интервалов), на которые следует разбить все единицы изучаемой совокупности. При группировке внутри однородных совокупностей появляется возможность применения равных интервалов, величина которых зависит от вариации признака в совокупности и от количества обследованных единиц. В случае абсолютно однородной по варьирующему признаку совокупности, определение величины интервала h для построения вариационного ряда с равными интервалами производится: вычисляется разность между макс. и миним. значениями признака первичного ряда (определяется размах вариации): размах вариации делится на число групп k, т.е. h=R/k.
Число групп приближенно определяется по формуле Стэрджесса: k »1+ 3,322lg n , где п – общее число изучаемых единиц совокупности. Указанное выражение почти всегда оказывается дробной величиной, которую округляют до целого числа, поскольку количество групп не может быть дробным (как правило, лучше округлять в меньшую сторону). Величина интервала должна определяться в соответствии с точностью данных наблюдения: если исходные данные представлены целыми числами, то рассчитанная величина интервала округляется до ближайшего целого числа; если данные представлены с точностью до 0,1, то величина интервала округляется до целых с десятыми и т.д. (здесь округление производится в большую сторону). Знание величины интервала позволяет определить границы всех интервалов Р.р. Нижнюю границу первого интервала целесообразно принимать равной миним. значению. Имеются и предложения иного рода. Так, нижнюю границу первого интервала рекомендуют определять путем вычитания миним. значения признака половины величины интервала.
В каждый интервал включаются варианты, числовые значения которых больше или равны нижней границе и меньше или равны верхней границе, и затем подсчитывается число единиц в каждом интервале. При построении интервальных рядов для непрерывных признаков имеет место совпадение верхних границ предшествующих интервалов и нижних границ следующих за ними интервалов. Здесь должны даваться пояснения, в какой интервал относить единицы совокупности, числовые значения признака у которых совпадают с одной из этих границ. В интервальных Р.р. дискретных признаков отнесение единиц совокупности в ту или иную группу не вызывает затруднений, т.к. между верхней границей одного интервала и нижней границей смежного интервала существует разрыв. Иная ситуация возникает в Р.р. с непрерывным признаком. Значения признака у отдельных единиц могут совпадать с границами интервалов. В таких случаях для пояснения в первом интервале ставится знак «минус» или «плюс». Знак «минус» соответствует принципу «исключая» и означает, что величины признака, совпадающие с верхней границей интервала, в этот интервал не включаются, а попадают в следующий интервал. Если ставится знак «плюс», это соответствует принципу «включая» и означает, что величины признака, совпадающие с верхней границей интервала, включаются в этот интервал.
Для целей анализа и сравнительной характеристики различных Р.р. применяются обобщающие показатели вариационного ряда. Система таких показателей представлена тремя группами: 1) показатели центра распределения (центра группирования) позволяют сделать вывод о центральном или наиболее общем значении, найденном для совокупности данных; 2) показатели степени вариации показывают, как данные распределены вокруг средней; 3) показатели формы распределения иллюстрируют степень скошенности и уровень островершинности или плосковершинности распределения. Графическое изображение Р.р. облегчает их анализ и позволяет судить о форме распределения. Для графического изображения дискретного ряда строят полигон распределения, для чего на оси абсцисс отмечают точки, соответствующие величине вариантов значений признака, из них восстанавливаются перпендикуляры, длина которых соответствует частоте (частости) этих вариантов по принятому масштабу на оси ординат. Вершины перпендикуляров в последовательном порядке соединяются отрезками прямых. Для графического изображения интервальных вариационных рядов применяется гистограмма. Она строится так: на оси абсцисс откладываются равные отрезки, которые в принятом масштабе соответствуют величине интервалов вариационного ряда. На отрезках строят прямоугольники, площади которых пропорциональны частотам (или частостям) интервала. При построении гистограммы для вариационного ряда с неравными интервалами следует по оси ординат наносить показатели плотности интервалов (абсолютные или относительные). В этом случае высоты прямоугольников гистограммы будут соответствовать величине плотности распределения.
img width="308" height="130" src="/upload/content/1582184185_22.files/image189.jpg"
Эти показатели используют также для преобразования интервалов, что бывает необходимо при сравнительной оценке данных, собранных по различным совокупностям и поразному обработанных. При увеличении числа наблюдений из одной и той же совокупности увеличивается число групп интервального ряда, что соответственно приводит к уменьшению величины интервала. При этом ломаная линия имеет тенденцию превращения в плавную кривую, которую называют кривой распределения. Эта кривая характеризует в обобщенном виде вариацию признака и закономерности распределения частот внутри совокупности.
В ряде случаев для изображения вариационных рядов используется кумулятивная кривая (кумулята). Для ее построения надо рассчитать накопленные частоты или частости. Накопленные частоты показывают, сколько единиц совокупности имеют значения признака не больше, чем рассматриваемое значение, и определяются последовательным суммированием частот интервалов. При построении кумуляты интервального Р.р. нижней границе первого интервала соответствует частота, равная нулю, а верхней границе – вся частота данного интервала. Верхней границе второго интервала соответствует накопленная частота, равная сумме частот первых двух интервалов, и т.д. Изображение вариационного ряда в виде кумуляты особенно удобно при сравнении вариационных рядов, а также в экономических исследованиях, в частности, для анализа концентрации произ-ва.
РЯД РАСПРЕДЕЛЕНИЯ
РЯД РАСПРЕДЕЛЕНИЯ
Источник: Энциклопедия статистических терминов. т.1. Методологические основы статистики.