относительный показатель вариации, используется при сравнении колеблемости различных признаков в одной совокупности или же при сравнении колеблемости одного и того же признака в нескольких совокупностях с различной величиной среднего. Вычисляется как отношение квартильного отклонения к медиане:
img width="222" height="50" src="/upload/content/1582184185_22.files/image097.jpg"
Квартильное отклонение (Q) применяется для характеристики вариации признака в совокупности, если в качестве центра распределения используется медиана (Me). Квартильное отклонение (Q) можно применять вместо размаха вариации в случаях, когда определение среднего квадратического отклонения затруднительно или ограничено, а также для исключения недостатков, связанных с использованием крайних значений. Если Mе обозначает величину медианы, то в симметричном распределении:
img width="109" height="27" src="/upload/content/1582184185_22.files/image098.jpg"
Эта разность может быть принята за меру рассеяния. Но т.к. распределение никогда не бывает строго симметричным, то за меру рассеяния обычно принимают:
img width="87" height="45" src="/upload/content/1582184185_22.files/image099.jpg"
Величину Q называют квартильным отклонением, а точнее – полурасстоянием между квартилями, или половинным квартильным размахом. Квартильное отклонение не является мерой отклонения от какой-нибудь определенной средней, а характеризует общую величину рассеяния. Следует отметить, что величины 1 Q и 3 Q , а значит, и межквартильный размах, не зависят от наличия выбросов, поскольку при их вычислении не учитывается ни одна величина, которая была бы меньше 1 Q или больше 3 Q . Суммарные количественные характеристики, такие как медиана, первый и третий квартили, а также межквартильный размах, на которые не влияют выбросы, называются устойчивыми показателями. Межквартильный размах более пригоден для описательных целей, чем размах, но труднее вычисляется. Если две выборки имеют одинаковое Q, то намного вероятнее, что они имеют аналогичные структуры неоднородности, чем в случае двух групп с одинаковым размахом. В распределениях, которые примерно симметричны в окрестности среднего или медианы, Q можно использовать для корректировки границ, в которых находится 50% данных. Если распределение данных в окрестности медианы крайне несимметрично, то около 70% оценок может заключаться в пределах от Me-Q до Me+Q. Для симметричного и умерено скошенного распределений половинный квартильный размах обычно составляет около 1/3 квадратического отклонения. Из указанного соотношения следует, что размах вариации, равный 6-кратному квадратическому отклонению, соответствует 9-кратному половинному квартильному размаху. При симметричном или умеренно скошенном распределении ожидается в этих границах по крайней мере 99% всех наблюдений. Блочная диаграмма – удобное средство для изображения
img width="299" height="43" src="/upload/content/1582184185_22.files/image100.jpg"
img width="564" height="296" src="/upload/content/1582184185_22.files/image101.jpg"
Вертикальная линия, проведенная внутри прямоугольника, отмечает медиану. Левая сторона прямоугольника соответствует первому квартилю, 1 Q , а правая сторона – третьему квартилю, 3 Q . Т.о., прямоугольник содержит средние 50% элементов совокупности. Первые 25% данных изображаются в виде линии (т.н. ус), соединяющей левую сторону прямоугольника с наименьшим значением min X . Следовательно, последним 25% данных соответствует линия, соединяющая правую сторону прямоугольника с наибольшим значением, max X . Подробная блочная диаграмма содержит еще и метки выбросов. Выбросы определяются как те значения данных, которые расположены далеко от центра распределения. Амер. математик Дж.-У. Тьюки предложил рассматривать большое значение в наборе данных как выброс, если оно превышает верхний квартиль на 1,5*квартильное отклонение. Малое значение в наборе данных рассматривается как выброс, если оно меньше нижнего квартиля на 1,5*квартильное отклонение. Если данные распределены совершенно симметрично, среднее значение и медиана совпадают. Кроме того, длина левого уса равна длине правого, а линия медианы проходит через середину прямоугольника. Если распределение данных имеет отрицательную асимметрию, среднее значение смещается вдоль левого хвоста. Отрицательная асимметрия проявляется в виде высокой концентрации данных в правой половине шкалы, при этом 75% всех данных расположены между левой стороной прямоугольника (первый квартиль, 1 Q ) и концом правого уса (наибольшее значение, max X ). Следовательно, вдоль длинного левого уса распределены всего 25% данных. Это свидетельствует о сильной асимметрии распределения. Если распределение данных имеет положительную асимметрию, пик распределения смещается влево. Теперь 75% всех данных расположены между началом левого уса (наименьшее значение, min X ) и правой стороной прямоугольника (третий квартиль, 3 Q ). Остальные 25% данных распределены вдоль длинного правого уса. Изображение нескольких диаграмм на одном рисунке существенно облегчает анализ и сравнение данных.
КОЭФФИЦИЕНТ КВАРТИЛЬНОЙ ВАРИАЦИИ
КОЭФФИЦИЕНТ КВАРТИЛЬНОЙ ВАРИАЦИИ
Источник: Энциклопедия статистических терминов. т.1. Методологические основы статистики.