ОЦИФРОВКА КАЧЕСТВЕННЫХ ПРИЗНАКОВ

Найдено 1 определение

приписывание градациям признаков неких "разумных" в рамках решаемой задачи количественных значений, называемых метками. Как правило, оцифровка производится с целью дальнейшего использования статистич. методов, рассчитанных на количественные шкалы. Исходным в большинстве работ по оцифровке является предположение о существовании латентных количественных признаков, к-рые выражены через данные исследователю качественные признаки. Предполагается, что при этом имело место разбиение латентных признаков на интервалы и приписывание этим интервалам категориальных значений - градаций. Задачей оцифровки является реконструкция исходных латентных количественных признаков, а также нек-рых их характеристик: для задач измерения связей - корреляционных функций, измеряющих силу связи между этими количественными признаками (и, следовательно, опосредованно, между их проявлениями - качественными признаками); при автоматич. классификации - функций расстояния и т. д. Следует отметить, что при оцифровке подхода нельзя гарантировать, что исходный порядок градаций в случае ранговых признаков будет сохранен на соответствующих метках. Очевидно, что такая реконструкция невозможна без определенных предположений о природе подлежащих анализу данных, на основании к-рых и строится конкретный метод оцифровки. Эти предположения, напр., о виде распределения искомых латентных признаков, налагаются в связи с конкретной дачи, что вызывает появление методов оцифровки специально для задач отнесения объектов к одному из заранее заданных классов (дискриминантный анализ) и для задач анализа связей и т. п. Содержательной предпосылкой этого является предположение о том, что, напр., в случае решения задачи анализа дискриминантного (см.) именно в искомом латентном пространстве достижима самая "лучшая" кластеризация (объекты "хорошие" "разваливаются" на классы). А в случае анализа связей между признаками логично искать такое латентное пространство, где количественные признаки связаны между собой так тесно, как только возможно. Очевидно, что "успех" оцифровки возможен лишь при адекватности принятых допущений peaальным условиям. Напр., в случае задачи анализа связей логично оцифровывать группу признаков, имеющих общую природу и априори тесно связанных. Кроме того, очевидно, что латентные пространства, полученные при разных исходных предположениях (т. е. при решении различных задач, напр., анализа связей и дискриминантного анализа), в общем случае не совпадают. В настоящее время разрабатываются формальные критерии применимости оцифровки в задачах анализа связей. В большинстве методов оцифровки, базирующихся на предположении о существовании латентных количественных признаков, критерием их "наилучшей" реконструкции является оптимизация некоего функционала от значений этих признаков. В случае решения задачи анализа связей в роли такого функционала, в данном случае максимизируемого, выступает функция корреляции; при решении задачи дискриминантного анализа оптимизируется функция расстояния между центрами получаемых классов и т. д.
Оптимизационная оцифровка в задаче анализа связей сводится к каноническому анализу (см. Корреляция каноническая). Более того, доказано (т. н. теорема Ланкастера), что требование максимизации функции корреляции между латентными количественными переменными равносильно требованию двумерной нормальности из функции распределения. Т. обр., задачу оцифровки при анализе связей можно сформулировать следующим образом: поиск меток, обеспечивающих двумерное нормальное распределение искомых латентных переменных. "Огрублением" оптимизационных меим считаются т. н. методы поиска нормальных меток, основанные на отображении исходных качественных переменных в количественные со стандартным нормальным распределением (см. Закон распределения). Итак, для "успеха" как оптимизационных методов, так и методика нормальных меток в задаче анализа связей требуется существование латентных количественных переменных и наличие достаточно тесной, преимущественно линейной связи между ними (их нормальность). В социологич. исследованиях эти требования не всегда выполнимы. Это вызвало к жизни др. группу методов оцифровки, не базирующихся на предположении о существовании и нормальности латентных количественных переменных. Так, при оцифровке с помощью натурального ряда приписанный градациям различающий код (1,2, ...) считается их численным значением - меткой. Как ни груба указанная процедура, в ряде случаев (с малым числом градаций у признака) с помощью этого метода воссоздается картина связей, напоминающая оценки, полученные при применении нормальных меток. Другой метод оцифровки - т. н. частотная оцифровка. При реализации этого метода градациям номинального признака приписываются метки, равные частоте встречаемости этой градации в исследуемой совокупности, а рангового - накопленной частоте встречаемости градации. Метод основан на том, что коэффициенты корреляции (парной, частной, множественной) между частотно оцифрованными признаками являются характеристиками связи (парной, частной, множественной) между исходными качественными признаками. Близкими методами оцифровки являются методы метризации - введения расстояния (метрики) между градациями рассматриваемых признаков. Метризация часто позволяет не только найти расстояние, но и определить те числовые значения (метки), между к-рыми оно определено, хотя это для процедур метризации, вообще говоря, не обязательно. С т. зр. используемого математич. аппарата к методам оцифровки примыкают методы визуализации табличных данных - биплот и анализ корреспонденции, хотя целевая направленность последних шире направленности методов оцифровки. За последние 50 лет метод оцифровки (в различн. его модификациях) неоднократно открывался и переоткрывался и известен под различными названиями: дуальное шкалирование, метод взаимных усреднений, адаптивное (оптимальное) шкалирование, метод максимизации коэффициента корреляции, взвешивание по Гуттману, анализ главных компонент качественных данных, одновременная линейная регрессия. Лит.: Кендалл Дж., Стьюарт А. Статистические выводы и связи. М., 1973; Перекрест В.Т. Нелинейный типологический анализ. Л., 1983; Айвазян С.А., Мешал-кин Л.Д., Енюков И.С. Прикладная статистика. В 2-х ч. М., 1983-1985; Интерпретация и анализ данных в социологических исследованиях. М., 1987. Л.Г. Бадалян, Н.Г. Григорьева

Источник: Российская социологическая энциклопедия