раздел статистики математической (см.), посвященный математич. методам, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака (см.) и предназначенным для получения научн. и практич. выводов. Исходным массивом многомерных данных для проведения А.м.с. обычно служат рез-ты измерения рассматриваемых признаков (компонент многомерного признака) на каждом из объектов исследуемой совокупности, т. е. последовательность многомерных наблюдений. Значительная часть А.м.с. обслуживает ситуации, в к-рых исследуемый многомерный признак интерпретируется как многомерная случайная величина и соответственно последовательность многомерных наблюдений - как выборка из генеральной совокупности. В этом случае выбор методов обработки исходных статистич. данных и анализ их свойств производится на основе тех или иных допущений относительно природы многомерного (совместного) закона распределения вероятностей изучаемого многомерного признака (см. Распределение вероятностей, Закон распределения). По содержанию А.м.с. может быть условно разбит на три основных подраздела: А.м.с. многомерных распределений и их основных характеристик; А.м.с. характера и структуры взаимосвязей между компонентами исследуемого многомерного признака; А.м.с. геометрич. структуры исследуемой совокупности многомерных наблюдений. А.М.С. многомерных распределений и их основных характеристик охватывает ситуации, в к-рых обрабатываемые наблюдения имеют вероятностную природу, т. е. интерпретируются как выборка из соответствующей генеральной совокупности. К основным задачам этого подраздела относятся: оценивание статистическое (см.) исследуемых многомерных распределений, их основных числовых характеристик и параметров; исследование свойств используемых статистич. оценок; исследование распределений вероятностей для ряда статистик, с помощью к-рых строятся статистич. критерии проверки различных гипотез о вероятностной природе анализируемых многомерных данных (см. Проверка статистич. гипотез). А.м.с. характера и структуры взаимосвязей компонент исследуемого многомерного признака объединяет понятия и рез-ты, обслуживающие такие методы и модели, как множественная регрессия (см. Анализ регрессионный), анализ дисперсионный (см.), анализ ковариационный (см.), анализ факторный (см.), анализ корреляционный (см.), поиск взаимодействий (см.), анализ логлинейный (см.), анализ латентно-структурный (см.). Методы, принадлежащие к этой группе, включают как алгоритмы, основанные на предположениях о вероятностной природе данных, так и методы, не укладывающиеся в рамки к.-л. вероятностной модели. А.м.с. геометрич. структуры исследуемой совокупности многомерных наблюдений объединяет понятия и рез-ты таких моделей и схем, как анализ дискриминантный (см.), анализ кластерный (см. Методы классификации), шкалирование многомерное (см.). Узловым во всех этих схемах является понятие расстояния, либо меры близости (см.) между анализируемыми элементами. При этом анализируемыми могут быть как реальные объекты, для каждого из к-рых фиксируются значения рассматриваемых признаков (тогда геометрич. образом каждого исследуемого объекта будет точка в соответствующем признаковом пространстве (см. Признак)), так и сами признаки (тогда геометрич. образом каждого признака будет точка в соответствующем "объектном" пространстве). Прикладное назначение А.м.с. состоит в основном в обслуживании следующих трех проблем: проблемы статистич. исследования зависимостей между анализируемыми показателями; проблемы классификации элементов (объектов или признаков); проблемы снижения размерности исследуемого признакового пространства и отбора наиболее информативных признаков. Лит.: Андерсон Т. Введение в многомерный статистический анализ. М., 1963; Кендалл М.Дж., Стьюарт А. Многомерный статистический анализ и временные ряды. М., 1976; Статистические методы анализа социологической информации. М., 1979; Типология и классификация в социологических исследованиях. М., 1982; Интерпретация и анализ данных в социологических исследованиях. М., 1987. С.А. Айвазян
АНАЛИЗ МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ
АНАЛИЗ МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ
Источник: Российская социологическая энциклопедия
АНАЛИЗ СТАТИСТИЧЕСКИЙ МНОГОМЕРНЫЙ
раздел математической статистики, предназначенный для анализа связей между тремя и более переменными. Можно условно выделить три основных класса задач А. с. м. Это исследование структуры связей между переменными и снижение размерности пространства признаков, построение классификаций и типологий, исследование причинных связей.
Для представления структуры связей между переменными обычно используется матрица корреляций. Ее анализ, заключающийся 34 в выделении подмножеств переменных, тесно коррелирующих друг с другом, может осуществляться «вручную», например, с помощью графа, отражающего наиболее существенные связи между переменными, либо методами компьютерного анализа, такими как метод главных компонент, факторный анализ, кластерный анализ переменных. Анализ структуры связей часто рассматривается в качестве самостоятельной задачи, например, при исследовании структуры ценностных ориентаций, мотивов поведения и т. п., для проверки психометрических шкал на надежность и т. п. Однако он может использоваться и в качестве промежуточного этапа при решении задачи снижения размерности пространства признаков. Снижение размерности обычно применяется для построения пространства признаков, более удобного для решения задач классификации и исследования причинных связей, чем исходный набор переменных. Задача снижения размерности заключается в том, чтобы от большого количества исходных переменных перейти к нескольким обобщенным показателям. Построение таких обобщенных показателей называется шкалированием.
Метод главных компонент, факторный анализ, метод многомерного шкалирования предусматривают для этого разнообразные процедуры. Необходимо заметить, что шкалирование возможно не только в результате применения этих методов, но также на основе некоторых стандартных процедур (суммирования, усреднения и т. п.), применяемых к подмножеству переменных, выделенному любым другим способом либо разработанному специально. Задачи и методы классификации, в зависимости от условий, делятся на три группы: классификация по заданным формальным критериям, автоматическая классификация и классификация с обучением. Классификация по заданным критериям, строго говоря, не является статистическим методом. Она состоит в группировке объектов по одному или нескольким показателям. В последнем случае классификация называется перекрестной или лингвистической (например, половозрастная структура населения).
Автоматическую классификацию применяют в тех случаях, когда критерии группировки неизвестны и отсутствуют априорные представления о количестве и характере классов. Для ее построенияиспользуются методы кластерного анализа, позволяющие выделить группы объектов, близких друг к другу по значениям измеренных переменных. В основе кластерного анализа лежит вычисление расстояний между объектами. Классификация с обучением применяется, когда критерии классификации неизвестны, но известно количество классов и их типологические особенности. В этом случае может быть сформирована так называемая обучающая выборка, состоящая из реальных объектов, обладающих соответствующими характеристиками, или/и искусственных объектов – моделей «типичных представителей» классов. В обучающей выборке должны присутствовать «представители» всех предполагаемых классов. Классификация конкретного объекта состоит в том, что вычисляется расстояние между ним и объектами из обучающей выборки, и объект причисляется к тому классу, расстояние до которого для него оказалось минимальным. Классификация с обучением осуществляется некоторыми методами кластерного и дискриминантного анализа. Анализу статистических причинных связей в последние годы уделяется особое внимание. Классическим методом для решения таких задач является дисперсионный анализ, в основе которого лежит эксперимент факторный.
Начиная с 1960-х годов активно разрабатываются регрессионные и регрессионно-подобные причинные модели, а также техники, позволяющие использовать в этих моделях не только «количественные», но и «качественные» переменные. В настоящее время для исследования причинных связей, в зависимости от характера используемых переменных, применяются методы множественной линейной регрессии, логистической регрессии, дискриминантного анализа и т. п. Эти методы предполагают наличие единственной зависимой переменной и не позволяют исследовать структуру связей между независимыми переменными (предикторами). Структура связей между предикторами может быть учтена в моделях путевого анализа. Наиболее общим является метод линейных структурных уравнений, позволяющий строить сложные модели с большим числом взаимодействующих между собой зависимых и независимых переменных, среди которых могут быть не только наблюдаемые, но и латентные признаки. Регрессионный, дисперсионный, путевой и факторный анализ являются его частными случаями.
Лит.: Афифи А., Эйзен С. Статистический анализ: подход с применением ЭВМ. – М., 1982; Елисеева И. И., Рукавишников В. О. Логика прикладного статистического анализа. – М., 1982; Факторный, дискриминантный и кластерный анализ. – М., 1986; Интерпретация и анализ данных в социологических исследованиях. – М., 1987. О. В. Терещенко
Для представления структуры связей между переменными обычно используется матрица корреляций. Ее анализ, заключающийся 34 в выделении подмножеств переменных, тесно коррелирующих друг с другом, может осуществляться «вручную», например, с помощью графа, отражающего наиболее существенные связи между переменными, либо методами компьютерного анализа, такими как метод главных компонент, факторный анализ, кластерный анализ переменных. Анализ структуры связей часто рассматривается в качестве самостоятельной задачи, например, при исследовании структуры ценностных ориентаций, мотивов поведения и т. п., для проверки психометрических шкал на надежность и т. п. Однако он может использоваться и в качестве промежуточного этапа при решении задачи снижения размерности пространства признаков. Снижение размерности обычно применяется для построения пространства признаков, более удобного для решения задач классификации и исследования причинных связей, чем исходный набор переменных. Задача снижения размерности заключается в том, чтобы от большого количества исходных переменных перейти к нескольким обобщенным показателям. Построение таких обобщенных показателей называется шкалированием.
Метод главных компонент, факторный анализ, метод многомерного шкалирования предусматривают для этого разнообразные процедуры. Необходимо заметить, что шкалирование возможно не только в результате применения этих методов, но также на основе некоторых стандартных процедур (суммирования, усреднения и т. п.), применяемых к подмножеству переменных, выделенному любым другим способом либо разработанному специально. Задачи и методы классификации, в зависимости от условий, делятся на три группы: классификация по заданным формальным критериям, автоматическая классификация и классификация с обучением. Классификация по заданным критериям, строго говоря, не является статистическим методом. Она состоит в группировке объектов по одному или нескольким показателям. В последнем случае классификация называется перекрестной или лингвистической (например, половозрастная структура населения).
Автоматическую классификацию применяют в тех случаях, когда критерии группировки неизвестны и отсутствуют априорные представления о количестве и характере классов. Для ее построенияиспользуются методы кластерного анализа, позволяющие выделить группы объектов, близких друг к другу по значениям измеренных переменных. В основе кластерного анализа лежит вычисление расстояний между объектами. Классификация с обучением применяется, когда критерии классификации неизвестны, но известно количество классов и их типологические особенности. В этом случае может быть сформирована так называемая обучающая выборка, состоящая из реальных объектов, обладающих соответствующими характеристиками, или/и искусственных объектов – моделей «типичных представителей» классов. В обучающей выборке должны присутствовать «представители» всех предполагаемых классов. Классификация конкретного объекта состоит в том, что вычисляется расстояние между ним и объектами из обучающей выборки, и объект причисляется к тому классу, расстояние до которого для него оказалось минимальным. Классификация с обучением осуществляется некоторыми методами кластерного и дискриминантного анализа. Анализу статистических причинных связей в последние годы уделяется особое внимание. Классическим методом для решения таких задач является дисперсионный анализ, в основе которого лежит эксперимент факторный.
Начиная с 1960-х годов активно разрабатываются регрессионные и регрессионно-подобные причинные модели, а также техники, позволяющие использовать в этих моделях не только «количественные», но и «качественные» переменные. В настоящее время для исследования причинных связей, в зависимости от характера используемых переменных, применяются методы множественной линейной регрессии, логистической регрессии, дискриминантного анализа и т. п. Эти методы предполагают наличие единственной зависимой переменной и не позволяют исследовать структуру связей между независимыми переменными (предикторами). Структура связей между предикторами может быть учтена в моделях путевого анализа. Наиболее общим является метод линейных структурных уравнений, позволяющий строить сложные модели с большим числом взаимодействующих между собой зависимых и независимых переменных, среди которых могут быть не только наблюдаемые, но и латентные признаки. Регрессионный, дисперсионный, путевой и факторный анализ являются его частными случаями.
Лит.: Афифи А., Эйзен С. Статистический анализ: подход с применением ЭВМ. – М., 1982; Елисеева И. И., Рукавишников В. О. Логика прикладного статистического анализа. – М., 1982; Факторный, дискриминантный и кластерный анализ. – М., 1986; Интерпретация и анализ данных в социологических исследованиях. – М., 1987. О. В. Терещенко
Источник: Экономико-социологический словарь.