Войти
Портал государственных закупок
  • Ангельская нумерология и совпадения чисел на часах K 9 10 9 постоянная величина
  • Японская рыба фугу: блюда из рыбы, технология приготовления и причины отравления
  • Образец договор субаренды нежилого помещения
  • Нумерология имени: значение чисел
  • Необычные десерты из замороженных ягод
  • Знак зодиака дева числа месяца
  • Введение в многомерный статистический анализ. Анализ многомерный статистический. Основные понятия метода факторного анализа, суть решаемых им задач

    Введение в многомерный статистический анализ. Анализ многомерный статистический. Основные понятия метода факторного анализа, суть решаемых им задач

    Учебное пособие создано на основе опыта преподавания автором курсов многомерного статистического анализа и эконометрики. Содержит материалы по дискриминантному, факторному, регрессионному анализу, анализу соответствий и теории временных рядов. Изложены подходы к задачам многомерного шкалирования и некоторым другим задачам многомерной статистики.

    Группировка и цензурирование.
    Задача формирования групп выборочных данных таким образом, чтобы сгруппированные данные могли предоставить практически тот же объем информации для принятия решения, что и выборка до группировки, решается исследователем в первую очередь. Целями группировки, как правило, служат снижение объемов информации, упрощение вычислений и придание наглядности данным. Некоторые статистические критерии изначально ориентированы на работу со сгруппированной выборкой. В определенных аспектах задача группировки очень близка задаче классификации, о которой подробнее речь пойдет ниже. Одновременно с задачей группировки исследователь решает и задачу цензурирования выборки, т.е. исключения из нее резко выпадающих данных, как правило, являющихся следствием грубых ошибок наблюдений. Естественно, желательно обеспечить отсутствие таких ошибок еще в процессе самих наблюдений, по сделать это удается не всегда. Простейшие методы решения упомянутых двух задач рассмотрены в этой главе.

    Оглавление
    1 Предварительные сведения
    1.1 Анализ и алгебра
    1.2 Теория вероятностей
    1.3 Математическая статистика
    2 Многомерные распределения
    2.1 Случайные векторы
    2.2 Независимость
    2.3 Числовые характеристики
    2.4 Нормальное распределение в многомерном случае
    2.5 Корреляционная теория
    3 Группировка и цензурирование
    3.1 Одномерная группировка
    3.2 Одномерное цензурирование
    3.3 Таблицы сопряженности
    3.3.1 Гипотеза независимости
    3.3.2 Гипотеза однородности
    3.3.3 Поле корреляции
    3.4 Многомерная группировка
    3.5 Многомерное цензурирование
    4 Нечисловые данные
    4.1 Вводные замечания
    4.2 Шкалы сравнений
    4.3 Экспертные оценки
    4.4 Группы экспертов
    5 Доверительные множества
    5.1 Доверительные интервалы
    5.2 Доверительные множества
    5.2.1 Многомерный параметр
    5.2.2 Многомерная выборка
    5.3 Толерантные множества
    5.4 Малая выборка
    6 Регрессионный анализ
    6.1 Постановка задачи
    6.2 Поиск ОМНК
    6.3 Ограничения
    6.4 Матрица плана
    6.5 Статистический прогноз
    7 Дисперсионный анализ
    7.1 Вводные замечания
    7.1.1 Нормальность
    7.1.2 Однородность дисперсий
    7.2 Один фактор
    7.3 Два фактора
    7.4 Общий случай
    8 Снижение размерности
    8.1 Зачем нужна классификация
    8.2 Модель и примеры
    8.2.1 Метод главных компонент
    8.2.2 Экстремальная группировка признаков
    8.2.3 Многомерное шкалирование
    8.2.4 Отбор показателей для дискриминантного анализа
    8.2.5 Отбор показателей в модели регрессии
    9 Дискриминантный анализ
    9.1 Применимость модели
    9.2 Линейное прогностическое правило
    9.3 Практические рекомендации
    9.4 Один пример
    9.5 Более двух классов
    9.6 Проверка качества дискриминации
    10 Эвристические методы
    10.1 Экстремальная группировка
    10.1.1 Критерий квадратов
    10.1.2 Критерий модулей
    10 2 Метод плеяд
    11 Метод главных компонент
    11 1 Постановка задачи
    112 Вычисление главных компонент
    11.3 Пример
    114 Свойства главных компонент
    11.4.1 Самовоспроизводимость
    11.4.2 Геометрические свойства
    12 Факторный анализ
    12.1 Постановка задачи
    12.1.1 Связь с главными компонентами
    12.1.2 Однозначность решения
    12.2 Математическая модель
    12.2.1 Условия на Аt А
    12.2.2 Условия на матрицу нагрузок. Центроидный метод
    12.3 Латентные факторы
    12.3.1 Метод Бартлетта
    12.3.2 Метод Томсона
    12.4 Пример
    13 Оцифровка
    13.1 Анализ соответствий
    13.1.1 Расстояние хи-квадрат
    13.1.2 Оцифровка для задач дискриминантного анализа
    13.2 Более двух переменных
    13.2.1 Использование бинарной матрицы данных в качестве матрицы соответствий
    13.2.2 Максимальные корреляции
    13.3 Размерность
    13.4 Пример
    13.5 Случай смешанных данных
    14 Многомерное шкалирование
    14.1 Вводные замечания
    14.2 Модель Торгерсона
    14.2.1 Стресс-критерий
    14.3 Алгоритм Торгерсона
    14.4 Индивидуальные различия
    15 Временные ряды
    15.1 Общие положения
    15.2 Критерии случайности
    15.2.1 Пики и ямы
    15.2.2 Распределение длины фазы
    15.2.3 Критерии, основанные на ранговой корреляции
    15.2.4 Коррелограмма
    15.3 Тренд и сезонность
    15.3.1 Полиномиальные тренды
    15.3.2 Выбор степени тренда
    15.3.3 Сглаживание
    15.3.4 Оценка сезонных колебаний
    А Нормальное распределение
    В Распределение X2
    С Распределение Стьюдента
    D Распределение Фишера.


    Бесплатно скачать электронную книгу в удобном формате, смотреть и читать:
    Скачать книгу Многомерный статистический анализ, Дронов С.В., 2003 - fileskachat.com, быстрое и бесплатное скачивание.

    Скачать pdf
    Ниже можно купить эту книгу по лучшей цене со скидкой с доставкой по всей России.

    Социальные и экономические объекты, как правило, характеризуются достаточно большим числом параметров, образующих многомерные векторы, и особое значение в экономических и социальных исследованиях приобретают задачи изучения взаимосвязей между компонентами этих векторов, причем эти взаимосвязи необходимо выявлять на основании ограниченного числа многомерных наблюдений.

    Многомерным статистическим анализом называется раздел математической статистики, изучающий методы сбора и обработки многомерных статистических данных, их систематизации и обработки с целью выявления характера и структуры взаимосвязей между компонентами исследуемого многомерного признака, получения практических выводов.

    Отметим, что способы сбора данных могут различаться. Так, если исследуется мировая экономика, то естественно взять в качестве объектов, на которых наблюдаются значения вектора X, страны, если же изучается национальная экономическая система, то естественно наблюдать значения вектора X на одной и той же (интересующей исследователя) стране в различные моменты времени.

    Такие статистические методы, как множественный корреляционный и регрессионный анализ, традиционно изучаются в курсах теории вероятностей и математической статистики , рассмотрению прикладных аспектов регрессионного анализа посвящена дисциплина «Эконометрика» .

    Другим методам исследования многомерных генеральных совокупностей на основании статистических данных посвящено данное пособие.

    Методы снижения размерности многомерного пространства позволяют без существенной потери информации перейти от первоначальной системы большого числа наблюдаемых взаимосвязанных факторов к системе существенно меньшего числа скрытых (ненаблюдаемых) факторов, определяющих вариацию первоначальных признаков. В первой главе описываются методы компонентного и факторного анализа, с использованием которых можно выявлять объективно существующие, но непосредственно не наблюдаемые закономерности при помощи главных компонент или факторов.

    Методы многомерной классификации предназначены для разделения совокупностей объектов (характеризующиеся большим числом признаков) на классы, в каждый из которых должны входить объекты, в определенном смысле однородные или близкие. Такую классификацию на основании статистических данных о значениях признаков на объектах можно провести методами кластерного и дискриминантного анализа, рассматриваемыми во второй главе (Многомерный статистический анализ с использованием “STATISTICA”).

    Развитие вычислительной техники и программного обеспечения способствует широкому внедрению методов многомерного статистического анализа в практику. Пакеты прикладных программ с удобным пользовательским интерфейсом, такие как SPSS, Statistica, SAS и др., снимают трудности в применении указанных методов, заключающиеся в сложности математического аппарата, опирающегося на линейную алгебру, теорию вероятностей и математическую статистику, и громоздкости вычислений.

    Однако применение программ без понимания математической сущности используемых алгоритмов способствует развитию у исследователя иллюзии простоты применения многомерных статистических методов, что может привести к неверным или необоснованным результатам. Значимые практические результаты могут быть получены только на основе профессиональных знаний в предметной области, подкрепленных владением математическими методами и пакетами прикладных программ, в которых эти методы реализованы.

    Поэтому для каждого из рассматриваемых в данной книге методов приводятся основные теоретические сведения, в том числе алгоритмы; обсуждается реализация этих методов и алгоритмов в пакетах прикладных программ. Рассматриваемые методы иллюстрируются примерами их практического применения в экономике с использованием пакета SPSS.

    Пособие написано на основе опыта чтения курса «Многомерные статистические методы» студентам Государственного университета управления. Для более подробного изучения методов прикладного многомерного статистического анализа рекомендуются книги .

    Предполагается, что читатель хорошо знаком с курсами линейной алгебры (например, в объеме учебника и приложения к учебнику ), теории вероятностей и математической статистики (например, в объеме учебника ).

    МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ АНАЛИЗ

    Раздел математич. статистики, посвященный математич. методам построения оптимальных планов сбора, систематизации и обработки многомерных статистич. данных, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака и предназначенным для получения научных и практич. выводов. Под многомерным признаком понимается р-мерный показателей (признаков, переменных) среди к-рых могут быть: количественные, т. е. скалярно измеряющие в определенной шкале проявления изучаемого свойства объекта, п о-рядковые (или ординальные), т. е. позволяющие упорядочивать анализируемые объекты по степени проявления в них изучаемого свойства; и классификационные (или номинальные), т. е. позволяющие разбивать исследуемую совокупность объектов на не поддающиеся упорядочиванию однородные (по анализируемому свойству) классы. Результаты измерения этих показателей

    на каждом из побъектов исследуемой совокупности образуют многомерных наблюдений, или исходный массив многомерных данных для проведения М. с. а. Значительная часть М. с. а. обслуживает ситуации, в к-рых исследуемый многомерный признак интерпретируется как многомерная и соответственно последовательность многомерных наблюдений (1) - как из генеральной совокупности. В этом случае выбор методов обработки исходных статистич. данных и анализ их свойств производится на основе тех или иных допущений относительно природы многомерного (совместного) закона распределения вероятностей

    Многомерный статистический анализ многомерных распределений и их основных характеристик охватывает лишь ситуации, в к-рых обрабатываемые наблюдения (1) имеют вероятностную природу, т. е. интерпретируются как выборка из соответствующей генеральной совокупности. К основным задачам этого подраздела относятся: статистич. оценивание исследуемых многомерных распределений, их основных числовых характеристик и параметров; исследование свойств используемых статистич. оценок; исследование распределений вероятностей для ряда статистик, с помощью к-рых строятся статистич. критерии проверки различных гипотез о вероятностной природе анализируемых многомерных данных. Основные результаты относятся к частному случаю, когда исследуемый признак подчинен многомерному нормальному закону распределения функция плотности к-рого задается соотношением

    где - вектор математич. ожиданий компонент случайной величины , т. е.- ковариационная матрица случайного вектора , т. е.- ковариации компонент вектора (рассматривается невырожденный случай, когда ; в противном случае, т. е. при ранге , все результаты остаются справедливыми, но применительно к подпространству меньшей размерности , в к-рой оказывается сосредоточенным исследуемого случайного вектора ).

    Так, если (1) - последовательность независимых наблюдений, образующих случайную выборку из то оценками максимального правдоподобия для параметров и , участвующих в (2), являются соответственно статистики (см. , )

    причем случайный вектор подчиняется р-мерному нормальному закону и не зависит от , а совместное распределение элементов матрицы описывается т. н. распределением Уиша р-т а (см. ), к-рого

    В рамках этой же схемы исследованы распределения и моменты таких выборочных характеристик многомерной случайной величины, как коэффициенты парной, частной и множественной корреляции, обобщенная (т. е. ), обобщенная -статистике Хотеллинга (см. ). В частности (см. ), если определить в качестве выборочной ковариационной матрицы подправленную "на несмещенность" оценку , а именно:

    то случайной величины стремится к при , а случайные величины

    подчиняются F-распределениям с числами степеней свободы соответственно (р, п-р) и (р, п 1 +п 2 -р-1). В соотношении (7) п 1 и n 2 - объемы двух независимых выборок вида (1), извлеченных из одной и той же генеральной совокупности - оценки вида (3) и (4)-(5), построенные по i-й выборке, а

    Общая выборочная ковариационная , построенная по оценкам и

    Многомерный статистический анализ характера и структуры взаимосвязей компонент исследуемого многомерного признака объединяет в себе понятия и результаты, обслуживающие такие методы и модели М. с. а., как множественная , многомерный дисперсионный анализ и ковариационный анализ, факторный анализ и метод главных компонент, анализ канонич. корреляций. Результаты, составляющие содержание этого подраздела, могут быть условно разделены на два основных типа.

    1) Построение наилучших (в определенном смысле) статистич. оценок для параметров упомянутых моделей и анализ их свойств (точности, а в вероятностной постановке - законов их распределения, доверительных: областей и т. д.). Так, пусть исследуемый многомерный признак интерпретируется как векторная случайная , подчиненная р-мерному нормальному распределению , и расчленен на два подвектора--столбца и размерности qи р-qсоответственно. Это определяет и соответствующее расчленение вектора математич. ожиданий , теоретической и выборочной ковариационных матриц , а именно:

    Тогда (см. , ) подвектора (при условии, что второй подвектор принял фиксированное значение ) будет также нормальным ). При этом оценками максимального правдоподобия. для матриц регрессионных коэффициентов и ковариацин этой классической многомерной модели множественной регрессии

    будут взаимно независимые статистики соответственно

    здесь распределение оценки подчинено нормальному закону , а оценки п - закону Уишарта с параметрами и (элементы ковариационной матрицы выражаются в терминах элементов матрицы ).

    Основные результаты по построению оценок параметров и исследованию их свойств в моделях факторного" анализа, главных компонент и канонич. корреляций относятся к анализу вероятностно-статистич. свойств собственных (характеристических) значений и векторов различных выборочных ковариационных матриц.

    В схемах, не укладывающихся в рамки классич. нормальной модели и тем более в рамки какой-либо вероятностной модели, основные результаты относятся к построению алгоритмов (и исследованию их свойств) вычисления оценок параметров, наилучших с точки зрения нек-poro экзогенно заданного функционала качества (пли адекватности) модели.

    2) Построение статистич. критериев для проверки различных гипотез о структуре исследуемых взаимосвязей. В рамках многомерной нормальной модели (последовательности наблюдений вида (1) интерпретируются как случайные выборки из соответствующих многомерных нормальных генеральных совокупностей) построены, напр., статистич. критерии для проверки следующих гипотез.

    I. Гипотезы о равенстве вектора математич. ожиданий исследуемых показателей заданному конкретному вектору ; проверяется с помощью -статистики Хотеллинга с подстановкой в формулу (6)

    II. Гипотезы о равенстве векторов математич. ожиданий в двух генеральных совокупностях (с одинаковыми, но неизвестными ковариационными матрицами), представленных двумя выборками; проверяется с помощью статистики (см. ).

    III. Гипотезы о равенстве векторов математич. ожиданий в нескольких генеральных совокупностях (с одинаковыми, но неизвестными ковариационными матрицами), представленных своими выборками; проверяется с помощью статистики

    в к-рой есть i-е р-мерное наблюдение в выборке объема , представляющей j-ю генеральную совокупность, а и - оценки вида (3), построенные соответственно отдельно по каждой из выборок и по объединенной выборке объема

    IV. Гипотезы об эквивалентности нескольких нормальных генеральных совокупностей, представленных своими выборками проверяется с помощью статистики

    в к-рой - оценка вида (4), построенная отдельно по наблюдениям j- йвыборки, j=1, 2, ... , k.

    V. Гипотезы о взаимной независимости подвекторов-столбцов размерностей соответственно на к-рые расчленен исходный р-мерный вектор исследуемых показателей проверяется с помощью статистики

    в к-рой и - выборочные ковариационные матрицы вида (4) для всего вектора и для его подвектора x (i) соответственно.

    Многомерный статистический анализ геометрической структуры исследуемой совокупности многомерных наблюдений объединяет в себе понятия и результаты таких моделей и схем, как дискриминантный анализ, смеси вероятностных распределений, кластер-анализ и таксономия, многомерное шкалирование. Узловым во всех этих схемах является понятие расстояния (меры близости, меры сходства) между анализируемыми элементами. При этом анализируемыми могут быть как реальные объекты, на каждом из к-рых фиксируются значения показателей ,- тогда геометрич. образом i-го обследованного объекта будет точка в соответствующем р-мерном пространстве, так и сами показатели - тогда геометрич. образом l-го показателя будет точка в соответствующем n-мерном пространстве.

    Методы и результаты дискриминантного анализа (см. , , ) направлены на следующей задачи. Известно о существовании определенного числа генеральных совокупностей и у исследователя имеется по одной выборке из каждой совокупности ("обучающие выборки"). Требуется построить основанное на имеющихся обучающих выборках наилучшее в определенном смысле классифицирующее правило, позволяющее приписать нек-рый новый элемент (наблюдение ) к своей генеральной совокупности в ситуации, когда исследователю заранее не известно, к какой из совокупностей этот элемент принадлежит. Обычно под классифицирующим правилом понимается последовательность действий: по вычислению скалярной функции от исследуемых показателей, по значениям к-рой принимается решение об отнесении элемента к одному из классов (построение дискриминантной функции); по упорядочению самих показателей по степени их информативности с точки зрения правильного отнесения элементов к классам; по вычислению соответствующих вероятностей ошибочной классификации.

    Задача анализа смесей распределений вероятностей (см. ) чаще всего (но не всегда) возникает также в связи с исследованием "геометрической структуры" рассматриваемой совокупности. При этом понятие r-го однородного класса формализуется с помощью генеральной совокупности, описываемой нек-рым (как правило, унимодальным) законом распределения так что распределение общей генеральной совокупности, из к-рой извлечена выборка (1), описывается смесью распределений вида где p r - априорная вероятность (удельный элементов) r-го класса в общей генеральной совокупности. Задача состоит в "хорошем" статистич. оценивании (по выборке ) неизвестных параметров а иногда и к. Это, в частности, позволяет свести задачу классификации элементов к схеме дискриминантного анализа, хотя в данном случае отсутствовали обучающие выборки.

    Методы и результаты кластер-анализа (классификации, таксономии, распознавании образов "без учителя", см. , , ) направлены на решение следующей задачи. Геометрич. анализируемой совокупности элементов задана либо координатами соответствующих точек (т. е. матрицей ... , п), либо набором геометрич. характеристик их взаимного расположения, напр, матрицей попарных расстояний . Требуется разбить исследуемую совокупность элементов на сравнительно небольшое (заранее известное или нет) классов так, чтобы элементы одного класса находились на небольшом расстоянии друг от друга, в то время как разные классы были бы по возможности достаточно взаимоудалены один от другого и не разбивались бы на столь же удаленные друг от друга части.

    Задача многомерного шкалирования (см. ) относится к ситуации, когда исследуемая совокупность элементов задана с помощью матрицы попарных расстояний и заключается в приписывании каждому из элементов заданного числа (р)координат таким образом, чтобы структура попарных взаимных расстояний между элементами, измеренных с помощью этих вспомогательных координат, в среднем наименее отличались бы от заданной. Следует заметить, что основные результаты и методы кластер-анализа и многомерного шкалирования развиваются обычно без каких-либо допущении о вероятностной природе исходных данных.

    Прикладное назначение многомерного статистического анализа состоит в основном в обслуживании следующих трех проблем.

    Проблема статистического исследования зависимостей между анализируемыми показателями. Предполагая, что исследуемый набор статистически регистрируемых показателей xразбит, исходя из содержательного смысла этих показателей и окончательных целей исследования, на q-мернын подвектор предсказываемых (зависимых) переменных и (р-q)-мерный подвектор предсказывающих (независимых) переменных, можно сказать, что проблема состоит в определении на основании выборки (1) такой q-мерной векторной функции из класса допустимых решений F, к-рая давала бы наилучшую, в определенном смысле, аппроксимацию поведения подвектора показателей . В зависимости от конкретного вида функционала качества аппроксимации и природы,анализируемых показателей приходят к тем или иным схемам множественной регрессии, дисперсионного, ковариационного или конфлюентного анализа.

    Проблема классификации элементов (объектов или показателей) в общей (нестрогой) постановке заключается в том, чтобы всю анализируемую совокупность элементов, статистически представленную в виде матрицы или матрицы разбить на сравнительно небольшое число однородных, в определенном смысле, групп . В зависимости от природы априорной информации и конкретного вида функционала, задающего критерий качества классификации, приходят к тем или иным схемам дискриминантного анализа, кластер-анализа (таксономии, распознавания образов "без учителя"), расщепления смесей распределений.

    Проблема снижения размерности исследуемого факторного пространства и отбора наиболее информативных показателей заключается в определении такого набора сравнительно небольшого числа показателен найденного в классе допустимых преобразований исходных показателей на к-ром достигается верхняя нек-рой экзогенно заданной меры информативности m-мерной системы признаков (см. ). Конкретизация функционала, задающего меру автоинформативности (т. е. нацеленное на максимальное сохранение информации, содержащейся в статистич. массиве (1) относительно самих исходных признаков), приводит, в частности, к различным схемам факторного анализа и главных компонент, к методам экстремальной группировки признаков. Функционалы, задающие меру внешней информативности, т. е. нацеленные на извлечение из (1) максимальной информации относительно нек-рых других, не содержащихся непосредственно в ж, показателен или явлений, приводят к различным методам отбора наиболее информативных показателей в схемах статистич. исследования зависимостей и дискриминантного анализа.

    Основной математический инструментарий М. с. а. составляют специальные методы теории систем линейных уравнений и теории матриц (методы решения простой и обобщенной задачи о собственных значениях и векторах; простое обращение и псевдообращение матриц; процедуры диагонализации матриц и т. д.) и нек-рые оптимизационные алгоритмы (методы покоординатного спуска, сопряженных градиентов, ветвей и границ, различные версии случайного поиска и стохастич. аппроксимации и т. д.).

    Лит. : Андерсон Т., Введение в многомерный статистический анализ, пер. с англ., М., 1963; Кендалл М. Дж.., Стьюарт А., Многомерный статистический анализ и временные ряды, пер. с англ., М., 1976; Большев Л. Н., "Bull. Int. Stat. Inst.", 1969, № 43, p. 425-41; Wishаrt .J., "Biometrika", 1928, v. 20A, p. 32-52: Hotelling H., "Ann. Math. Stat.", 1931, v. 2, p. 360-78; [в] Кruskal J. В., "Psychometrika", 1964, v. 29, p. 1-27; Айвазян С. А., Бежаева 3. И., . Староверов О. В., Классификация многомерных наблюдений, М., 1974.

    С. А. Айвазян.


    Математическая энциклопедия. - М.: Советская энциклопедия . И. М. Виноградов . 1977-1985 .

    Справочник технического переводчика

    Раздел статистики математической (см.), посвященный математич. методам, направленным на выявление характера и структуры взаимосвязей между компонентами исследуемого многомерного признака (см.) и предназначенным для получения научн. и практич.… …

    В широком смысле раздел математической статистики (См. Математическая статистика), объединяющий методы изучения статистических данных, относящихся к объектам, которые характеризуются несколькими качественными или количественными… … Большая советская энциклопедия

    АНАЛИЗ МНОГОМЕРНЫЙ СТАТИСТИЧЕСКИЙ - раздел математической статистики, предназначенный для анализа связей между тремя и более переменными. Можно условно выделить три основных класса задач А.М.С. Это исследование структуры связей между переменными и снижение размерности пространства … Социология: Энциклопедия

    АНАЛИЗ КОВАРИАЦИОННЫЙ - – сово­купность методов математич. статистики, отно­сящихся к анализу моделей зависимости среднего значения нек рой случайной величины Y от набора неколичественных факторов F и одновременно от набора количественных факторов X. По отношению к Y… … Российская социологическая энциклопедия

    Раздел математич. статистики, содержанием к рого является разработка и исследование статистич. методов решения следующей задачи различения (дискриминации): основываясь на результатах наблюдений, определить, какой из нескольких возможных… … Математическая энциклопедия, Орлова Ирина Владленовна, Концевая Наталья Валерьевна, Турундаевский Виктор Борисович. Книга посвящена многомерному статистическому анализу (МСА) и организации вычислений по МСА. Для реализации методов многомерной статистики используется программаобработки статистической…


    Внедрение ПЭВМ в управление народным хозяйством предполагает переход от традиционных методов анализа деятельности предприятий в более совершенных моделей управления экономикой, которые позволяют раскрыть ее глубинные процессы.

    Широкое использование в экономических исследованиях методов математической статистики дает возможность углубить экономический анализ, повысить качество информации в планировании и прогнозировании показателей производства и анализа его эффективности.

    Сложность и разнообразие связей экономических показателей обусловливают многомерность признаков и в связи с этим требуют применения наиболее сложного математического аппарата - методов многомерного статистического анализа.

    Понятие "многомерный статистический анализ" подразумевает объединение ряда методов, призванных исследовать сочетание взаимосвязанных признаков. Речь идет о расчленении (разбиение) рассматриваемой совокупности, которая представлена многомерными признаками на относительно небольшую их количество.

    При этом переход от большого количества признаков к меньшей преследует цель снижения их размерности и повышения информативной емкости. Такая цель достигается путем выявления информации, повторяется, порождаемой взаимосвязанными признаками, установлением возможности агрегирования (объединения, суммирование) по некоторым признакам. Последнее предполагает превращение фактической модели в модель с меньшим количеством факторных признаков.

    Метод многомерного статистического анализа позволяет выявлять объективно существующие, но явно не выражены закономерности, которые проявляются в тех или иных социально - экономических явлениях. С этим приходится сталкиваться при решении ряда практических задач в области экономики. В частности, сказанное имеет место, если необходимо накапливать (фиксировать) одновременно значения нескольких количественных характеристик (признаков) по изучаемому объекту наблюдения, когда каждая характеристика склонна к неконтролируемой вариации (в разрезе объектов), несмотря на однородность объектов наблюдения.

    Например, исследуя однородные (по природно-экономическими условиями и типом специализации) предприятия по ряду показателей эффективности производства, убеждаемся, что при переходе от одного объекта к другому почти каждый из отобранных характеристик (идентичных) имеет неодинаковое числовое значение, то есть находит так сказать неконтролируемый (случайный) разброс. Такое "случайное" варьирования признаков, как правило, подчиняется некоторым (закономерным) тенденциям как в плане достаточно определенных размеров признаков, вокруг которых осуществляется вариация, так и в плане степени и взаимозависимости самого варьирования.

    Сказанное выше приводит к определению многомерной случайной величины как набора количественных признаков, значение каждой из которых подвергается неконтролируемом разброса при повторениях данного процесса, статистического наблюдения, опыта, эксперимента и др.

    Ранее было сказано, что многомерный анализ объединяет ряд методов; назовем их: факторный анализ, метод главных компонент, кластерный анализ, распознавание образов, дискриминантный анализ и и др. Первые три из названных методов рассматриваться в следующих параграфах.

    Как и другие математико - статистические методы, многомерный анализ может быть эффективным в своем применении при условии высокого качества исходной информации и массовости данных наблюдений, обрабатываются с помощью ПЭВМ.

    Основные понятия метода факторного анализа, суть решаемых им задач

    При анализе (в равной степени и исследованы) социально - экономических явлений приходится часто встречаться со случаями, когда среди разнообразия (багатопараметричности) объектов наблюдения необходимо исключать долю параметров, или заменить их меньшим количеством тех или других функций, не причинив вреда целостности (полноте) информации. Решение такой задачи имеет смысл в рамках определенной модели и обусловлено ее структурой. Примером такой модели, которая наиболее подходит ко многим реальным ситуациям, является модель факторного анализа, методы которого позволяют сконцентрировать признаки (информацию о них) путем "конденсации" большого числа в меньше, информационное более емкое. При этом полученный "конденсат" информации должен быть представлен наиболее существенными и определяющими количественными характеристиками.

    Понятие "факторный анализ" не надо смешивать с широким понятием анализа причинно - следственных связей, когда изучается влияние различных факторов (их сочетаний, комбинаций) на результативный признак.

    Суть метода факторного анализа заключается в исключении описания множественных характеристик изучаемых и замене его меньшим количеством информационно более емких переменных, которые называются факторами и отражают наиболее существенные свойства явлений. Такие переменные являются некоторыми функциями исходных признаков.

    Анализ, по словам Я. Окуня 9, позволяет иметь первые приближенные характеристики закономерностей, лежащих в основе явления, сформулировать первые, общие выводы о направлениях, в которых нужно вести дальнейшее исследование. Далее он указывает на основное предположение факторного анализа, которое сводиться к тому, что явление, несмотря на свою разнородность и изменчивость можно описывать небольшим количеством функциональных единиц, параметров или факторов. Эти сроки называют по - разному: влияние, причины, параметры, функциональные единицы, способности, основные или независимые показатели. Использование того или иного срока обусловлено

    Окунь Я. Факторный анализ: Пер. с. пол. М.: Статистика, 1974.- С.16.

    контекстом о факторе и знанием сути изучаемого явления.

    Этапами факторного анализа являются последовательные сопоставления различных наборов факторов и вариантов группам с их включением, выключением и оценкой достоверности различий между группами.

    В.М.Жуковська и И.Б.Мучник 10, говоря о сути задач факторного анализа, утверждают, что последний не требует априорного подразделения переменных на зависимые и независимые, поскольку все переменные в нем рассматриваются как равноправные.

    Задача факторного анализа сводится к определенному понятию, числа и природы наиболее существенных и относительно независимых функциональных характеристик явления, его измерителей или базовых параметров - факторов. По мнению авторов, важной отличительной особенностью факторного анализа является то, что он позволяет одновременно исследовать большое число взаимосвязанных переменных без допущения о "неизменности всех других условий", так необходимого при использовании ряда других методов анализа. В этом большое преимущество факторного анализа как ценного инструмента исследования явления, обусловленного сложной разнообразием и взаемопереплетенням связей.

    Анализ опирается в основном на наблюдения над естественным варьированием переменных.

    1. При использовании факторного анализа совокупность переменных, которые изучаются с точки зрения связей между ними, не выбирается произвольно: этот метод позволяет выявлять основные факторы, которые осуществляют существенное влияние в данной области.

    2. Анализ не требует предварительных гипотез, наоборот, он сам может служить методом выдвижения гипотез, а также выступать критерием гипотез, опирающихся на данные, полученные другими методами.

    3. Анализ не требует априорных догадок относительно того, какие переменные независимы, а зависимые, он не гипертрофирует причинные связи и решает вопрос об их мере в процессе дальнейших исследований.

    Перечень конкретных задач, решаемых с использованием методов факторного анализа будет таким (по В.М.Жуковською). Назовем основные из них в области социально-экономических исследований:

    Жуковская В.М., Мучник И.Б. Факторный анализ в социально-Экономическим исследованиях. -Статистика, 1976. С.4.

    1. Определение основных аспектов различий между объектами наблюдения (минимизация описание).

    2. Формулировка гипотез о природе различий между объектами.

    3. Выявление структуры взаимосвязей между признаками.

    4. Проверка гипотез о взаимосвязи и взаимозаменяемости признаков.

    5. Сопоставление структур наборов признаков.

    6. Расчленение объектов наблюдения за типичными признаками.

    Изложенное свидетельствует о больших возможностях факторного анализа в

    исследовании общественных явлений, где, как правило, невозможно проконтролировать (экспериментально) влияние отдельных факторов.

    Достаточно эффективным является использование результатов факторного анализа в моделях множественной регрессии.

    Имея предварительно сформированную корреляционно-регрессионную модель изучаемого явления в виде коррелированных признаков, с помощью факторного анализа можно такой набор признаков превратить в значительно меньшую их количество путем агрегирования. При этом следует отметить, что такое преобразование ни в коей мере не ухудшает качество и полноту информации об изучаемом явлении. Созданные агрегированные признаки некоррелированы и представляют линейную комбинацию первичных признаков. С формальной математической стороны постановка задач в таком случае может иметь бесконечную множественную решений. Но нужно помнить, что при изучении социально - экономических явлений полученные агрегированные признаки должны иметь экономически обоснованное трактовки. Иначе говоря, в каком - либо случае использования математического аппарата в первую очередь выходят из знаний экономической сути изучаемых явлений.

    Таким образом, сказанное выше позволяет резюмировать, что факторный анализ является специфическим методом исследования, который осуществляется на базе арсенала приемов математической статистики.

    Свое практическое применение факторный анализ впервые нашел в области психологии. Возможность свести большое количество психологических тестов к небольшому количеству факторов позволило объяснить способности человеческого интеллекта.

    При исследовании социально-экономических явлений, где есть трудности в изолировании влияния отдельных переменных, успешно может быть использован факторный анализ. Применение его приемов позволяет путем определенных расчетов "профильтровать" несущественные признаки и продолжить исследования в направлении его углубления.

    Эффективность этого метода очевидна при исследовании таких вопросов (проблем): в экономике - специализация и концентрация производства, интенсивность ведения хозяйства, бюджет семей работников, построение различных обобщающих показателей. и т.д

    Из предисловия автора
    Глава 1. Введение
    1.1. Многомерное нормальное распределение как модель
    1.2. Общий обзор многомерных методов
    Литература
    Глава 2. Многомерное нормальное распределение
    2.1. Введение
    2.2. Понятия, связанные с многомерными распределениями
    2.3. Многомерное нормальное распределение
    2.4. Распределение линейной комбинации нормально распределенных величин; независимость величин; частные распределения
    2.5. Условные распределения и множественный коэффициент корреляции
    2.6. Характеристическая функция; моменты
    Литература
    Задачи
    Глава 3. Оценка вектора среднего значения и ковариационной матрицы
    3.1. Введение
    3.2. Оценки наибольшего правдоподобия для вектора среднего значения и ковариационной матрицы
    3.3. Распределение вектора выборочного среднего; заключение о среднем значении, когда ковариационная матрица известна
    Литература
    Задачи
    Глава 4. Распределения и использование выборочных коэффициентов корреляции
    4.1. Введение
    4.2. Коэффициент корреляции двумерной выборки
    4.3. Частные коэффициенты корреляции
    4.4. Множественный коэффициент корреляции
    Литература
    Задачи
    Глава 5. Обобщенная T2-статистика
    5.1. Введение
    5.2. Обобщенная T2-статистика и ее распределение
    5.3. Применения T2-статистики
    5.4. Распределение T2-статистики при наличии конкурирующих гипотез; функция мощности
    5.5. Некоторые оптимальные свойства критерия Т2
    5.6. Многомерная проблема Беренса - Фишера
    Литература
    Задачи
    Глава 6. Классификация наблюдений
    6.1. Проблема классификации
    6.2. Принципы правильной классификации
    6.3. Методы классификации наблюдений в случае двух генеральных совокупностей с известным распределением вероятностей
    6.4. Классификация наблюдений в случае двух генеральных совокупностей, имеющих известные многомерные нормальные распределения
    6.5. Классификация наблюдений в случае двух многомерных нормальных генеральных совокупностей, параметры которых оцениваются по выборке
    6.6. Классификация наблюдений в случае нескольких генеральных совокупностей
    6.7. Классификация наблюдений в случае нескольких многомерных нормальных совокупностей
    6.8. Пример классификации в случае нескольких многомерных нормальных генеральных совокупностей
    Литература
    Задачи
    Глава 7. Распределение выборочной ковариационной матрицы и выборочной обобщенной дисперсии
    7.1. Введение
    7.2. Распределение Уишарта
    7.3. Некоторые свойства распределения Уишарта
    7.4. Теорема Кохрена
    7.5. Обобщенная дисперсия
    7.6. Распределение множества коэффициентов корреляции в случае диагональной ковариационной матрицы совокупности
    Литература
    Задачи
    Глава 8. Проверка общих линейных гипотез. Дисперсионный анализ
    8.1. Введение
    8.2. Оценки параметров многомерной линейной регрессии
    8.3. Критерии отношения правдоподобия для проверки линейных гипотез о коэффициентах регрессии
    8.4. Моменты отношения правдоподобия в случае, когда справедлива нулевая гипотеза
    8.5. Некоторые распределения величин U
    8.6. Асимптотическое разложение распределения отношения правдоподобия
    8.7. Проверка гипотез о матрицах коэффициентов регрессии и доверительные области
    8.8. Проверка гипотезы о равенстве средних значений нормальных распределений с общей ковариационной матрицей
    8.9. Обобщенный дисперсионный анализ
    8.10. Другие критерии для проверки линейной гипотезы
    8.11. Каноническая форма
    Литература
    Задачи
    Глава 9. Проверка гипотезы о независимости множеств случайных величин
    9.1. Введение
    9.2. Отношение правдоподобия как критерий для проверки гипотезы о независимости множеств случайных величин
    9.3. Моменты отношения правдоподобия при условии, что справедлива нулевая гипотеза
    9.4. Некоторые распределения отношения правдоподобия
    9.5. Асимптотическое разложение распределения величины h (отношения правдоподобия)
    9.6. Пример
    9.7. Случай двух множеств случайных величин
    Литература
    Задачи
    Глава 10. Проверка гипотез о равенстве ковариационных матриц и о равенстве одновременно векторов среднего значения и ковариационных матриц
    10.1 Введение
    10.2 Критерии проверки гипотез о равенстве нескольких ковариационных матриц
    10.3. Критерии проверки гипотезы об эквивалентности нескольких нормальных совокупностей
    10.4. Моменты отношения правдоподобия
    10.5. Асимптотические разложения функций распределения величин V1 и V
    10.6. Случай двух генеральных совокупностей
    10.7. Проверка гипотезы о том, что ковариационная матрица пропорциональна заданной матрице. Критерий сферичности
    10.8. Проверка гипотезы о том, что ковариационная матрица равна данной матрице
    10.9. Проверка гипотезы о том, что вектор среднего значения и ковариационная матрица соответственно равны данному вектору и данной матрице
    Литература
    Задачи
    Глава 11. Главные компоненты
    11.1. Введение
    11.2. Определение главных компонент совокупности
    11.3. Оценки наибольшего правдоподобия для главных компонент и их дисперсий
    11.4. Вычисление оценок наибольшего правдоподобия для главных компонент
    11.5. Пример
    Литература
    Задачи
    Глава 12. Канонические корреляции и канонические величины
    12.1. Введение
    12.2. Канонические корреляции и канонические величины генеральной совокупности
    12.3. Оценка канонических корреляций и канонических величин
    12.4. Способ вычислений
    12.5. Пример
    Литература
    Задачи
    Глава 13. Распределение некоторых характеристических корней и векторов, не зависящих от параметров
    13.1. Введение
    13.2. Случай двух матриц Уишарта
    13.3. Случай одной невырожденной матрицы Уишарта
    13.4. Канонические корреляции
    Литература
    Задачи
    Глава 14. Обзор некоторых других работ по многомерному анализу
    14.1. Введение
    14.2 Проверка гипотез о ранге и оценка линейных ограничений на коэффициенты регрессии. Канонические корреляции и канонические величины
    14.3. Нецентральное распределение Уишарта
    14.4. Распределение некоторых характеристических корней и векторов, зависящих от параметров
    14.5. Асимптотическое распределение некоторых характеристических корней и векторов
    14.6. Главные компоненты
    14.7. Факторный анализ
    14.8. Стохастические уравнения
    14.9. Анализ временных рядов
    Литература
    Приложение. Теория матриц
    1. Определение матриц. Действия над матрицами
    2. Характеристические корни и векторы
    3. Разбиение векторов и матриц на блоки
    4. Некоторые результаты
    5. Метод сокращения Дулиттла и метод сгущения по оси для решения систем линейных уравнений
    Литература
    Предметный указатель