Компонентный анализ является методом определения структурной зависимости между случайными переменными. В результате его использования получается сжатое описание малого объёма, несущее почти всю информацию, содержащуюся в исходных данных. Основой компонентного анализа является построение таких линейных комбинаций исходных переменных (главных компонент), которые бы имели максимальную дисперсию и минимальную зависимость друг от друга.
Более общим методом преобразования исходных переменных по сравнению с компонентным анализом является факторный анализ. Центральной проблемой, которую приходится решать при обработке экспериментальных данных, является задача её “сжатия”, выделения существенной информации, которая затемнена разного рода данными, не имеющими отношения к сути изучаемого явления. Поэтому задача уменьшения размеров исходного массива данных тесно связана с задачей выявления закономерностей изучаемого явления. Наблюдаемые параметры зачастую являются лишь косвенными характеристиками изучаемого объекта. На самом деле существуют внутренние (не наблюдаемые непосредственно) параметры или свойства, число которых мало и которые определяют значения наблюдаемых параметров. Эти внутренние параметры принято называть факторами. Задача факторного анализа – представить наблюдаемые параметры в виде линейных комбинаций факторов.
Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается набором признаков (параметров). Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами (классами). Особое место кластерный анализ занимает в тех отраслях науки, которая связана с изучением массовых явлений и процессов. Необходимость развития кластерного анализа и их использования продиктована тем, что они помогают построить научно обоснованные классификации, выявить взаимосвязи между единицами наблюдаемой совокупности. Кроме того, методы кластерного анализа могут использоваться в целях сжатия информации, что является важным фактором в условиях постоянного увеличения и усложнения потоков статистических данных.
Дискриминантный анализ является разделом многомерного статистического анализа, который включает в себя методы классификации многомерных (по ряду показателей) наблюдений по принципу максимального сходства при наличии обучающих факторов (то есть используется алгоритм, автоматически учитывающий изменения в данных).
Если в кластерном анализе рассматриваются методы многомерной классификации без обучения, то в дискриминантном анализе новые кластеры не образуются, а формулируется правило, по которому на основании данных наблюдений за новым объектом производится отнесение его к одному из уже существующих классов (кластеров, обучающих подмножеств). Такое правило базируется на сравнении определённых статистических характеристик изучаемого объекта со значениями дискриминантной функции, которая строится, чаще всего, в виде линейной статистических характеристик имеющихся классов.
Предположим, что существуют две или более совокупности (группы) и что мы располагаем множеством выборочных наблюдений над ними. Основная задача дискриминантного анализа состоит в построении с помощью этих выборочных наблюдений правила, позволяющего отнести новое наблюдение к одной из совокупностей.
Дискриминантный анализ может использоваться и для прогнозирования поведения наблюдаемого объекта путем сопоставления изменения его показателей с поведением аналогичных показателей объектов обучающих подмножеств.
Например, можно по ряду показателей выделить группы развитых и развивающихся стран. При этом мы должны уже иметь некоторые группы стран, явно относящиеся к одной из этих групп, а также иметь наборы значений некоторых показателей (среднедушевой доход, продолжительность жизни, уровень образования, производительность труда и т.д.). При отнесении других стран к одному из этих классов, мы должны построить дискриминантную функцию, зависящую от статистических характеристик имеющихся наборов данных, и сравнивать значения этой функции для каждой изучаемой страны со значениями этой же функции для каждой из двух групп. Та группа, которая будет иметь более близкое значение дискриминантной функции и примет в свои ряды новую страну. Далее зная динамику изменений показателей в этой группе, мы можем делать некоторые прогнозы изменения показателей изучаемой страны. В простейшем случае одного показателя, например, среднедушевого дохода, мы можем просто вычислить среднее значение этого показателя для каждой из групп и сравнить среднедушевой доход изучаемой страны с полученными средними значениями. Если у изучаемой страны этот показатель будет ближе к доходу осреднённому для развитых стран, то мы и отнесём её к группе развитых стран.
Аналогичный подход можно применить к предприятиям, разбив их на группы: крупные, средние, мелкие. Проделав соответствующий анализ, мы можем отнести новое предприятие к одной из групп, а далее постараться сделать прогноз развития предприятия на основании сравнения с изменением показателей предприятий этой группы. Такой подход может быть достаточно продуктивным, особенно если все предприятия относятся к какой-то одной отрасли.
Поможем написать любую работу на аналогичную тему