Эвентологический метод главных компонент



Скачать 59.88 Kb.
страница1/2
Дата30.07.2018
Размер59.88 Kb.
  1   2

УДК 519.2/.6


Эвентологический метод главных компонент

Веретнова К.Ю.

научный руководитель доктор физико-математических наук, профессор Воробьев О. Ю.

Институт математики, Сибирский Федеральный Университет


Введение

Метод главных компонент — один из основных способов уменьшить размерность данных, потеряв наименьшее количество информации. Изобретен К. Пирсоном в 1901 г. Это один из способов выделить главный фактор, влияющий на группу объектов.

В настоящей статье приводится сравнение классического и событийного (эвентологического) метода главных компонент. Главное различие между этими методами – это то, что объектами применения классического метода являются конечные объекты, тогда как объектом применения эвентологического метода главных компонент являются события. Несмотря на разный род объектов между методами прослеживается определенная аналогия, которая будет рассмотрена далее.
Классический метод главных компонент

Классический метод главных компонент предполагает работу с конечной совокупностью определенных объектов. В качестве таких объектов могут выступать объекты природы (люди, животные), экономические объекты (банки, предприятия). Совокупность объектов исследования – множество единиц одного рода, класса, которые обладают сходными свойствами, присущими всему классу.

Для каждой такой совокупности объектов необходимо выделить признаки. Признаки – это показатели, которыми можно охарактеризовать каждый объект из множества объектов изучения.

Например, если мы изучаем группу людей в условиях крайнего Севера[], то такими признаками могут выступать артериальное давление, пульс, количество приседаний, которое способен сделать человек в минуту.

В работе [] объектами изучения выступали банки в условиях экономического кризиса. Для них признаками являлись показатели ежемесячной балансовой отчетности.

После сбора информации данные формируются в матрицу, которая называется матрицей данных.

Матрицей данных размерности будем называть матрицу, элементами которой являются – значение j-го показателя для i-го объекта, где – количество исследуемых объектов, – количество показателей, выбранных для характеристики совокупности исследуемых объектов, , .

То есть каждый объект исследования представляется в виде точки в -мерном пространстве показателей. Достоинство такого представления – это наглядность. Мы сразу можем представить облако точек-объектов в пространстве.

Задача метода главных компонент - это уменьшение размерности этого пространства -мерного показателей, отыскание показателя, который более всего влияет на исследуемую совокупность.

Суть метода главных компонент – это отыскание такого признака, от которого совокупность объектов наиболее зависима.

Технически метод главных компонент заключается в отыскании матрицы векторов главных компонент.

То есть, изначально исследуемые данные представлены в виде матрицы:



В ходе реализации алгоритма метода находится матрица векторов главных компонент (матрица перехода к пространству главных компонент):



,

где – желаемая размерность пространства.

Каждый вектор матрицы – вектор главных компонент, в котором каждая -ая координата соответствует -му признаку. Тот признак, который имеет наибольшее значение по модулю в первом векторе главной компоненты – и есть главный фактор. В векторе второй главной компоненты признак, имеющий наибольшее по модулю значение – второй главный фактор и т.п.

Метод главных компонент позволяет отсеять существенные признаки для совокупности объектов от тех, которые не вносят различия между объектами. Используя метод главных компонент можно отбросить показатели, которые не влияют на исследуемое множество, уменьшить размерность данных.






Поделитесь с Вашими друзьями:
  1   2


База данных защищена авторским правом ©znate.ru 2017
обратиться к администрации

    Главная страница