Диссертация на соискание ученой степени кандидата



страница1/32
Дата01.07.2018
Размер3.24 Mb.
ТипДиссертация
  1   2   3   4   5   6   7   8   9   ...   32


МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального

образования

«Российский государственный гуманитарный университет»


Отделение интеллектуальных систем в гуманитарной сфере

Кафедра математики, логики и интеллектуальных систем в гуманитарной сфере



На правах рукописи

Волкова Анна Юрьевна

РАЗРАБОТКА АЛГОРИТМИЧЕСКИХ И ПРОГРАММНЫХ СРЕДСТВ ДЛЯ РЕАЛИЗАЦИИ СТРАТЕГИЙ ДСМ-МЕТОДА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ ГИПОТЕЗ

05.13.17 – Теоретические основы информатики


Диссертация на соискание ученой степени кандидата

технических наук

Научный руководитель:

д.т.н., профессор



В.К. Финн

Москва 2014


ОГЛАВЛЕНИЕ





1)ДСМ-метод является синтезом познавательных процедур для извлечения знаний из баз фактов (БФ). 4

2)ДСМ-системы удовлетворяют принципу качественного анализа данных: «сходство фактов в БФ влечет наличие (отсутствие) изучаемого эффекта и его повторяемость». Мы можем задать алгебраическую операцию нахождения сходства двух фактов, так как в БФ реализуется определенная структура данных. Правдоподобные рассуждения используют отношение сходства. 5

3)ДСМ-метод включает несколько этапов фальсификации, встроенные в процедуры индукции и аналогии. 5

4)ДСМ-рассуждение завершается применением абдукции – процедуры объяснения исходного множества фактов и принятия на этом основании порождённых гипотез. 5

5)Знания в базах знаний (БЗ) представлены в виде квазиаксиоматических теорий (КАТ), которые содержат формализованное представление множества аксиом (частично характеризующих предметную область), расширяемые БФ и множество гипотез, а также множество правил вывода. 5

6)ДСМ-метод АПГ фактически реализует схему роста знаний эволюционной эпистемологии К.Р. Поппера [8, С. 164-165]. 5

7)Диагностика двух заболеваний глаз: дегенеративного ретиношизиса и наследственных витреоретинальных дистрофий (Лаборатория клинической физиологии зрения МНИИ глазных болезней им. Гельмгольца). 12

8)Диагностика системной красной волчанки (Отделение нефрологии Городской клинической больницы им. Боткина). 13

9)Прогнозирование продолжительности жизни больных меланомой и оценка прогностического биохимического маркера – протеина S100 (Российский Онкологический Научный Центр РАМН имени Н.Н. Блохина). 13

1. Назначение программы 240

1. Обзор 249

2.Технические требования для работы с системой 250

3.Проведение эксперимента 251

9.1. Подготовка файла SPSS 251

9.2. Приложение «Проведение эксперимента» 252

13)Если в выборке респондентов присутствуют те, у которых оценка изучаемого эффекта – «неопределенно», и после получения гипотез система смогла доопределить оценку хотя бы для одного респондента, то процесс ДСМ-рассуждений будет повторяться до стабилизации (все неопределенные объекты доопределены или ни один пример больше не доопределяется). 276

3.Просмотр результатов эксперимента 281

4.Обратная связь 305



введение


Огромную роль в развитии направления исследований «искусственный интеллект» играет интеллектуальный анализ данных (ИАД). В англоязычной литературе ему обычно соответствуют термины «data mining» и «knowledge discovery», однако, по-видимому, это верно лишь при широком толковании ИАД как извлечения нового полезного знания из неформализованных данных посредством различных формальных методов (статистические процедуры, нейронные сети, генетические алгоритмы, деревья решений и др.). Мы же под ИАД понимаем анализ данных посредством интеллектуальной системы (ИС) [1].

Структуру интеллектуальной системы можно представить в виде трех основных блоков: Информационная среда, Решатель задач и Интеллектуальный интерфейс [2]. Информационная среда состоит из базы фактов (БФ) и базы знаний (БЗ). БФ содержит множество фактов, которые являются результатами эмпирического исследования. БЗ включает аксиомы, характеризующие исследуемую предметную область, аксиомы структуры данных и процедуры, которые реализует Решатель задач.

Решатель задач в свою очередь состоит из трех модулей: Рассуждатель, Вычислитель и Синтезатор. Они осуществляют, соответственно, правдоподобные выводы, вычисления, необходимые для решения поставленной задачи, объединение рассуждений, вычислений и комбинаторных алгоритмов. Синтезатор также выбирает стратегии решения задач [3].

Интеллектуальный интерфейс является средством общения пользователя с ИС и выполняет такие функции, как [4]: диалог на естественном языке (обычно ограниченном), автоматический синтез программы (в данном случае речь идет способность вызывать процедуры Решателя задач), обоснование полученных результатов и обучение работе с системой.

Интеллектуальные системы типа ДСМ (ДСМ-системы) являются примером ИС, которые реализуют когнитивные правдоподобные эмпирические (КПЭ) рассуждения типа «индукция + аналогия + абдукция» (с возможным применением дедукции). Как рассмотрено в [1], КПЭ-рассуждения можно эффективно использовать для имитации познавательных способностей естественного интеллекта, а именно – цикла «анализ данных – порождение гипотез (предсказание) - объяснение» [3].

ДСМ-рассуждения формализуются средствами бесконечнозначной логики предикатов с кванторами по кортежам переменной длины [5] и реализуются в ИС с использованием машинного (индуктивного) обучения для knowledge discovery в базах фактов [3].

ДСМ-метод автоматического порождения гипотез (АПГ) включает 6 компонент [3, 6]: условия применимости, правдоподобные рассуждения, квазиаксиоматические теории как средство организации БФ и БЗ, исследования предметной области (дедуктивная имитация индукции, аналогии и абдукции, определения исходных предикатов, препроцессинг), средства распознавания эмпирических закономерностей и интеллектуальные системы типа ДСМ (ИС-ДСМ). Все компоненты ДСМ-метода представлены в диссертации.

ДСМ-метод является мощным логико-комбинаторным методом интеллектуального анализа данных, который применим в различных предметных областях при выполнении следующих условий [7]:

(а) Знания предметной области могут быть плохо формализованы, но данные хорошо структурированы, что позволяет определить на изучаемых объектах операцию сходства.

(б) База фактов содержит описание предметной области и «..образована фактоподобными высказываниями вида «объект C имеет множество свойств А», которым приписаны оценки «фактически истинно» (1), «фактически ложно» (-1), «фактически противоречиво» (0), «неопределенно» (τ)» [7, С.400]. Множество свойств А называют эффектом. Положительные примеры (с типом истинностного значения, равным 1) обладают исследуемым эффектом, отрицательные примеры (с типом истинностного значения, равным -1) – не обладают. Неопределенные примеры (с типом истинностного значения, равным τ) – это примеры, требующие доопределения.

(в) В БФ неявно должны содержаться зависимости причинно-следственного типа: (±)-причины исследуемых эффектов.
ДСМ-метод АПГ отвечает принципам компьютерного интеллектуального анализа данных (knowledge discovery), а именно [6]:

1)ДСМ-метод является синтезом познавательных процедур для извлечения знаний из баз фактов (БФ).

2)ДСМ-системы удовлетворяют принципу качественного анализа данных: «сходство фактов в БФ влечет наличие (отсутствие) изучаемого эффекта и его повторяемость». Мы можем задать алгебраическую операцию нахождения сходства двух фактов, так как в БФ реализуется определенная структура данных. Правдоподобные рассуждения используют отношение сходства.

3)ДСМ-метод включает несколько этапов фальсификации, встроенные в процедуры индукции и аналогии.

4)ДСМ-рассуждение завершается применением абдукции – процедуры объяснения исходного множества фактов и принятия на этом основании порождённых гипотез.

5)Знания в базах знаний (БЗ) представлены в виде квазиаксиоматических теорий (КАТ), которые содержат формализованное представление множества аксиом (частично характеризующих предметную область), расширяемые БФ и множество гипотез, а также множество правил вывода.

6)ДСМ-метод АПГ фактически реализует схему роста знаний эволюционной эпистемологии К.Р. Поппера [8, С. 164-165].

Таким образом, ДСМ-метод АПГ является формализованной эвристикой, которая позволяет создавать компьютерные системы, решающие определенный круг задач для различных предметных областей. ДСМ-системы успешно применялись к таким предметным областям, как фармакология, медицинская и техническая диагностика, социология, криминалистика, робототехника [5, 7, 9, 10, 11, 12]. Перечень основных публикаций можно найти в [12].


Эффективность ИС-ДСМ зависит как от возможностей Решателя, так и представления данных в БФ и знаний в БЗ. Созданные ранее ДСМ-системы обычно применялись для решения практических задач одной предметной области и имели Решатель, реализующий базовые методы ДСМ-рассуждений: простой метод сходства и его усиления – запрет на контрпримеры.

Созданная в ходе диссертационного исследования ДСМ-система не только предоставила реализацию стандартных методов, но и расширила возможности Решателя новыми стратегиями. На практике удалось провести анализ данных на разных предметных областях, удовлетворяющих условиям применимости ДСМ-метода. Было разработано представление данных трех предметных областей: фармакологии, медицинской диагностики и социологии. Архитектура системы позволила применить к ним один и тот же Решатель, что делает систему универсальной относительно рассматриваемых БФ и БЗ.

В Решателе впервые было реализовано четыре индуктивных метода Д.С. Милля [13]. Созданные методы были протестированы на данных фармакологии и медицинской диагностики. Проведенные эксперименты показали интересные результаты и позволили сравнить различные стратегии между собой. В процессе работы с социологическими данными были реализованы процедуры обратного ДСМ-метода и предусмотрена поддержка ситуационного расширения ДСМ-рассуждений.

Концепция ИС-ДСМ и архитектура Решателя были специализированы для решения социологических задач. Была создана автономная компьютерная ИС JSM-Socio, посредством которой были исследованы задачи с новым представлением знаний: описание субъекта (социальный характер субъекта, индивидуальные черты личности, биографические данные), мнение субъекта (о ситуации, о возможном поведении), ситуация (контекст поведения). JSM-Socio является подспорьем социологам для решения задач качественного анализа социологических данных.


Актуальность диссертационного исследования обусловлена необходимостью создания Решателя задач, применимого к сериям компьютерных ИС для различных предметных областей и обладающего эффективными средствами для извлечения знаний из баз фактов. Такие ИС должны предоставить реализацию новых стратегий ДСМ-рассуждений, способных облегчить работу эксперта по анализу результатов работы системы.

Таким образом, предметом исследования диссертации являются методы анализа данных посредством правдоподобных рассуждений типа ДСМ и их применимость для задач фармакологии, медицинской диагностики и социологии. Средства анализа данных включают различные логические процедуры ДСМ-рассуждений, подходящую структуру представления данных и комфортный интерфейс для работы эксперта.




Каталог: binary
binary -> Счастье как социокультурный феномен (социологический анализ)
binary -> Особенности репрезентации культурной идентичности в интернете
binary -> Стратегии личностной идентификации в сетевом пространстве компьютерной симуляции: культурологический аспект
binary -> Жизненное самоопределение молодежи в современном российском обществе
binary -> Формирование образа семьи в средствах массовой информации россии
binary -> Религиозно-философская и психоаналитическая интерпретации проблемы пола: В. В. Розанов и з. Фрейд
binary -> Программа по социологии «Социология семьи, детства и гендерных отношений»
binary -> Мурадян Овик Хачикович
binary -> Программа курса пояснительная записка курс «Социальная психология личности»
binary -> Презентация тела в советской фотографии «оттепели»


Поделитесь с Вашими друзьями:
  1   2   3   4   5   6   7   8   9   ...   32


База данных защищена авторским правом ©znate.ru 2017
обратиться к администрации

    Главная страница