В. К. Финн Об интеллектуальном анализе данных


R] есть реализация каркаса ИС, где R = БФ, Решатель. Рассматривая Решатель как оператор, естественно положить, что Решатель (БФΣ) = [R



Скачать 346.7 Kb.
страница3/5
Дата10.05.2018
Размер346.7 Kb.
1   2   3   4   5
R] есть реализация каркаса ИС, где R = БФ, Решатель. Рассматривая Решатель как оператор, естественно положить, что Решатель (БФΣ) = [R].

Очевидно, что наличие отношения включения между БФΣ и [R] зависит от типа Решателя. В частности, если БФ является эпистемической базой фактов такой, что она содержит фактоподобные высказывания с оценками, которые являются истинностными значениями некоторой многозначной логики, содержащими оценку «неопределенность», то Решатель преобразует БФ, заменяя оценку «неопределенность» на другие возможные оценки, тогда неверно, что БФ  Σ  Решатель (БФΣ), т.е. нарушается условие рефлексивности оператора Решатель. Для класса Решателей, реализующих машинное обучение при порождении всех возможных гипотез (например, для ДСМ - метода автоматического порождения гипотез [8,11]) выполняется условие идемпотентности Решателя:

Решатель (Решатель (БФΣ)) = Решатель (БФΣ)).

Для ИС с Решателем, использующим машинное обучение с индуктивными процедурами и устранением «неопределенности» из БФ не выполняется условие монотонности Решателя: если БФ1Σ1БФ2Σ2, то Решатель (БФ1Σ1)Решатель (БФ2Σ2) (о немонотонных операторах вывода см. [13]).

Мы охарактеризовали идею «система знаний для ИС» и с ее помощью уточнили идею «знание в ИС», считая, что неопределяемым понятием является «цель ИС», истолковать которое можно посредством класса задач, решаемого посредством ИС.

Отметим одно важное обстоятельство для понимания природы анализа данных посредством ИС. Если Решатель реализует машинное обучение для БФ с фактами, имеющими оценку «неопределенность», то посредством автоматического порождения гипотез некоторые «неопределенности» будут устранены, и соответствующие им факты из БФ преобразуются в знание из БЗ. Таким образом, исходная БФ уменьшается, а БЗ расширяется.

Применение Решателя к БФΣ, где Σ – базовое множество знаний, породит множество высказываний Σ, где Σ[R]. Σ может быть множеством высказываний не только уточняющих факты с оценкой «неопределенно», но и содержать другие следствия Решателя. В частности, возможно, что имеется Σ = Рассуждатель (БФΣ), где ΣΣ .

Пусть = Σ\Σ, где - результаты, полученные Решателем с использованием Вычислителя. Будем говорить, что анализ данных является интеллектуальным, если Σ .

Таким образом, под ИАД мы будем понимать анализ данных из БФ с использованием знаний для ИС Σ посредством Решателя такой, что Σ  , где Σ = Рассуждатель (БФΣ).

ИАД будем называть гибридным, если одновременно выполняются

Σ  и .

Процесс создания информационной среды, т.е. БФΣ является весьма трудоемким и осуществляется технологически посредством инженерии знаний (систематическое изложение инженерии знаний содержится в [9]). Отметим, что выбор БФΣ совершается в соответствии с целью ИС – некоторой проблемой Р1 (назовем ее начальной проблемой). Очевидно, что Р1 соответствует некоторый класс задач, решение которых требует автоматизации определенного набора интеллектуальных способностей, упомянутых ранее. Очевидно, что формирование БФ Σ является важным этапом процесса КДД.

Обозначим посредством Г – множество правил вывода, содержащих как правила достоверного вывода, так и правила правдоподобных выводов, посредством которых формализуются различные правдоподобные рассуждения [14]. Посредством С обозначим множество вычислительных процедур, применяемых в ИС для решения проблемы Р1. Очевидно, что правила из Г и С реализуются в Рассуждателе и Вычислителе, соответственно, а их комбинирование осуществляет Синтезатор. Напомним, что Решатель = Рассуждатель + Вычислитель + Синтезатор.

Теперь мы можем охарактеризовать строение БЗ для ИС, решающей проблему Р1:

БЗ = Σ, Σ , Г, С, где Σ[R], а [R] = Решатель (БФΣ).

Таким образом, создание БЗ есть представление знаний «системы знаний для ИС», охарактеризованной выше. Однако мы пока охарактеризовали лишь декларативные и процедурные знания. Теперь сформулируем идею концептуальных знаний. С этой целью рассмотрим следующие принципы.

Принцип I (цель ИС).

Для создания ИС должна быть сформулирована проблема Р1, которой соответствует класс формализуемых задач.

Примерами Р1 являются диагностика по клиническим данным, предсказание биологической активности химических соединений (в том числе - токсичности), диагностика дефектов изделий, автоматическая классификация текстов по теме, принятие решений на основе предыдущего опыта, предсказание социального поведения (действий, установок, мнений) и распознавание его рациональности, формирование типологии преступлений на основе базы прецедентов с последующим распознаванием типа преступления (например, преступлений рецидивистов) и т.д.

Принцип II (типы «миров»).

Можно выделить три типа предметных областей W («миров») [3]:

(а) предметные области («миры», «универсумы») такие, что факты, принадлежащие W, являются случайными событиями; соответственно правила Решателя (т.е. элементы Г и С), применяемые в рассуждениях и вычислениях, используют идеи теории вероятностей (в том числе различные статистические методы анализа данных);

(в) предметные области W такие, что факты, принадлежащие W, причинно обусловлены; соответственно, правила Решателя, применяемые в рассуждениях с W, порождают гипотезы о причинно-следственных зависимостях и основанных на них обобщениях;

(с) предметные области W такие, что факты, принадлежащие W, могут быть как причинно-обусловленными, так и случайными (это означает, что этот «мир» является обобщением миров (а) и (в)); рассуждения, представленные в Решателе, соответствующие этому «миру», должны использовать правила, порождающие гипотезы о зависимостях причинно-следственного типа с учетом вероятностных соображений [15], [16] (например, частоты появления причинно-следственного эффекта).

Принцип III (адекватность предметной области W и Решателя для Р1).

Рассуждатель и Вычислитель должны содержать методы рассуждений и вычислений, соответствующие типам W, т.е. (а), (в) или (с).

Очевидно, что для W типа (а) адекватными будут статистические методы, а для W типа (в) адекватными методами рассуждения будут правдоподобные рассуждения, формализующие анализ отношений причинно-следственного типа (см. в связи с этим [8]).

Принцип IV (условие применимости ИС).

Этот принцип является развитием Принципов II и III. Он состоит в том, что условия применимости Решателя должны быть точно сформулированы. Например, для «миров» типа (в) может быть охарактеризован класс каузальных моделей, к которым применим метод автоматического порождения гипотез [8], использующий правдоподобные рассуждения, осуществляемые Рассуждателем.

БФ, представляющая W типа (в), должна содержать позитивные и негативные примеры изучаемого эффекта. В БФ в неявном виде должны содержаться причинно-следственные зависимости, как позитивные (т.е вынуждающие наличие эффекта), так и негативные (т.е. вынуждающие отсутствие эффекта). Кроме того, структура данных, используемая для представления фактов из БФ, должна быть пригодна для формализации структурного сходства фактов. Это обстоятельство делает возможным реализацию принципа: сходство фактов влечет сходство эффектов и их повторяемость. Этот принцип лежит в основе формализованного качественного анализа данных.

Принцип V (формализованная эвристика посредством синтеза познавательных процедур для реализации КДД – обнаружения знаний в базах данных (фактов)).

ИС применяются для предметных областей, знания о которых слабо формализованы. Соответственно, решения задач для W требуют формализованных эвристик. В силу этого, актуален следующий принцип: формализованная эвристика для решения задач в ИС, относящихся к проблеме Р1, должна быть синтезом познавательных процедур, посредством которых из БФБЗ Решатель извлекает новые знания.

Примером синтеза познавательных процедур является упорядоченное комбинирование индукции, аналогии и абдукции [8].

Синтез познавательных процедур формализуется посредством правдоподобных рассуждений [14]. Он является механизмом извлечения новых знаний из БФΣ, реализуемым посредством Решателя с использованием, как БФ, так и БЗ.

Легко понять, что изолированное применение индукции, аналогии, абдукции и дедукции не может быть средством эффективной формализацией, имеющей широкое применение.

Индукция, устанавливающая сходство фактов, порождает гипотезы о причинах, аналогия «переносит» обнаруженные закономерности (причины) на факты с оценкой «неопределенно», а абдукция является способом принятия порожденных гипотез посредством объяснения начального состояния БФ.

Принцип VI (фальсифицируемость и аргументируемость результатов работы Решателя)

В ИС должны содержаться средства фальсификации результатов применения Решателя к БФ Σ. Таковыми могут быть утверждения из Σ, которые накладывают ограничения на [R], (где Решатель (БФΣ) = [R]), или же автоматически порожденные фальсификаторы, которые извлекаются из БФ и запрещают некоторые гипотезы из [R].

Аргументируемость результатов из [R] означает, что порождаемые гипотезы имеют аргументы за их принятие и не имеют контраргументов, их запрещающих.

Принцип VII (синтез теорий истины).

Для ИС, аппроксимирующих базисные способности интеллекта (выделение существенных факторов; синтез познавательных процедур, используемый, в частности, для порождения гипотез посредством правдоподобных рассуждений, а также БФ и БЗ; обучение на примерах из БФ), о которых упоминалось в начале статьи, непригодна аристотелевская теория истины как теория соответствия, формализованная А. Тарским для двузначной логики [17] (см. также [18] глава 9). Дело в том, что порождаемые Решателем гипотезы либо правдоподобны, если порождены Рассуждателем посредством правдоподобных рассуждений [14], либо имеют некоторую вероятность, если порождены Решателем с использованием статистических методов.

Однако и в том и в другом случае имеются критерии принятия гипотез на основе БФ и БЗ, где БЗ = Σ, Σ, Г, С. Следовательно, оценка знаний, полученных с помощью гипотез основана на знании, к, которому теория соответствия не применима. Очевидно, что в этом случае в ИС используется теория истины, называемая теорией когерентности, в которой значения истинности основаны на имеющихся знаниях [18], а не на соответствии реальности.

Наконец, результаты работы ИС могут иметь практическую ценность, хотя их истинность не была установлена. В этом случае можно говорить о применимости прагматической теории истины [18]: истинно то, что полезно.

Таким образом, когнитивный процесс порождения нового знания в ИС может быть охарактеризован посредством синтеза трех теорий истины – теории соответствия, теории когерентности и прагматической теории. В самом деле, БФ формируется при соблюдении теории соответствия, гипотезы оцениваются согласно теории когерентности, а результаты работы ИС могут быть оправданы согласно прагматической теории истины. Таков принцип теории истины для ИС, использующих автоматическое порождение гипотез и машинное обучение.

Принцип VIII (инвариантность структуры Рассуждателя относительно варьируемости предметных областей и структур данных).

Пусть r1,......., rs – множество правил правдоподобного вывода, сформулированные в языке представления знаний L, а αr,….., αr–соответствующие им импликативные аксиомы (т.е. декларативное представление процедур). Пусть  – сигнатура, используемая для формулировки αr, i = 1, ......, s (т.е. множество функциональных и предикатных символов).

Пусть, далее, посредством αr представим синтез познавательных процедур согласно Принципу V, но функциональные символы для выражения сходства фактов могут иметь различные определения. Это означает, что могут варьироваться предметные области и структуры данных (при сохранении ), однако не изменяются тип правил правдоподобного вывода и тип рассуждения. Например, сохраняется синтез познавательных процедур типа «индукция + аналогия + абдукция» с последующим применением дедукции.

Это означает, что может быть задан класс ИСj , соответствующих подобным проблемам Р(j)1, j = 1, ….. k, решения которых осуществляется одним типом формализованной эвристики. Этот класс эвристик характеризуется одним и тем же типом Рассуждателя и аналогичными условиями его применимости в соответствии с Принципами III и IV, соответственно, адекватности W и условиями применимости Решателя. Будем этот класс формализованных эвристик называть «ядром» Решателя. Очевидно, что конкретная ИСj есть «ядро» + его спецификация относительно предметной области и проблемы Р(j)1.

Класс проблем Р1, соответствующих «ядру» ИС будем называть суперпроблемой (очевидно, что Р(j)1Р1). Например, суперпроблемой Р1 является прогнозирование каких-либо эффектов посредством порождения гипотез о причинно-следственных зависимостях в БФ, а конкретными проблемами Р(1)1 и Р(2)1 являются проблемы прогнозирования биологической активности химических соединений посредством гипотез о фармакофорах (предполагаемых причин биологической активности химических соединений – их подструктур) и прогнозирования электорального поведения посредством некоторых детерминант, содержащихся в описаниях индивидуальных социальных субъектов.

Принцип IX (наличие метауровня ИС).

Пусть заданы каркас ИС R = БФ Σ, Решатель,

Решатель (БФΣ) = [R] и Рассуждатель (БФΣ) = Σ и БЗ =  Σ, Σ, Г, С, где Σ[R], выраженные посредством языка представления знаний L. Будем полагать, что имеются метаматематические средства ML, посредством которых можно формулировать дедуктивную имитацию Рассуждателя [19] и осуществлять анализ алгоритмов, соответствующих процедурам Решателя. Это означает, что имеется возможность исследования результатов Решателя потенциально релевантных цели ИС, т.е. проблеме Р1. Из этого следует, в частности, возможность планирования выбора стратегий решения задач ИС на логическом уровне.

Принцип X (абдуктивное объяснение результатов ИС).

Подсистема объяснения результатов компьютерной системы является важной характеристикой ее интеллектуальности. Разумеется, идеальной конструкцией объяснения согласно К. Гемпелю [20] является следующая схема

A1, …, Ak


Каталог: about -> persons -> finn -> pages
about -> Методическая разработка практического занятия для преподавателя п. 00 Профессиональный цикл оп. 00 Общепрофессиональные дисциплины
persons -> Статические и динамические экспертные системы
pages -> В. К. Финн к структурной когнитологии: феноменология сознания с точки зрения искусственного интеллекта
persons -> К вопросу о формальном отражении образного мышления и интуиции специалиста слабо структурированной предметной области
persons -> Ростки будущего


Поделитесь с Вашими друзьями:
1   2   3   4   5


База данных защищена авторским правом ©znate.ru 2019
обратиться к администрации

    Главная страница