1. Обоснование необходимости проведения исследований



страница1/3
Дата04.01.2018
Размер59.5 Kb.
ТипЗадача
  1   2   3

Проект


"Разработка моделей и методов построения информационных систем, основанных на формальных, логических и лингвистических подходах"

1. Обоснование необходимости проведения исследований


В связи с бурным ростом объемов информации все более актуальной становится задача эффективного информационного обеспечения научных, производственных процессов и процессов принятия решений. Однако, как правило, задача информационного обеспечения рассматривается в контексте создания хранилищ документов и их систематизации с целью облегчения поиска необходимой информации. Возможностей, предоставляемых построенными в рамках такого подхода информационных систем, оказывается недостаточно для интеллектуальной поддержки производственной и управленческой деятельностей как организаций, так и лиц, принимающих решения.

Это связано с тем, что, во-первых, в постоянно разрастающемся архиве становится затруднительно найти нужную информацию; во-вторых, данные часто дублируются и противоречат друг другу. Кроме того, доступность этой информации ограничивается способом ее представления. Большей частью она представлена в виде текстовых документов. Интерпретация и представление этих документов в виде взаимосвязанных фактов, как правило, не поддерживается используемыми информационными системами и возлагается на пользователя. В то же время для человека, будь то ученый или руководитель предприятия, принимающий решение, наиболее естественной формой подачи информации является представление ее в виде различного рода фактов. Причем очень востребованы средства для анализа фактов, например, их сопоставления во временном и/или пространственном разрезе, быстрого определения источника данного факта, нахождения множества связанных с ним фактов и т.п. Такие средства могла бы предоставлять информационная система, способная на основе общих знаний и знаний о предметной области, изложенных в подходящих формализмах, поддерживать наборы фактов, давать удобные возможности в представлении и редактировании информации. Кроме того, важно иметь средства выполнения автоматического анализа текстов документов с последующей интерпретацией смыслового содержания в виде фактов и их группирования.

В связи с этим в проекте ставится задача разработки моделей и методов построения информационных систем нового поколения, основанных на использовании современных формализаций представления знаний и смысла. В частности, требуется разработать различные модели, представления информации, данных, фактов и знаний, требуется исследовать возможности и применимость онтологических методов для использования знаний о предметных областях, построить и изучить модели и технологии анализа естественно языковых текстов на предмет экстрагирования фактов и отношений между фактами. Требуется создать модель информационного пространства, подходы к построению моделей мира и моделей предметных областей, методы автоматического анализа текстов деловых и научных документов, методы представления и содержательного поиска информации в терминах понятий заданной предметной области.
1.1. Сложившиеся тенденции и современный уровень решения
проблем

Основным инструментом, с помощью которого в настоящее время осуществляется информирование специалистов, являются информационные системы (ИС), содержащие различные типы документов. Наиболее востребованными ИС на сегодняшний день являются системы документооборота, системы фактографического анализа, основанные на них интеллектуальные системы поддержки принятия решений и порталы знаний (информационные web-системы), служащие для поддержки деятельности предприятий и научных коллективов.

В настоящее время интенсивно ведутся исследования в сфере документарного обслуживания по созданию систем автоматической обработки текстов, прежде всего по машинному аннотированию, реферированию, индексированию, переводу. Эти исследования ведутся уже более трех десятилетий, но на уровень промышленной эксплуатации вышли лишь системы автоматического индексирования и, частично, машинного перевода.

Несмотря на определенные успехи в развитии документарных информационных систем, эти системы обеспечивают доступ только к первичным документам, но не к фактам и сведениям (смысловым единицам текста), содержащимся в этих документах.

Относительно новым направлением в исследованиях и технологическом развитии являются системы, основанные на семантических сетях RDF, использование дескриптивной логики через языки типа OWL, дающие формализацию описания онтологий. Это направление получило название Semantic Web и его цели в существенной части перекликаются с целями, поставленными в данном проекте.

Формализм описаний онтологий, основанный на дескриптивной логике, позволяет формулировать утверждения о полноте описания объектов и множеств объектов. К сожалению, он не определяет точного смысла для понятия "знание" и "обучение". Наоборот, логика знаний (эпистемическая логика) формализует понятие "знание", а в комбинации с логикой времени и программными логиками - понятие "обучение". С алгоритмической точки зрения комбинированная логика знаний, времени и программ достаточно хорошо изучена теоретически: известны алгоритмы проверки темпорально-эпистемических свойств онтологий, получены нижние оценки их сложности.

Комбинация дескриптивного, эпистемического и темпорально-программного подходов может стать универсальным логическим формализмом для описания онтологий как формы представления знаний. В таком формализме возможно формулировать как отдельные утверждения о полноте того или иного описания, или о неком знании, или о последовательности действий, протекающей во времени, так и комбинированные утверждения, например, о возможности получить знания об объектах, представленных в онтологии после выполнения определенной последовательности действий по пополнению онтологии новыми отношениями между объектами.

1.2. Оценка проделанной работы в этом направлении в ИСИ СО РАН

В ИСИ СО РАН ведутся исследования, направленные на:

- разработку средств представления знаний о предметных областях и релевантных им информационных ресурсах на основе онтологического подхода;

- построение фактографических и документарных систем, снабженных базой данных;

- использование формализмов RDF, OWL в информационных системах, построение эффективной технологии работы с семантическими сетями;

- создание модели информационного пространства, разработка подходов к построению распределенных систем хранения больших и очень больших информационных объемов;

- извлечение фактов из плоских и структурированных текстов;

- созданию комбинированных логик знаний, времени и программ.

В частности, разработана технология создания web-порталов знаний, обеспечивающих содержательный доступ к систематизированным знаниям и информационным ресурсам заданной предметной области; создан электронный архив академика А.П.Ершова; разработана система создания и поддержания электронных архивов и музеев; создана экспериментальная система интегрального информационного обеспечения работы по подготовке кадров, охватывающая цепочку: кафедра – аспирантура – академический институт.

В результате проведения фундаментальных исследований и выполнения прикладных разработок, получены существенные результаты, в частности:

Разработаны онтологии научной деятельности и научного знания, на основе которых могут строиться онтологии конкретных областей научного знания.

Получил развитие семантически-ориентированный подход к анализу текстов документов, который предполагает активное использование предметного словаря и онтологии предметной области. Данный подход совмещает классические методы морфологического и поверхностно-синтаксического анализа текста с разработанными в нашем институте методами лексического и семантического анализа на основе лексических шаблонов и семантических правил.

Разработаны методы автоматического построения предметных словарей на основе обучающей выборки, а также алгоритмы классификации, позволяющие относить анализируемый документ к одной или нескольким рубрикам из иерархии тем.

Разработаны алгоритмы проверки различных комбинированных логик знаний, времени и программ, получены нижние оценки их сложности. Разработан унифицированный семантический язык USL, предназначенный для формального описания дискретных динамических систем, в частности, алгоритмов проверки комбинированных логик.



1.3. Цели и предполагаемые результаты исследований

Целью проекта является разработка моделей и методов построения информационных систем нового поколения, основанных на использовании современных формализаций представления знаний и смысла.

Основными задачами проекта являются:


  • теоретические исследования применения онтологий и логических методов к традиционным и новым постановкам системной информатики

  • разработка концепции и архитектуры информационных систем нового поколения, создание технологии и основных компонентов;

  • разработка методов и средств построения моделей предметных областей и представления предметных данных и знаний, в частности фактов, а также методов содержательного поиска информации.

  • разработка методов автоматического анализа текстов деловых и научных документов, извлечения фактов из текстов.

Предполагается, что будут получены следующие результаты: будут созданы модель информационного пространства, базовая модель представления неспецифической информации, средства построения моделей (онтологий) предметных областей, средства описания и хранения предметных данных и знаний, методы содержательного поиска информации, методы автоматического анализа текстов деловых и научных документов, методы и средства описания онтологий на основе комбинаций дескриптивных, эпистемических и темпорально-программных логик, алгоритмы проверки формул комбинированных логик.

Кроме того, будет создана и обоснована методика, построения информационных систем, базирующихся на применении разработанных формализмов, будут выполнены конкретные прикладные проекты по тематике РАН.

Для решения перечисленных задач в проекте выделены три блока.

1. Разработка универсального логического формализма для описания онтологий на основе комбинации дескриптивного, эпистемического и темпорально-программного подходов

2. Разработка концепции и архитектуры информационной систем, основанных на формальных, логических и лингвистических подходах.

3. Разработка методов и средств автоматического анализа текстов деловых и научных документов.



Каталог: files
files -> Истоки и причины отклоняющегося поведения
files -> №1. Введение в клиническую психологию
files -> Общая характеристика исследования
files -> Клиническая психология
files -> Валявский Андрей Как понять ребенка
files -> К вопросу о формировании специальных компетенций руководителей общеобразовательных учреждений в целях создания внутришкольных межэтнических коммуникаций
files -> Русские глазами французов и французы глазами русских. Стереотипы восприятия


Поделитесь с Вашими друзьями:
  1   2   3


База данных защищена авторским правом ©znate.ru 2017
обратиться к администрации

    Главная страница