|
||||||||||||
|
||||||||||||
|
|||||||||
МЕНЮ
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА - РЕФЕРАТЫ - Способы представления знанийСпособы представления знаний2 Содержание
DATR является примером представления лексических знаний RDF является простой Нотация для представления отношений между и среди объектов Языки Примеры искусственных языков которые используются преимущественно для представления знаний:CycL IKL KIF Loom OWL KM: Машина Знаний (англ. Knowledge Machine) (фреймовый язык, использовавшийся для задач представления знаний) язык ПрологГлава 2. Модели представления знаний. Неформальные (семантические) модели2.1 Методы представления знанийСуществуют два типа методов представления знаний (ПЗ): Формальные модели ПЗ; Неформальные (семантические, реляционные) модели ПЗ. Очевидно, все методы представления знаний, которые рассмотрены выше, включая продукции (это система правил, на которых основана продукционная модель представления знаний), относятся к неформальным моделям. В отличие от формальных моделей, в основе которых лежит строгая математическая теория, неформальные модели такой теории не придерживаются. Каждая неформальная модель годится только для конкретной предметной области и поэтому не обладает универсальностью, которая присуща моделям формальным. Логический вывод - основная операция в СИИ - в формальных системах строг и корректен, поскольку подчинен жестким аксиоматическим правилам. Вывод в неформальных системах во многом определяется самим исследователем, который и отвечает за его корректность. Каждому из методов ПЗ соответствует свой способ описания знаний. 1. Логические модели. В основе моделей такого типа лежит формальная система, задаваемая четверкой вида: M = <T, P, A, B>. Множество T есть множество базовых элементов различной природы, например слов из некоторого ограниченного словаря, деталей детского конструктора, входящих в состав некоторого набора и т.п. Важно, что для множества T существует некоторый способ определения принадлежности или непринадлежности произвольного элемента к этому множеству. Процедура такой проверки может быть любой, но за конечное число шагов она должна давать положительный или отрицательный ответ на вопрос, является ли x элементом множества T. Обозначим эту процедуру П(T). Множество P есть множество синтаксических правил. С их помощью из элементов T образуют синтаксически правильные совокупности. Например, из слов ограниченного словаря строятся синтаксически правильные фразы, из деталей детского конструктора с помощью гаек и болтов собираются новые конструкции. Декларируется существование процедуры П(P), с помощью которой за конечное число шагов можно получить ответ на вопрос, является ли совокупность X синтаксически правильной. В множестве синтаксически правильных совокупностей выделяется некоторое подмножество A. Элементы A называются аксиомами. Как и для других составляющих формальной системы, должна существовать процедура П(A), с помощью которой для любой синтаксически правильной совокупности можно получить ответ на вопрос о принадлежности ее к множеству A. Множество B есть множество правил вывода. Применяя их к элементам A, можно получать новые синтаксически правильные совокупности, к которым снова можно применять правила из B. Так формируется множество выводимых в данной формальной системе совокупностей. Если имеется процедура П(B), с помощью которой можно определить для любой синтаксически правильной совокупности, является ли она выводимой, то соответствующая формальная система называется разрешимой. Это показывает, что именно правило вывода является наиболее сложной составляющей формальной системы. Для знаний, входящих в базу знаний, можно считать, что множество A образуют все информационные единицы, которые введены в базу знаний извне, а с помощью правил вывода из них выводятся новые производные знания. Другими словами формальная система представляет собой генератор порождения новых знаний, образующих множество выводимых в данной системе знаний. Это свойство логических моделей делает их притягательными для использования в базах знаний. Оно позволяет хранить в базе лишь те знания, которые образуют множество A, а все остальные знания получать из них по правилам вывода. 2. Сетевые модели. В основе моделей этого типа лежит конструкция, названная ранее семантической сетью. Сетевые модели формально можно задать в виде H = <I, C1, C2,..., Cn, Г>. Здесь I есть множество информационных единиц; C1, C2,..., Cn - множество типов связей между информационными единицами. Отображение Г задает между информационными единицами, входящими в I, связи из заданного набора типов связей. В зависимости от типов связей, используемых в модели, различают классифицирующие сети, функциональные сети и сценарии. В классифицирующих сетях используются отношения структуризации. Такие сети позволяют в базах знаний вводить разные иерархические отношения между информационными единицами. Функциональные сети характеризуются наличием функциональных отношений. Их часто называют вычислительными моделями, т.к они позволяют описывать процедуры «вычислений» одних информационных единиц через другие. В сценариях используются каузальные отношения, а также отношения типов «средство - результат», «орудие - действие» и т.п. Если в сетевой модели допускаются связи различного типа, то ее обычно называют семантической сетью. 3. Продукционные модели. В моделях этого типа используются некоторые элементы логических и сетевых моделей. Из логических моделей заимствована идея правил вывода, которые здесь называются продукциями, а из сетевых моделей - описание знаний в виде семантической сети. В результате применения правил вывода к фрагментам сетевого описания происходит трансформация семантической сети за счет смены ее фрагментов, наращивания сети и исключения из нее ненужных фрагментов. Таким образом, в продукционных моделях процедурная информация явно выделена и описывается иными средствами, чем декларативная информация. Вместо логического вывода, характерного для логических моделей, в продукционных моделях появляется вывод на знаниях. 4. Фреймовые модели. В отличие от моделей других типов во фреймовых моделях фиксируется жесткая структура информационных единиц, которая называется протофреймом. В общем виде она выглядит следующим образом: (Имя фрейма: Имя слота 1(значение слота 1) Имя слота 2(значение слота 2) ... ... ... ... ... ... ... Имя слота К (значение слота К)). Значением слота может быть практически что угодно (числа или математические соотношения, тексты на естественном языке или программы, правила вывода или ссылки на другие слоты данного фрейма или других фреймов). В качестве значения слота может выступать набор слотов более низкого уровня, что позволяет во фреймовых представлениях реализовать «принцип матрешки». При конкретизации фрейма ему и слотам присваиваются конкретные имена и происходит заполнение слотов. Таким образом, из протофреймов получаются фреймы - экземпляры. Переход от исходного протофрейма к фрейму - экземпляру может быть многошаговым, за счет постепенного уточнения значений слотов. 2.2 Формальные модели представления знанийСистема ИИ в определенном смысле моделирует интеллектуальную деятельность человека и, в частности, - логику его рассуждений. В грубо упрощенной форме наши логические построения при этом сводятся к следующей схеме: из одной или нескольких посылок (которые считаются истинными) следует сделать «логически верное» заключение (вывод, следствие). Очевидно, для этого необходимо, чтобы и посылки, и заключение были представлены на понятном языке, адекватно отражающем предметную область, в которой проводится вывод. В обычной жизни это наш естественный язык общения, в математике, например, это язык определенных формул и т.п. Наличие же языка предполагает, во - первых, наличие алфавита (словаря), отображающего в символьной форме весь набор базовых понятий (элементов), с которыми придется иметь дело и, во - вторых, набор синтаксических правил, на основе которых, пользуясь алфавитом, можно построить определенные выражения. Логические выражения, построенные в данном языке, могут быть истинными или ложными. Некоторые из этих выражений, являющиеся всегда истинными. Объявляются аксиомами (или постулатами). Они составляют ту базовую систему посылок, исходя из которой и пользуясь определенными правилами вывода, можно получить заключения в виде новых выражений, также являющихся истинными. Если перечисленные условия выполняются, то говорят, что система удовлетворяет требованиям формальной теории. Ее так и называют формальной системой (ФС). Система, построенная на основе формальной теории, называется также аксиоматической системой. Формальная теория должна, таким образом, удовлетворять следующему определению: всякая формальная теория F = (A, V, W, R), определяющая некоторую аксиоматическую систему, характеризуется: наличием алфавита (словаря), A,множеством синтаксических правил, V, множеством аксиом, лежащих в основе теории, W, множеством правил вывода, R. Исчисление высказываний и исчисление предикатов являются классическими примерами аксиоматических систем. Эти ФС хорошо исследованы и имеют прекрасно разработанные модели логического вывода - главной метапроцедуры в интеллектуальных системах. Поэтому все, что может и гарантирует каждая из этих систем, гарантируется и для прикладных ФС как моделей конкретных предметных областей. В частности, это гарантии непротиворечивости вывода, алгоритмической разрешимости (для исчисления высказываний) и полуразрешимости (для исчислений предикатов первого порядка). ФС имеют и недостатки, которые заставляют искать иные формы представления. Главный недостаток - это «закрытость» ФС, их негибкость. Модификация и расширение здесь всегда связаны с перестройкой всей ФС, что для практических систем сложно и трудоемко. В них очень сложно учитывать происходящие изменения. Поэтому ФС как модели представления знаний используются в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов2.3 Представление знаний в виде правилТакой способ является наиболее понятным и популярным методом формального представления знаний. Правила обеспечивают формальный способ представления рекомендаций, знаний или стратегий. Они чаще подходят в тех случаях, когда предметные знания возникают из эмпирических ассоциаций, накопленных за годы работы по решению задач в данной области. В системах, основанных на правилах, предметные знания представляются набором правил, которые проверяются на группе фактов и знаний о текущей ситуации (входной информации). Когда часть правила ЕСЛИ удовлетворяет фактам, то действия, указанные в части ТО, выполняется. Когда это происходит, то говорят, что правило срабатывает. Интерпретатор правил сопоставляет части правил ЕСЛИ с фактами и выполняет то правило, часть ЕСЛИ которого сходится с фактами, т.е. интерпретатор правил работает в цикле «Сопоставить - выполнить», формируя последовательность действий. Действия правил могут состоять: в модификации набора фактов в базе знаний, например добавление нового факта, который сам может быть использован для сопоставления с частями ЕСЛИ; во взаимодействии с внешней средой (например, «Вызвать пожарную команду»). 2.4 Представление знаний с использованием фреймовСистемы, базы знаний иногда насчитывают сотни правил, и для инженера знаний при такой сложности системы, процесс обновления состава правил и контроль связей между ними становится весьма затруднительным, поскольку добавляемые правила могут дублировать имеющиеся знания или вступать с ними в противоречие. Для выявления подобных фактов можно использовать программные средства, но включение их в работу системы приводит к еще более тяжелым последствиям - потере работоспособности, так как в этом случае инженер знаний теряет представление о том, как взаимодействуют правила. Так как возрастает количество связей между понятиями, инженеру знаний трудно их контролировать. Представление знаний, основанных на фреймах, является альтернативным по отношению к системам, основанным на правилах: оно дает возможность хранить иерархию понятий в базе знаний в явной форме. Фреймом называется структура для описания стереотипной ситуации, состоящая из характеристик этой ситуации и их значений. Характеристики называются слотами, а значения - заполнителями слотов. Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одно или несколько правил, с помощью которых это значение можно найти. В слот может входить не одно, а несколько значений. Иногда слот включает компонент называемый фасетом, который задает диапазон или перечень его возможных значений. Как уже отмечалось, помимо конкретного значения, в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления этого значения. Если, например, фрейм, описывающий человека, включает слоты «Дата рождения» и «Возраст», и в первом из них находится некоторое значение, то во втором слоте может стоять процедура, вычисляющая возраст по дате рождения и текущей дате. Процедуры, располагающиеся в слоте, называются связанными процедурами. Чаще всего используются процедуры: «если - добавлено» - выполняется, когда новая информация помещается в слот; «если - удалено» - выполняется, когда информация удаляется из слота; «если - нужно» - выполняется, когда запрашивается информация из слота, а он пустой. Эти процедуры могут проверять, что при изменении значения производятся соответствующие действия. Совокупность фреймов, моделирующая какую-нибудь предметную область, представляет собой иерархическую структуру, в которую соединяются фреймы. На верхнем уровне иерархии находится фрейм, содержащий наиболее общую информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Значения характеристик фреймов могут передаваться по умолчанию фреймам, находящимся ниже них в иерархии, но, если последние содержат собственные значения данных характеристик, то в качестве истинных данных принимаются именно они. Это обстоятельство позволяет легко учитывать во фреймовых системах различного рода исключения. Различают статические и динамические системы фреймов. В системах статических фреймы не могут быть изменены в процессе решения задачи, в динамических системах это допустимо. Наиболее ярко достоинства фреймовых систем представления знаний проявляется в том случае, если связи между объектами изменяются нечасто и предметная область насчитывает немного исключений. Значения слотов представляются в системе в единственном экземпляре, поскольку включается только в один фрейм, описывающий наиболее общее понятие из всех тех, которые содержат слот с данным именем. Такое свойство систем фреймов дает возможность уменьшить объем памяти, необходимый для их размещения в компьютере. Однако основное достоинство состоит не в экономии памяти, а в представлении в БЗ связей, существующих между понятиями предметной области. 2.5 Представление знаний с использованием семантических сетейСемантическая сеть используется для описания метода представления знания, основанного на сетевой структуре. Этот метод является одним из наиболее эффективных методов хранения знаний. Семантические сети состоят из: узлов, соответствующих объектам, понятиям и событиям; дуг, связывающих узлы и описывающих отношения между ними. Иными словами, семантическая сеть отображает совокупность объектов предметной области и отношений между ними. При этом, объектам соответствуют вершины сети, а отношениям - соединяющие их дуги. В семантическую сеть включаются только те объекты предметной области, которые необходимы для решения прикладных задач. В качестве объектов могут выступать события, действия, обобщенные понятия или свойства объектов. Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Наиболее распространенными являются следующие типы отношений: «является» - означает, что объект входит в состав данного класса; «имеет» - позволяет задавать свойства объектов. Возможны также отношения вида: «является следствием» - отражает причинно-следственные связи; «имеет значение» - задает значение свойств объектов. 2.6 Представление знаний в виде нечетких высказыванийМетоды построения математических моделей часто основаны на неточной, но в объективной информации об объекте. Однако возможны ситуации, когда при построении моделей решающее значение имеют сведения, полученные от эксперта, обычно качественного характера. Они отражают содержательные особенности изучаемого объекта и формулируются на естественном языке. Описание объекта в таком случае носит нечеткий характер. Например: В булевой алгебре 1 представляет истину, а 0 - ложь. То же имеет место и в нечеткой логике, но, кроме того используются также все дроби между 0 и 1, чтобы указать на частичную истинность [2, 5 - 11]. Так запись «µ(высокий(Х)) = 0,75» говорит о том, что предположение «Х - высокий» в некотором смысле на три четверти истинно, а на одну четверть ложно. Для комбинирования нецелочисленных значений истинности в нечеткой логике определяются эквиваленты логических операций: µ1 И µ2 = min (µ1, µ2); µ1 ИЛИ µ2 = max (µ1, µ2); НЕ µ1 = 1 - µ1. Таким образом, обрывочные сведения можно комбинировать на основе строгих и согласованных методов. Слабым моментом в применении нечеткой логики является отображение (функция принадлежности). Предположим, возраст Х - 40 лет. Насколько истинно предположение, что Х - старый. Равна ли эта величина 0,5, поскольку Х прожил примерно полжизни, или величины 0,4 и 0,6 более реалистичны. Необходимо решить, какую функцию лучше использовать для отображения возраста в интервал от 0 до 1. Чем, например, кривая лучше, чем линейная зависимость. Для предпочтения одной формы функции другой нет объективных обоснований, поэтому в реальной задаче будут присутствовать десятки и сотни подобных функций, каждая из которых до некоторой степени является произвольной. Значит в системах, основанных на нечеткой логике, необходимо предусмотреть средства, позволяющие модифицировать функции принадлежности. Еще одной проблемой является проблема взвешивания отдельных сведений. Предположим, например, что мы располагаем некоторой совокупностью нечетких правил: Правило 1: ЕСЛИ нить Х горит медленно И при горении нити Х образуется твердый шарик бурого цвета ТО нить Х - капроновая; Правило 2: ЕСЛИ нить Х вне пламени гаснет И при горении нити Х чувствуется запах сургуча ТО нить Х - капроновая. ЗаключениеВ заключении хочется сказать, что было очень немного top-down обсуждения вопросов представления знаний и исследования в данной области is a well aged quiltwork. Есть хорошо известные проблемы, такие как «spreading activation, « (задача навигации в сети узлов)»категоризация» (это связано с выборочным наследованием; например вездеход можно считать специализацией (особым случаем) автомобиля, но он наследует только некоторые характеристики) и «классификация». Например помидор можно считать как фруктом, так и овощем. В области искусственного интеллекта, решение задач может быть упрощено правильным выбором метода представления знаний. Определенный метод может сделать какую-либо область знаний легко представимой. Например диагностическая экспертная система Мицин использовала схему представления знаний основанную на правилах. Неправильный выбор метода представления затрудняет обработку. В качестве аналогии можно взять вычисления в индо-арабской или римской записи. Деление в столбик проще в первом случае и сложнее во втором. Аналогично, не существует такого способа представления, который можно было бы использовать во всех задачах, или сделать все задачи одинаково простыми. Список используемых источников1. Благодатских В.А., Волнин В.А., Поскакалов К.Ф. Стандартизация разработки программных средств. - М: Финансы и статистика, 2003. 2. Вендров А.М. Проектирование программного обеспечения экономических информационных систем - М: Финансы и статистика, 2002. 3. Вендрова А.М. Практикум по проектированию программного обеспечения экономических информационных систем - М: Финансы и статистика, 2002. 4. Черемных С.В., Семенов И.О., Ручкин В.С. Структурный анализ систем: IDEF-технологии - М: Финансы и статистика, 2001. |
РЕКЛАМА
|
|||||||||||||||||
|
БОЛЬШАЯ ЛЕНИНГРАДСКАЯ БИБЛИОТЕКА | ||
© 2010 |