Вопрос 7. Инженерия знаний и нечеткость. Классификация видов нечеткости. Привести пример формулировки задач для основных видов нечеткости.


Добавил:DMT
Дата создания:30 декабря 2007, 19:06
Дата обновления:22 января 2008, 21:16
Просмотров:15951 последний 23 апреля, 0:54
Комментариев: 0
Вопрос 7. Инженерия знаний и нечеткость. Классификация видов нечеткости. Привести пример формулировки задач для основных видов нечеткости.

Инженерия знаний (knowledge engineering) – одно из важных направлений современного программирования, занимающееся развитием языков, методов и систем представления и обработки знаний на компьютерах. Оно возникло в 1950-х гг. как один из разделов искусственного интеллекта, так как стало необходимо явным образом (отдельно от программ) хранить, изменять и пополнять базы знаний, содержащие в обобщенном виде необходимую для решения задач информацию о предметной области.

Как выяснилось, знания, необходимые для решения многих нетривиальных практических задач с использованием компьютеров, носят гибридный характер , то есть, требуются не только процедурные знания (алгоритмы, их программные реализации и типовые процедуры решения задач), но также концептуальные знания (определения концепций проблемной области и отношений между ними), фактуальные знания (конкретные факты и их связи между собой) и эвристические знания (неформальные правила рассуждений, отражающие практический опыт решения задач в проблемной области).

Правила (конструкции вида ЕСЛИ условие ТО действие, используемые для продукционного вывода, при котором на каждом шаге, при истинности условия некоторого выбранного правила, активизируется его действие) удобны для представления эвристических знаний и структурируются в виде наборов правил (rule sets), каждый из которых применяется для вывода некоторого целевого утверждения (goal); - фреймы (frames) – иерархические структуры, удобные для представления знаний о концепциях и их взаимосвязи ; фреймы могут использоваться не только для представления структур знаний, но и для сопоставления с объектами исследуемой проблемной области, с целью их анализа и классификации; - семантические сети (semantic nets) – нагруженные ориентированные мультиграфы, которые, как и фреймы, удобны для представления концепций и их взаимоотношений и являются, по-видимому, наиболее общей формой представления знаний.

Плохо поставленные (некорректные) задачи суще­ствуют во всех предметных областях, где, как ожи­дается, будут эффективными интеллектуальные систе­мы как средство построения информационных систем нового поколения. К ним относятся проблемы, строгое описание которых невозможно, а также сложные про­блемы. Корректные задачи часто можно решить суще­ствующими методами систематизации и программи­рования. В области не­корректных задач точные знания нельзя получить, либо их нельзя получить сразу, поэтому, как правило, необходим подход, суть которого в постепенном при­ближении к полному набору знаний. Другими сло­вами, знания чаще всего нечетки. Для того чтобы интеллектуальные системы вышли за рамки простых символьных выводов и приблизились к мышлению че­ловека, необходимы методы представления нечетких знаний и механизм выводов, работающий в их среде.

Человек обладает самыми различными формами знаний, и пока еще не совсем ясно, каким образом они структурированы в его мозгу. Однако для исполь­зования знаний в компьютерах они должны быть фор­мализованы и описаны. В этом состоит проблема представления знаний. Пока знания не формализова­ны и не описаны, они не могут быть использованы в компьютерах, точно так же не могут быть использованы техническими средствами и нечеткости, пред­варительно не описанные в некоторой форме.

Все нечеткости, с которыми до сих пор приходи­лось иметь дело в инженерии знаний, можно классифицировать следующим образом:

1) недетерминированность выводов,

2) многозначность,

3) ненадежность,

4) неполнота,

5) нечеткость или неточность.

Недетерминированность выводов (Нечеткий вывод???)

Недетерминированное управление выводами наиболее харак­терно для систем искусственного интеллекта. Такое управление необходимо потому, что знания накапли­ваются фрагментарно, и нельзя априори определить цепочку логических выводов, в которых они исполь­зуются. Другими словами, необходимо методом проб и ошибок выбрать некую цепочку выводов, и в случае неуспеха организовать перебор с возвратами для по­иска другой цепочки и т. д. Такое управление являет­ся предпосылкой проявления гибкости и интеллекту­альных способностей, позволяющих найти выход в са­мых различных ситуациях.

Поскольку эффективность простого поиска низка, возникает необходимость определения пути, по кото­рому следует начать поиск в первую очередь. При эвристическом поиске, разра­ботанном на первых этапах исследования искусствен­ного интеллекта, руководствуются оценочными функ­циями, которые не всегда бывают точными (имеют априорные значения).

Большинство поисковых задач можно сформулиро­вать как задачи поиска в пространстве состояний пути от исходного состояния заданной задачи до целевого состояния путем повторения возможных преобразова­ний (с помощью операторов). При этом для организа­ции поиска в пространстве состояний удобно исполь­зовать дерево поиска (или его более общую форму — граф). К основным методам систематического просмо­тра пространства состояний относятся вертикальный и горизонтальный поиск.

В эпоху инженерии знаний возникла идея реализа­ции выводов (поиска) на основе знаний. Шире стали применять эвристические знания (в смысле не обяза­тельно достоверных знаний, т. е. знаний, содержащих нечеткости).

Нечеткий вывод: дедукция (от частного к общему), индукция (от общего к частному). Пусть есть нечеткий множества F , G , F `, G `. Если F = G , тогда вывод F ` из G ` производится по F = G . В случае нечеткого множества F и F ` могут не совпадать. Нечеткий вывод можно произвести, если F близко к F ` и их можно сопоставить.

Пример: если Петя – маленький, то Вася – взрослый. Пете около 5. Сколько тогда Васе?

Многозначность.

Многозначность интерпретации — обычное явле­ние при понимании естественных языков и распозна­вании изображений и речи.

При понимании естественных языков большими проблемами становятся многозначность смысла слов, многозначность их подчиненности, многозначность местоимений в контексте и т. п. Как правило, устра­нение многозначности обеспечивается за счет более широкого контекста и семантических ограничений. При обработке изображений часто многозначна ин­терпретация элементов изображения (контуры, обла­сти и т. п.). В общем случае устранить многознач­ность помогают более широкие пространственные отношения и другие способы. Метод релаксации— это метод систематического устранения многозначно­сти при интерпретации изображений с помощью цик­лических операций.

Пример: казнить нельзя помиловать. Где поставить запятую?

Нарисованы несколько соединенных кубов. Какие грани выпуклые, а какие впуклые?

Салат рекурсивный: помидоры, огурцы, салат.

Ненадежность

В задачах, которые решают интеллектуальные си­стемы, иногда приходится применять ненадежные знания и факты, представить которые двумя значения­ми — истина или ложь (1 или 0)—трудно. Суще­ствуют знания, достоверность которых, скажем, 0,7. Такую ненадежность в современной физике и технике представляют вероятностью, подчиняющейся законам Байеса (для удобства назовем ее байесовской вероят­ностью), но в инженерии знаний было бы нелогично иметь дело со степенью надежности, приписанной знаниям изначально, как с байесовской вероятностью, (нелогично незнание представлять байесовской веро­ятностью).

Поэтому одним из первых был разработан метод использования коэффициентов уверенности. Этот метод не имеет теоретического подкрепления, но стал примером обработки ненадежных знаний. Позже была введена теория вероятностей Демпстера — Шафера, которая имеет все признаки математической теории. По сравнению с байесовской вероятностью теория Демпстера — Шафера отличается тем, что она не фиксирует значения вероятности, а может представлять и незнание.

Связь между подзадачами, на которые разбита задача, оперирующая двумя понятиями — истина и ложь, может быть представлена через операции И и ИЛИ . В задачах с ненадежными исходными данными кроме И и ИЛИ важную роль играет комбинированная связь, которую будем обозначать как КОМБ . Такая связь независимо подкрепляет или опровергает цель на основании двух и более доказательств.

Для решения сложных задач можно использовать метод разбиения их на несколько подзадач. Каждая подзадача в свою очередь разбивается на простые подзадачи, поэтому задача в целом описывается иерархически. Знания, которые по условиям подзадач определяют условия задач высшего уровня, накапли­ваются фрагментарно. В задачах с ненадежными дан­ными знания могут не только иметь степень надеж­ности, равную 1, но и промежуточные значения между истиной и ложью.

На основании двух и более доказательств цели (или подцели) независимо подтверждаются или опро­вергаются (в случае противоречивых доказательств), если связь комбинированная. Например, рассмотрим случай определения (диагностирования), простужен ли больной. Пусть доказательство 1 — кашель у боль­ного — надежно со степенью 0,6, а доказательство 2 — температура 39—40°—надежно со степенью только 0,5. Простудное состояние при наблюдении только одного из доказательств простуды можно подтвердить только с надежностью 0,6 или 0,5. На основании двух и более доказательств цели (или подцели) независимо подтверждаются или опро­вергаются (в случае противоречивых доказательств), если связь комбинированная. Например, рассмотрим случай определения (диагностирования), простужен ли больной. Пусть доказательство 1 — кашель у боль­ного — надежно со степенью 0,6, а доказательство 2 — температура 39—40°—надежно со степенью только 0,5. Простудное состояние при наблюдении только одного из доказательств простуды можно подтвердить только с надежностью 0,6 или 0,5.

, С ij – степени надежности

Неполнота

Полностью описать мир задач чрезвычайно слож­но. Например, знание «птицы летают» — верное, од­нако встречаются и нелетающие птицы, т. е. это не­полное значение.

Другой пример: можно перечислить все предметы, которые находятся в комнате, но того, чего в ней нет, перечислить невозможно, поскольку это бесчисленное множество предметов. Точно так же можно перечис­лить верные знания (в некоторой проблемной обла­сти), но перечислить неверные знания и разумно их определить невозможно. Поэтому удобно в базе зна­ний определять исключительно верные знания, а все, что не определено, считать заведомо неверным. Утвер­ждения, которые не упомянуты ни как истинные, ни как ложные, принято относить к ложным. Это назы­вают гипотезой закрытого мира.

Классическая ло­гика исходит из предпосылки, что набор определен­ных в ней аксиом (знаний) полон, и правильный вы­вод не меняется, даже если впоследствии добавлена новая аксиома. Такое свойство называется монотон­ностью. Если допустить, что в базу знаний добавлено такое знание: «как правило, птицы летают (за неко­торым исключением)», то обнаружится свойство не­монотонных выводов. А именно, при добавлении новой аксиомы иногда возможно отрицание вывода, ко­торый считался верным в некоторой системе аксиом (базе знаний).

К системам, связанным с неполными знаниями и управлением такими знаниями, относится система поддержания значений истинности. В базе знаний этой системы, неполной и содержащей противоречия, все знания делятся на достоверные и недостоверные, и предусмотрено упорядочение базы с целью устране­ния недостоверных знаний. В этой системе достоверно истинные знания относятся к классу « IN », а знания, истинность которых недостоверна либо в истинность которых нет повода верить, — к классу « OUT ». Если при добавлении новых знаний возникает противоре­чие, то выполняется повторная проверка классов зна­ний.

Пример: Какова температура кипящей воды? Если мы не можем пополнить знания об атмосферном давлении, то точно на этот вопрос мы ответить не сможем.

Нечеткость и неточность.

Когда мы говорим «старик», то не ясно, что мы имеем в виду: больше 50? больше 60? больше 70? Одним из методов изучения множеств без уточнения их границ является теория нечетких множеств, которая была предложена Заде в 1965 г . и продолжает развиваться.

В теории нечетких множеств большинство ситуаций оценивается приблизительно, а не точно. Необходимость такого подхода вызвана тем, что по мере роста сложности систем, наша неспособность делать точные и, в то же время, значащие утверждения относительно ее поведения. Было предложение ввести специальные обозначения (метки), определяющие более – менее нечеткие понятия и использующие эти метки в последующих рассуждениях.

См. нечеткую логику.

up