АСИЗ: Автоматизированные системы инженерии знаний

Служба тематических толковых словарей

glossary.ru

park.glossary.ru

Служебная библиотека

н а п р а в а х р е к л а м ы

• Станции перегруза ТБО

Чтение: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18

ТВЕРСКОЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

СОЛОВЬЕВ СЕРГЕЙ ЮРЬЕВИЧ

МАТЕМАТИЧЕСКИЕ МЕТОДЫ И ПРИНЦИПЫ ПОСТРОЕНИЯ
АВТОМАТИЗИРОВАННЫХ СИСТЕМ ИНЖЕНЕРИИ ЗНАНИЙ

05.13.16 - применение вычислительной техники,
математического моделирования и математических
методов в научных исследованиях

Веб-версия диссертации на соискание ученой
cтепени доктора физико-математических наук

1996

Серьезное
чтение
на glossary.ru

Оригинал диссертации хранится в Научной библиотеке Тверского государственного университета.
Шифр хранения:

3973.2
С60
Написать автору

Веб-версия рассчитана на Mozilla Firefox 3.0.1, Internet Explorer 7 и другие браузеры, корректно отображающие знаки теоретико-множественных операций ∈, ∉, ∩, ;∪, ⊂.

Навигационная схема диссертации
Оглавление • Введение • Заключение • Литература		далее
Глава I.	Автоматизированные системы инженерии знаний (АСИЗ)	далее
Глава II.	Метод простых систем альтернатив	далее
Глава III.	Инструментальная экспертная система ФИАКР	далее
Глава IV.	Методы восстановления формальных грамматик	далее
Глава V.	Методы реализации АСИЗ, основанные на сопоставлении решений	здесь
Глава VI.	Игровые методы реализации АСИЗ	далее

webadmin@glossary.ru

Глава V
МЕТОДЫ РЕАЛИЗАЦИИ
АВТОМАТИЗИРОВАННЫХ СИСТЕМ ИНЖЕНЕРИИ ЗНАНИЙ,
ОСНОВАННЫЕ НА СОПОСТАВЛЕНИИ РЕШЕНИЙ

5.1 Метод репертуарных решеток

Свойства метода репертуарных решеток • Игровой подход к реализации метода репертуарных решеток

5.2 Языки образов для построения сценариев извлечения знаний

5.3 Метод ролевых диалогов для построения сценариев извлечения знаний

Задачи выбора • Сценарий извлечения знаний "Рекламный агент"

5.4 Комбинированные сценарии извлечения знаний

Задачи управления • Интерактивная процедура синтеза схем управления

5.5 Метод доводки имен

Веб-версия диссертации размещена автором на www.park.glossary.ru. Копии веб-версии на иных сайтах заведомо получены и размещены с нарушением авторских прав, без согласия и без отвественности автора.

Сопоставление решений является одним из двух базовых подходов к организации автоматизированного опроса эксперта (п.п. 1.4, 1.5). При любой реализации АСИЗ, основанных на принципе сопоставления, первоначальная база сведений о проблемной области должна содержать множество решений: названия конечных диагнозов или промежуточных суждений, или названия подзадач или т.п.

В общем случае сопоставление решений, как метод опроса, предполагает такое задание эксперту, в котором

(1) перечисляются (или содержатся) имена конкретного подмножества решений,

(2) приводится описание свойств некоторого отношения между решениями,

и (3) предлагается

(a) выбрать для перечисленных решений конкретное (известное эксперту) отношение, удовлетворяющее свойствам (2);

(б) указать роли перечисленных решений в выбранном отношении;

(в) назвать (ввести с клавиатуры) имена выбранного отношения и его характеристики. указать роли перечисленных решений в выбранном отношении;

Сопоставление решений (независимо от конкретной реализации) в любом случае позволяет получить от эксперта атрибуты и тем самым позволяет формировать признаковую модель проблемной области.

В зависимости от специфики проблемной области и связанного с ней способа представления знаний сценарий опроса эксперта может существенно варьировать, не выходя тем не менее за рамки сопоставления. Абсолютным рекордсменом по количеству программных реализаций в АСИЗ, основанных на сопоставлении решений, является метод репертуарных решеток.

5.1 Метод репертуарных решеток

Идея метода репертуарных решеток заимствована из одноименной методики экспериментальной психологии [46]. В методе репертуарных решеток задание эксперту:

(1) содержит ровно три решения;
(2) ориентировано исключительно на выявление отношения сходства-двух-и-отличия-от-третьего.

Фактически эксперт должен назвать два значения некоторого атрибута, которые разбивают заданную тройку на пару сходных решений и одно контрастное. Причем оба сходных решения должны характеризоваться одним из названных значений, в то время как контрастное решение должно характеризоваться другим значением.

Пример 5.1
Эксперту-орнитологу предъявляется тройка решений: КОЛИБРИ, СТРАУС и ПОПУГАЙ. Допустимый ответ (в неформальном виде) может иметь вид: "ПОПУГАЙ и КОЛИБРИ хорошо летают и этим отличаются от СТРАУСА, который вообще не умеет летать."

Как следует из ответа, для описания предъявленных решений можно использовать атрибут "способность летать", который, в частности, имеет значения "хорошая" и "отсутствует". Полностью ответ эксперта можно представить фрагментом семантической сети с бинарными отношениями:

Несмотря на то, что "классический" метод репертуарных решеток позволяет вскрыть только два значения атрибута, его можно дополнить процедурой выявления полного спектра значений. С этой целью достаточно опросить эксперта о значениях атрибута для тех решений, которые не вошли в заданную тройку. Так, в примере 5.1 последующие предъявления решений КУРИЦА и ОРЕЛ стимулируют эксперта назвать еще два значения атрибута "способность летать": "плохая" и "очень хорошая".

Существуют несколько модификаций процедуры выявления полного спектра значений. Самая простая из них предполагает, что названия решений ограничиваются ролью стимулов, позволяющих припомнить другие значения атрибута. В более сложных модификациях эксперту дополнительно предлагается связать с решениями одно или несколько значений атрибута, аналогично тому, как это имеет место для решений исходной тройки. В последнем случае удается построить более полный фрагмент семантической сети, однако при этом усложняется задача эксперта, что не всегда оправдано.

Сценарий извлечения знаний методом репертуарных решеток состоит в последовательном предъявлении эксперту однотипных заданий, различающихся лишь тройками решений.

5.1.1 Свойства метода репертуарных решеток

При ближайшем рассмотрении, метод репертуарных решеток представляется идеально сбалансированным. С одной стороны, в распоряжении эксперта имеются всего три варианта разбиения, и их перебор не превращается в проблему. А с другой стороны, в распоряжении эксперта имеются целых три варианта разбиения, что обеспечивает ему достаточную свободу для выбора самого естественного разделяющего атрибута. В свою очередь, требование сходства двух решений, во-первых, ограничивает область поиска подходящего атрибута, а, во-вторых, придает размышлениям эксперта конструктивное начало.

Еще одно достоинство метода репертуарных решеток связано с особенностями атрибутов, отражающих качественные характеристики решений. За каждым таким атрибутом стоит явное или неявное соглашение о том, какие проявления качества следует считать одинаковыми, а какие - различными. И только эксперт, исходя из особенностей задачи, имеет право сводить различные проявления качества к одному значению. Например, с позиций задачи распознавания овощей важным является контраст цветов (зеленый, красный, фиолетовый и т.д.), поэтому все оттенки, скажем, зеленого цвета сводятся к одному значению. В том же случае, когда речь идет об особенностях развития растений, существенную роль играют как раз оттенки окраски листьев (темно-зеленая, светло-зеленая и т.д.). Легко заметить, что установка метода репертуарных решеток на поиск сходства и различия буквально подсказывает эксперту подход к построению шкалы значений для атрибутов, отражающих качественные характеристики.

Формальным недостатком метода репертуарных решеток является отсутствие универсальности. Если, например, множество решений составляют понятия: СТОЛ, КРЕСЛО, ШКАФ и КРОВАТЬ, то метод не позволит выявить атрибут "предназначен(а) для" со значениями "работы", "отдыха", "хранения" и "сна". В случаях такого рода между множеством значений атрибута и множеством решений существует взаимно-однозначное соответствие, а значит ни одна пара решений не может быть сходна по этому атрибуту. В дальнейшем атрибуты такого рода будем называть классифицирующими.

Другие недостатки метода репертуарных решеток носят более специфический характер. Так, замечено, что в некоторых случаях формально составленная тройка решений раздражает эксперта своей бессмысленностью. В связи с этим возникает потребность в предварительной фильтрации троек, которая бы обеспечила сопоставимость решений. Еще одна проблема метода связана с невербализованным характером личных знаний: поскольку от эксперта требуются точные и даже структурированные формулировки ответов, то надеяться на выявление его сокровенных знаний особенно не приходится.

В различных АСИЗ [52] накоплен значительный арсенал средств, развивающих его возможности. В частности, для выявления классифицирующих атрибутов предлагается помимо троек решений предъявлять эксперту пары решений с установкой на поиск либо отношения сходства, либо отношения различия. Ясно, что чаще всего когнитолога интересуют различающие атрибута, однако явная установка на поиск различия создает у эксперта чувство дискомфорта. Для предварительной фильтрации троек весьма полезной оказывается родо-видовая классификация решений, которая позволяет развести несопоставимые решения по разным ветвям иерархии [1].

5.1.2 Игровой подход к реализации метода репертуарных решеток

Серьезным недостатком опроса по методу репертуарных решеток является его монотонность: эксперту приходится многократно выполнять одно и тоже задание для разных троек решений. Идея игровой реализации сценария извлечения знаний [35] состоит в разделении этапов принятия решений и их документирования.

На этапе принятия решений программа последовательно предъявляет эксперту различные тройки. Задача эксперта состоит в том, чтобы разбить решения каждой тройки на два класса, содержащих соответственно одно контрастное и два сходных решения.

Подчеркнем, что на этапе принятия решений задача эксперта состоит только в том, чтобы разбивать тройки. В программной реализации этого этапа весь спектр действий эксперта исчерпывается нажатием одной из трех клавиш. Таким образом, несмотря на то, что этап представляет собой повторяющуюся последовательность одинаковых заданий, исключительная простота ожидаемых действий эксперта позволяет придать этапу необходимый динамизм.

На этапе документирования эксперт "озвучивает" ранее сделанные разбиения. Документирование состоит в том, что эксперту предлагается по заданному разбиению некоторой тройки решений построить (ввести с клавиатуры) атрибут и множество его значений. Фактически, эксперт должен обосновать свои действия на предыдущем этапе. Отталкиваясь от заданного разбиения тройки решений, эксперт с помощью процедуры выявления полного спектра значений (п. 5.1.1) имеет возможность построить атрибут, характеризующий более широкое множество решений. Следовательно, каждый вновь построенный атрибут может сделать (формально) излишним документирование некоторых еще нерассмотренных разбиений. При этом программа различает варианты полного и частичного объяснения. Считается, что атрибут полностью объясняет разбиение, если с его помощью можно построить все три бинарных связи сходства и различия, определяющих заданное разбиение. Игровая задача эксперта состоит в том, чтобы построить на втором этапе минимальное количество атрибутов.

Остановимся на подходах к организации управляющей стратегии сценария извлечения знаний.

Первый подход исходит из того, что конечная цель извлечения знаний состоит в построении базы знаний для распознавания решений. В этом случае очередная тройка решений выбирается из формальных соображений, дополненных эвристическим алгоритмом выбора наилучшего продолжения при наличии нескольких равноценных вариантов.

Второй подход к организации управляющей стратегии состоит в том, что очередная тройка составляется из пары сходных решений, полученных на предыдущем шаге, и одного нового решения. В этом случае, процесс смены заданий выглядит для эксперта совершенно логично.

Развлекательный характер описанной модификации метода репертуарных решеток позволяет повысить эффективность процесса извлечения знаний. При такой организации диалога эксперт (в пределах своего терпения) успевает проанализировать гораздо большее количество троек, чем в случае параллельного выполнения этапов. Кроме того, определенное смещение акцентов в сторону компьютерных игр позволяет снять у эксперта излишнее напряжение, связанное с боязнью допустить ошибку.

5.2 Языки образов для построения сценариев извлечения знаний

Самую большую проблему сопоставления решений, как метода извлечения знаний, составляет необходимость объяснять эксперту свойства искомого отношения. В методе репертуарных решеток эта проблема "выносится за скобки", поскольку свойства отношения "сходства-двух-и-отличия-от-третьего" объясняются эксперту один раз и в дальнейшем не изменятся. Вместе с тем в ходе построения базы знаний знаний могут появиться вопросы по разбору вполне конкретных, но нетривиальных ситуаций сопоставления с новыми свойствами отношения и (возможно) с частично указанными ролями решений. Однако, любые попытки объяснить эксперту новое задание таят в себе реальную угрозу быть неверно понятым.

Идеальным средством передачи сообщений является рисунок, способный экономно выразить достаточно сложную мысль. Один из способов применения зрительных образов в инженерии знаний предполагает, что когнитолог и эксперт принимают соглашения об использовании рисунков. В результате участники договора получают в свое распоряжение мощный язык образов, позволяющий точно формулировать весьма непростые вопросы и ответы. Применение языка образов оказывается особенно эффективным в сочетании с возможностями компьютерной графики. Рассмотрим один из таких языков [2,63], расширяющий в определенном смысле выразительные возможности метода репертуарных решеток.

В соответствии с соглашениями языка решения представляются яхтами, а атрибуты - мостами. Пролеты моста символизируют значения атрибута. Каждый пролет имеет определенную длину, которая позволяет разместить под ним строго определенное количество яхт. В иной интерпретации рисунков речь идет об одновременной проводке яхт под теми или иными пролетами моста. Графические образы снабжены специальными окнами для размещения названий. Если надпись в окне отсутствует, то графический образ считается безымянным. Ситуация, когда яхта располагается под одним из пролетов моста, означает, что данное решение характеризуется значениям атрибута, указанным на пролете. Некоторые яхты могут находиться вне моста, и их разрешается перемещать по экрану. Перемещение объекта по экрану реализуется аналогично тому, как это делается в системе Windows для изменения позиции пиктограммы.

Вопрос когнитолога воспроизводит в форме рисунка некоторую ситуацию сопоставления, в которой участвуют яхты и мост с пролетами. Задача эксперта состоит в том, чтобы поместить яхты под пролетами моста и дать названия безымянным элементам рисунка.

На языке яхт и мостов вопрос метода репертуарных решеток выглядит как безымянный мост с двумя безымянными пролетами и три яхты, находящиеся вне моста. Причем длины пролетов позволяют разместить соответственно одну и две яхты.

Пример.
Вопрос метода репертуарных решеток для примера 5.1 можно представить в виде следующего (упрощенного) рисунка:

Ответ эксперта, словесная формулировка которого также приведена в примере 5.1, состоит в преобразовании этого рисунка к виду:

Аналогично, на языке яхт и мостов запрос на выявление либо отношения сходства, либо отношения различия для пары решений (п. 5.1.1) выглядит как безымянный мост с двумя безымянными пролетами и две яхты, находящиеся вне моста. Также как и в методе репертуарных решеток длины пролетов позволяют разместить соответственно одну и две яхты.

Язык яхт и мостов позволяет сформулировать и более сложные задания типа: "Назовите значения некоторого атрибута, позволяющие (1) различить решения <s₁> и <s₂> и (2) подтвердить либо сходство решений <s₁> и <s₃>, либо сходство решений <s₂> и <s₃>".

В общем случае словесные формулировки вопросов, в которых фигурируют четыре и более решений, пониманию практически не поддаются. В то же время язык образов позволяет достаточно просто воспроизводить ситуации сопоставления такого рода. Вместе с тем, отдавая дань языкам образов, необходимо понимать, что они не являются панацеей. В некоторых случаях образ может оказать негативное влияние на процесс извлечения знаний [11].

5.3 Метод ролевых диалогов для построения сценариев извлечения знаний

Ролевой диалог представляет собой один из способов реализации в АСИЗ принципа сопоставления решений. Главная особенность ролевого диалога состоит в том, что он апеллирует, прежде всего, к актерским способностям эксперта.

Ролевой диалог соотносит профессиональное умение эксперта с некоторой общеизвестной сферой деятельности. Совмещение глобальных контекстов двух видов деятельности:
— позволяет АСИЗ "заимствовать" общеизвестную терминологию для формулировки заданий эксперту;
— придает диалогу с экспертом эмоциональную окраску;
— позволяет реализовать понятную эксперту управляющую стратегию сценария извлечения знаний.

В реализации и применении ролевых диалогов необходимо учитывать особенности проблемной области и способа представления знаний. Один из вариантов ролевого диалога - сценарий "Рекламный агент" - впервые был реализован в системе ЭСКИЗ [1,63]. Этот сценарий предназначен для выявления знаний о задачах выбора.

5.3.1 Задачи выбора

Задача выбора - это задача выбора наилучшего решения из числа заданных. Как правило, задачи такого рода возникают в качестве подзадач при моделировании более сложных рассуждений. В процессе рассуждений существенную роль играют сравнительные оценки решений с точки зрения того или иного критерия предпочтения. Например, в деловых поездках самолет, как средство передвижения, имеет преимущество перед поездом с точки зрения затрат времени. В то же время поезд выглядит предпочтительнее по критерию денежных затрат.

Приведем формальную постановку задачи выбора. Базовыми понятиями в этой задаче являются
множество решений S = { s_i | i=1, ..., N } и
множество критериев C = { c_j | j=1, ..., M }.

Каждый критерий c_j представляет собой тройку < Att_j, Val_j, f_j >, где
(а) Att_j - имя критерия;
(б) Val_j - упорядоченное множество { v_j1, ..., v_jn(j) } значений критерия;
(в) f_j - функция оценки решений S → Val_j.

В сущности критерий есть атрибут с упорядоченной шкалой значений. Дополнительно для каждого решения s ∈ S известны его оценки f_j(s) с точки зрения всех критериев c_j. Для упрощения выкладок будем отождествлять значение атрибута v_jm с его номером m в упорядоченной шкале значений Val_j = { v_j1, ..., v_jm, ... }.

Пусть c = < Att, Val, f > - критерий и v ∈ Val - некоторое его значение. Обозначим

S(c,v) = { s ∈ S | v ≤ f(s) }. Множество S(c,v) образуют решения, удовлетворяющие заданному ограничению по критерию c.

Задача 5.2 (Задача выбора)
Дано. (1) Линейно упорядоченное подмножество критериев

C'= { c'₁, ..., c'_K } из C. (2) Для каждого критерия c'_j = < Att'_j, Val'_j, f'_j > задано значение критерия v'_j ∈ Val'_j.
Требуется. Найти непустое множество

	m
S' =	∩	S(c'_j, v'_j) ,
	j = 1

соответствующее максимальному номеру m (1 ≤ m ≤ K).

Линейный порядок на множестве C' задает относительную важность критериев с точки зрения пользователя. Требование максимизировать число m фактически определяет способ вычисления псевдорешения задачи выбора в случае противоречивых ограничений, для которых

K
∩	S(c'_j, v'_j) = ∅.
j = 1

В общем случае ||S'|| ≥ 1. Конечно, в практических приложениях пользователя прежде всего интересует одно решение из множества S', и для этого задаются некоторые дополнительные процедуры фильтрации множества S'. В частности, роль дополнительного фильтра могут выполнять ограничения на свойства решений, то есть ограничения на спектр допустимых значений атрибутов. В настоящем изложении эти процедуры не рассматриваются, поскольку наша главная цель состоит в описании сценария опроса эксперта с целью формирования множества критериев.

С целью описания управляющей стратегии определим для заданного множества критериев C ряд предикатов, характеризующих решения из S. При этом будем полагать известными четыре числа p_н, p_к, q_н, q_к ( 0 ≤ p_н < p_н ≤ 1 , 0 ≤ q_н < q_к ≤ 1 ), которые следует рассматривать как константы.

Пусть s ∈ S - некоторое решение. Положим

	\|\|{ < Att, Val, f > ∈ C \| 0.5\|\|Val\|\| < f(s) }\|\|
n(s) =
	\|\|С\|\|

- доля "попаданий" решения s в "правую" половину шкалы значений.
Определим следующие предикаты:

ПЛОХОЙ(C,s)	, если n(s) ≤ p_н,
СРЕДНИЙ(C,s)	, если p_н < n(s) < p_к,
ХОРОШИЙ(C,s)	, если p_к ≤ n(s).

Решения s и s' будем называть различными и обозначать этот факт РАЗЛИЧНЫ(C,s,s'), если для некоторого критерия из C имеет место неравенство f(s) ≠ f(s').

Пусть s и s' - пара решений из S. Определим

(а) d(s,s') = ||{ < Att, Val, f > ∈ C | f(s) > f(s') }||

- количество критериев, по которым решение s имеет более высокую оценку, чем решение s';

(б) d(s,s') - d(s',s)

k(s,s') =

||C||

- показатель общего "превосходства" решения s над решением s'.

Очевидно, что |k(s,s')||C|| ≤ 1, причем равенство k(s,s') = 1 означает полное превосходство решения s над решением s'; равенство k(s,s') = 0 можно интерпретировать как суммарный паритет решений s и s'.

Определим следующие предикаты:

ПРЕВОСХОДИТ(С,s,s')	, если q_к ≤ k(s,s'),
РАВНОЦЕННЫ(С,s,s')	, если \|k(s,s')\| ≤ q_н.

Отметим, что описанные предикаты характеризуют не только решения из S, но и само множество критериев C.

5.3.2 Сценарий извлечения знаний "Рекламный агент"

Извлечение знаний посредством ролевого диалога предполагает кардинальное изменение терминологии общения. В сценарии "Рекламный агент" решения именуются товарами, эксперт - рекламным агентом. Роль без слов принадлежит конкуренту, с ним хоть и нельзя общаться, но приходится считаться. Сценарий в значительной степени ориентирован на программную реализацию, когда роль покупателя товаров отводится системе извлечения знаний.

Сеанс извлечения начинается с того, что все товары - множество решений S - разбиваются на две группы:
S_A - товары рекламного агента;
S_K - товары воображаемого конкурента.
По результатам разбиения у рекламного агента появляется совершенно конкретная цель: обставить конкурента и продать покупателю свои товары. Покупатель же, согласно распределению ролей, попался весьма привередливый, он то склоняется к покупке, то начинает сомневаться и требовать новых объяснений. Учитывая изменение терминологии, построенные ранее предикаты приобретают смысл показателей качества товаров.

Если к началу диалога система еще не располагает критериями, то рекламному агенту предлагается сообщить некоторые преимущества своих товаров. При этом его деятельность направляется вопросами типа: "А чем Ваш товар <s> лучше товара <s> Ваших конкурентов?" (В данном случае имеет место сопоставление решений s и s'.) Отвечая на вопросы заинтересованного покупателя, рекламный агент должен построить один или несколько критериев оценки товаров-решений.

По завершении подготовительных этапов покупателю известны: разбиение товаров - множества S_A и S_K, а также начальное множество критериев С, опираясь на которое, он уже может "рассуждать".

Основной цикл опроса состоит в том, что покупатель предъявляет рекламному агенту описание очередной сомнительной ситуации и предлагает ввести новую информацию, позволяющую снять эти сомнения. Сценарий предусматривает два типа ситуаций такого рода: ситуации сопоставления и ситуации пополнения.

Независимо от конкретной формулировки ситуация сопоставления содержит
(1) наименования двух товаров;
(2) описание некоторого дефекта существующей совокупности критериев;
(3) меню реплик, предусматривающих пути устранения указанного дефекта. Смысл одной из реплик состоит в том, что рекламный агент фактически отказывается от ответа.

С точки зрения покупателя каждая пара товаров s и s' способна выявить до шести различных дефектов. Выбор конкретного дефекта определяется управляющей стратегией сценария - эвристическим алгоритмом рассуждений "за покупателя".

Приведем содержательную интерпретацию дефектов, мотивирующую обращение покупателя к рекламному агенту за разъяснениями.

Дефект 1. Зачем выпускаются одинаковые, но различные по наименованию товары s и s'?

Дефект 2. Зачем конкуренты выпускают товар s', если рекламируемый товар s явно лучше?

Дефект 3. Зачем агент рекламирует товар s, который уступает товару s' его конкурентов?

Дефект 4. Зачем рекламировать и выпускать практически равноценные товары s и s'?

Дефект 5. Зачем агент рекламирует товар s', когда его же товар s явно лучше?

Дефект 6. Зачем конкуренты производят товар s',если они выпускают более качественный товар s?

Для устранения перечисленных дефектов рекламный агент должен, как правило, сообщить покупателю новый критерий оценки товаров < Att, Val, f >. Если эксперт принимает правила игры, то, в зависимости от типа дефекта, можно заранее предсказать формальные свойства этого критерия.

Дефект	Свойство критерия
1, 4	f(s) < f(s') или f(s) > f(s')
2, 5, 6	f(s) < f(s')
3	f(s) > f(s')

Дополнительно дефект 1 предусматривает реплику, которая позволяет построить атрибут, характеризующий свойства решений.

В общем случае, неравенство типа f(s) < f(s') можно предварить двумя репликами. Первая из них предлагает указать недостаток товара s, а вторая - достоинство товара s'.

Заметим, что приведенная управляющая стратегия является упрощенной. Так, в ситуации

{s,s'} ⊂ S_K и РАВНОЦЕННЫ(C,s,s') запрашивать критерий оценки товаров s и s' нежелательно, так как у рекламного агента может сложиться впечатление, что покупатель склоняется к выбору товаров конкурента.

Важнейшей чертой ролевого диалога является применение в ходе опроса эмоционально окрашенных формулировок. При определенном минимуме фантазии можно придумать большое количество недоумевающих вопросов покупателя, основанных на текущем составе множества критериев. Так, в системе ЭСКИЗ предусмотрены до 40 различных эмоционально окрашенных вопросов. Такой подход позволяет придать диалогу несколько необычную и привлекательную форму.

Пример 5.3
Приведем полную формулировку одного из запросов покупателя (дефект 3).

    За кого Вы меня принимаете?
    Я не из тех, кому можно сбыть некачественный товар!
    Судите сами: товар  Ваших   конкурентов < s' >
                 имеет массу преимуществ по
                 сравнению  с Вашим товаром < s > !
    Ваш ответ:
   -1- Вы еще не знаете главных достоинств моего товара ...
   -2- Я Вам расскажу о товаре конкурентов такое ...
   -3- Вы не учитываете, что достоинства моего товара важнее.

В данном примере реплики -1- и -2- подразумевают последующий ввод нового критерия. Реплика -3- позволяет отказаться от ответа.

По сути дела, все шесть дефектов воспроизводят ситуацию сопоставления двух товаров-решений. При этом в формулировках вопросов используется лексика примитивных рыночных отношений. Вместе с тем, логика условного мира купли-продажи приводит к появлению новых ситуаций, выходящих за рамки сопоставления. Речь идет о ситуациях пополнения, которые содержат

(1) наименование только одного товара;

(2) характеристику этого товара на основе существующей в данный момент совокупности критериев;

(3) формулировку одного из трех заданий:
  (а) указать главное преимущество товара;
  (б) указать существенный недостаток товара;
  (в) указать определяющее свойство товара.

Так же, как при сопоставлении товаров, рекламному агенту предлагаются на выбор варианты реплик, одна из которых позволяет уклониться от ответа.

Выбор конкретного варианта задания в первую очередь определяется свойствами товара s.

Если ХОРОШИЙ(C,s), то	покупатель считает, что товар слишком хорош и выбирает вариант (б).
Если ПЛОХОЙ(C,s), то	покупатель считает, что товар слишком плох и выбирает вариант (а).
Если СРЕДНИЙ(C,s), то	выбирается вариант (в).

Если ХОРОШИЙ(C,s), то покупатель считает, что товар слишком хорош и выбирает вариант (б). Если ПЛОХОЙ(C,s), то покупатель считает, что товар слишком плох и выбирает вариант (а). Если СРЕДНИЙ(C,s), то выбирается вариант (в).

Варианты задания (а) и (б) рассчитаны на последующий ввод критерия. Вариант (в), кроме того, позволяет построить атрибут, описывающий свойство товара.

Пример 5.4
Приведем одну из формулировок запроса, основанного на ситуации пополнения, вариант (а).

    На  что рассчитывают Ваши конкуренты, выпуская товар < s >?
    Попробуйте припомнить достоинства этого товара, и я буду
    уверен в Вашей объективности.
    Ваш ответ:
   -1- Действительно, следует признать одно полезное качество
       этого товара...
   -2- Мне трудно говорить об этом хламе!

Аналогично запросам, основанным на сопоставлении товаров, содержание реплики предопределяет оценку товара. Так, в примере 5.4 реплика -1- предполагает ввод критерия < Att, Val, f > такого, что 0.5||Val|| < f(s). В то же время в примере 5.3 реплики -1- и -2- предворяют ввод критерия, для которого f(s) > f(s'). Получается, что рекламный агент отвечает как бы дважды. Сначала он просто заявляет о своих намерениях, а затем реализует их в форме критерия. Сверяя согласованность двух ответов, когнитолог, как режиссер постановки, способен оценить насколько эксперт вжился в роль рекламного агента. В конечном итоге, дублирование ответов позволяет судить о применимости сценария в конкретных условиях извлечения знаний.

В программной реализации сценария "Рекламный агент" предусмотрены три причины окончания основного цикла опроса:

(1) диалог прекращается по инициативе эксперта;

(2) система прекращает опрос, когда эксперт уклоняется от разбора проблемных ситуаций R раз подряд, где R - параметр метода;

(3) система прекращает опрос ввиду нарушения баланса достоинств двух групп товаров.

Баланс достоинств отслеживается с помощью специального счетчика B, который в начале сеанса извлечения знаний полагается равным 0. Счетчик может изменять свое значение по итогам очередного опроса.

Если (1) в запросе покупателя были задействованы товары
s и s', принадлежащие разным подмножествам S_A и S_K,

и (2) в результате запроса множество C пополнилось новыми критериями,

и (3) имеет место ПРЕВОСХОДИТ(C,s,s'),

то положить

Баланс считается нарушенным, если B > B_max, где B_max - параметр метода извлечения знаний. Как правило, нарушение баланса происходит, когда эксперт слишком увлекается ролью рекламного агента, всячески подчеркивая достоинства "своих" товаров в ущерб товарам конкурента. В связи с этим при нарушении баланса имеет смысл по-новому перераспределить товары на две группы и продолжить опрос.

Поведение системы извлечения знаний в значительной степени регламентируется значениями параметров. В принципе, вопрос настройки сценария относится целиком к компетенции когнитолога. Вместе с тем, проведенные эксперименты позволяют рекомендовать следующие значения параметров:

p_н = 0.33, p_к = 0.5, q_н = 0.2, q_к = 0.5, R = 3, B_max = 3.

Применимость сценария "Рекламный агент" определяется прежде всего природой решений. Очевидное ограничение общего порядка состоит в том, что каждое решение должно быть связано с некоторым существительным с именительном падеже. Другое, количественное ограничение предполагает наличие в множестве решений не менее трех элементов.

5.4 Комбинированные сценарии извлечения знаний

До сих пор сопоставление решений рассматривалось, как принцип реализации АСИЗ, ориентированных на построение самостоятельных баз знаний. Однако в сложных формализмах представления знаний сопоставление решений может использоваться как метод формирования отдельных компонент общей базы знаний. В полной мере это положение иллюстрирует задача синтеза, так называемых, схем управления, в которой применяются методы индуктивного вывода в сочетании с опросом эксперта, построенного на принципах заочной консультации и сопоставления решений.

Схема управления - это особый формализм для представления процедуральных знаний в признаковых моделях проблемных областей. В настоящем разделе рассматривается упрощенная версия этого формализма, достаточная для изложения сценария извлечения знаний.

При синтезе схемы управления центральное место отводится приемам грамматического вывода, позволяющим восстановить ее структуру в виде некоторого конечного автомата. На этапе выявления атрибутов эта диаграмма гарантирует, в частности, сопоставимость решений. В задачах управления в качестве решений используются действия - элементарные составляющие схемы.

5.4.1 Задачи управления

Будем рассматривать множество атрибутов { Att_i | i=1, ..., N }, каждому из которых сопоставлено множество значений Val_i.

Определение.
Классом проблемных ситуаций (или просто - классом ситуаций) будем называть множество

Sit = { Att_i : V_i | V_i ⊂ Val_i; i=1, ..., N }.

Классы ситуаций можно использовать для задания некоторых ограничений.

Определение.
Пусть Sit' = { Att_i : V'_i | i=1, ..., N } и Sit" = { Att_i : V"_i | i=1, ..., N } - два класса ситуаций. Будем говорить, что класс Sit' удовлетворяет условию Sit", если V'_i ⊂ V"_i для любого атрибута Att_i.

Базовым понятием схем управления является понятие действия.

Определение.
Действием называется тройка , где
(а) Name - имя действия;
(б) Pred - предусловие действия, суть - класс ситуаций;
(в) Post - постусловие действия, суть - подмножество некоторого класса ситуаций.

В качестве имен действий обычно используются предложения, содержащие глагол в повелительном наклонении.

Выполнение действия < a, Pred, Post > заключается в преобразовании так называемой текущей ситуации SIT. Формально SIT представляет собой описание некоторого класса ситуаций. Выполнение действия состоит из трех шагов.

Шаг 1. Если SIT удовлетворяет условию Pred, то перейти к шагу 2. В противном случае действие считается неприменимым и его выполнение заканчивается с сообщением НЕУСПЕХ.
Шаг 2. Сформировать некоторое множество

Post' = { A : V' | A : V ∈ Post; V' ⊂ V }. Шаг 3. Преобразовать текущую ситуацию: SIT = { A : V ∈ SIT | A ∉ Att(Post) } ∪ Post', где Att(Post) = { A | A : V ∈ Post }, и закончить выполнение действия с сообщением УСПЕХ.

Вычисления на шаге 2 формальной моделью не регламентируется и зависят от конкретной реализации формального аппарата схем управления. В общем случае с каждым действием связывается процедура его выполнения. Например, это может быть интерактивная программа опроса, с помощью которой формируется множество Post'. Таким образом, результат применения действия во многом определяется внешними обстоятельствами, причем в определении действия фиксируются лишь допустимые пределы изменения текущей ситуации.

Исключение из общего правила составляют два специальных действия со стандартными именами s и f. Действие s состоит в том, что текущая ситуация SIT полагается равной

{ Att_i : Val_i | i=1, ..., N }. Действие f реализует набор некоторых завершающих операций, типа оператора RETURN языка ФОРТРАН.

Определение 5.5
Схемой управления называется сеть , в которой в качестве меток ребер используются действия, причем все ребра, исходящие из входного плюса p, помечены действием s, а все ребра, входящие в q, помечены действием f.

Неформально, схема управления содержит экспертные знания об осмысленных последовательностях действий.

Пример 5.6
Приведем схему управления для задачи борьбы с утечками химических веществ [30].

Для краткости класс ситуаций Pred будем задавать в виде подмножества

Pred' = Pred \ { Att_i : Val_i | i=1, ..., N }

	Имя действия	Pred'	Post
d1	Определить наличие утечки		Утечка : { Имеется, Отсутствует }
d2	Определить вытекающее вещество	Утечка : { Имеется }	Вещество : { Кислота, Щелочь, Нефтепродукт } Опасность вещества : { Малая, Средняя, Большая }
d3	Оповестить население	Опасность вещества : { Средняя, Большая }
d4	Запретить оповещение	Опасность вещества : { Малая }
d5	Определить источник утечки
d6	Устранить причину утечки
d7	Применить нейтрализующие	Вещество : { Нефтепродукт }
d8	Применить адсорбирующие вещества	Вещество : { Кислота, Щелочь }
d9	Проверить ситуацию
f		Утечка : { Отсутствует }

Для задач управления определим аналог машины вывода - процедуру интерпретации заданной схемы < M, W, p, q >. На каждом такте своей работы процедура имеет дело с некоторой вершиной m из M и текущей ситуацией SIT.

Интерпретация начинается при m = p.

В общем случае, для известной вершине m (m ≠ q) процедура интерпретации выполняется в два этапа:
(1) помещает в стек все ребра, исходящие из вершины m;
(2) извлекает из стека очередное ребро (m',m")_d и предпринимает попытку выполнить действие d. Если эта попытка заканчивается сообщением:
— УСПЕХ, то в качестве следующей вершины m полагается вершина m";
— НЕУСПЕХ, то повторяется этап (2).

Интерпретация считается законченной, если m = q, либо в том случае, когда стек оказывается пустым.

Заметим, что более сложные варианты интерпретации схем реализованы в системе АФОРИЗМ [3,63].

Интерпретация схемы управления предпринимается главным образом ради побочных эффектов действий. В связи с этим формальным результатом интерпретации следует считать последовательность успешно выполненных действий.

5.4.2 Интерактивная процедура синтеза схем управления

Согласно определению 5.5, схему управления < M, W, p, q > можно рассматривать как некоторый конечный автомат [4] с начальным состоянием p и единственным заключительным состоянием q. В качестве (абстрактного) алфавита входных символов автомат использует множество действий. Известно [4], что класс языков, порождаемых конечными автоматами, совпадает с классом регулярных языков. Известны также процедуры преобразования праволинейных грамматик в эквивалентные конечные автоматы и обратно. Таким образом, учитывая результаты главы IV, схему управления можно синтезировать по некоторому множеству примеров применения. При этом необходимо обеспечить решение ряда специфических проблем.

Приведем основные этапы процедуры извлечения знаний, предназначенной для построения схем управления. Процедура ориентирована на диалог с экспертом и состоит из четырех этапов.

Метод 5.7 (Синтез схемы управления)
Этап 1. Сформировать в диалоге с экспертом множество цепочек Ω. Каждая цепочка должна быть примером осмысленной последовательности действий, представленных своими именами.
Этап 2. Рассматривая имена действий как терминальные символы, построить с помощью метода 4.18 множество решающих праволинейных грамматик G.
Этап 3. Выбрать из множества G наилучшую грамматику и построить для нее конечный автомат.
Этап 4. Выявить пред- и постусловия действий и завершить таким образом преобразование конечного автомата в искомую схему управления.

В действительности метод 5.7 имеет более сложную организацию, в нем предусмотрены возвраты и циклические повторения ряда этапов. Кроме того, с целью экономии запросов к эксперту метод сохраняет и использует все его ответы. Однако в настоящем изложении нас интересуют не столько вопросы практической реализации, сколько возможность построить метод синтеза схем управления на принципах АСИЗ. Именно с этой точки зрения и рассмотрим основные этапы метода.

На первом этапе от эксперта требуется сообщать имена действий в контексте некоторых их последовательностей, что соответствует припоминанию конкретных проблемных ситуаций. Такого рода задание не представляет для эксперта особых затруднений и реализуется как заполнение именами действий шаблона, состоящего из линейной последовательности слотов. Согласно определению 5.5, каждая последовательность начинается действием s и заканчивается действием f. Время от времени необходимо проводить унификацию и систематизацию построенных имен, а также коррекцию накопленных примеров.

С точки зрения задачи грамматического вывода на первом этапе эксперт выступает в роли источника предложений некоторого регулярного языка. Как следует из теоремы 4.19, для успешного восстановления искомой грамматики (конечного автомата) образец Ω должен содержать все предложения языка источника, длина которых ограничена некоторой константой. Поскольку значение константы заранее неизвестно, то первый этап, вообще говоря, повторяется неоднократно с тем, чтобы внести в образец более длинные последовательности действий. Перечисление возможных последовательностей с заданными ограничениями на их длину представляет собой задачу достаточно утомительную. Для ее облегчения используется специальный прием опроса эксперта и формальная процедура пополнения образца, использующаяся на втором этапе. Эффективный прием, стимулирующий эксперта генерировать новые последовательности ограниченной длины, состоит в том, что ему предлагается построить более короткую последовательность действий по сравнению с заданной. Задание может усложняться дополнительными ограничениями на состав действий в новой последовательности.

На втором этапе синтеза схемы управления применяется метод 4.18 восстановления регулярных грамматик.

Замечание 5.8
Учитывая трудоемкость построения образца, метод 4.18 дополнен процедурой его пополнения новыми последовательностями действий. Процедура рассчитана на случай регулярного языка источника и выполняется отдельно для каждого значения параметра n (см. определений 4.13). Вызов процедуры непосредственно предшествует вычислению базиса Ф_n. Идея пополнения состоит в преобразовании образца Ω к виду

Ω(T₁,T₂) = Ω ∪ { p₂x | x ∈ L(T₁) } ∪ { p₁x | x ∈ L(T₂) }, где T₁ = T({p₁},Ω) и T₂ = T({p₂},Ω) - p-элементы сети T = TRL(Ω) такие, что T₁ ≈_n T₂. (Согласно определению 4.16 входной полюс каждого p-элемента сети TRL(Ω) есть множество, содержащее ровно одну цепочку.)

Пример 5.9
Ω = {saaf, sabaf, sabcaf, sbaf, sbbaf, sbbcbf}. T = TRL(Ω) есть

При n = 1, T₁ = T({sa},Ω) ≈_n T({sb},Ω} = T₂ и Ω(T₁,T₂) = Ω ∪ {sbbcaf, sabcbf}.

Теоретическим основанием процедуры пополнения образца служит очевидная

Лемма 5.10
Пусть Ω ⊂ L(G_н,v), n = E(G_н,v) и T₁ ≈_n П(t_A,n,n) ≈_n T₂ для некоторого нетерминала A грамматики G_н,v. Тогда Ω(T₁,T₂) ⊂ L(G_н,v). (В формулировке леммы используются обозначения из раздела 4.4.1.)

В связи с тем, что корректное пополнение обусловлено достаточно жесткими условиями применимости, пользоваться этой процедурой следует осторожно. Если позволяют обстоятельства, то каждое пополнение желательно согласовать с экспертом. (Конец замечания 5.8.)

На третьем этапе синтеза схемы управления эксперт должен выбрать одну из грамматик, построенных методом 4.18. Понятно [4], что для регулярных грамматик выбор можно ограничить подмножеством попарно неэквивалентных грамматик. Самый простой, но достаточно плодотворный подход к реализации третьего этапа, состоит в предъявлении эксперту диаграмм конечных автоматов соответствующих различным грамматикам. Расчет при этом строится на том, что графическое представление диаграммы само по себе достаточно наглядно и информативно. По внешнему виду диаграмма конечного автомата не отличается от схемы управления. Различие между ними состоит лишь в формальном определении меток ребер.

В ситуации, когда эксперт затрудняется с непосредственной оценкой диаграмм, ему предлагаются на рассмотрение так называемые различающие последовательности действий. Каждая различающая последовательность x строится по паре регулярных грамматик G₁ и G₂ таким образом, что x ∈ L(G₁) \ L(G₂). Анализируя очередную различающую последовательность с точки зрения ее осмысленности, эксперт может принять одно из двух решений: либо "Последовательность является осмысленной", либо "Последовательность не является осмысленной". В первом случае грамматику G₂ можно исключить из рассмотрения, так как она не обеспечивает универсальность искомой схемы. Во втором случае из рассмотрения исключается грамматика G₁. Теоретически, с помощью различающих последовательностей множество решающих грамматик можно сократить до одного элемента. Анализ различающих последовательностей соответствует принципу заочной консультации (п. 1.4.5).

На четвертом, заключительном этапе синтеза схемы управления эксперт опрашивается с целью выявления пред- и постусловий действий, имена которых были выявлены на первом этапе. С практической точки зрения интерес представляет существенная часть предусловия - подмножество Pred' (см. пример 5.6). Опрос эксперта по выявлению предусловий направляется построенной диаграммой конечного автомата.

Наличие в диаграмме двух и более ребер, исходящих из одной вершины, позволяет поставить перед экспертом вопрос об условиях выбора того или иного действия. В этом случае имеет место типичная ситуация сопоставления (действий) с целью выявления их различий. Объяснения эксперта, сформулированные в форме атрибутов и их значений, позволяют сформировать множества Pred' для некоторых действий.

Наличие в диаграмме линейного участка вида

(m,m')_d(m',m")_d' позволяет поставить перед экспертом вопрос об изменении текущей ситуации действием d, то есть вопрос о постусловии действия d. Заметим однако, что линейный участок может использоваться исключительно для задании порядка выполнения действий. Поэтому при анализе такого рода ситуаций эксперту разрешается уклоняться от прямого ответа на поставленный вопрос.

В целом, атрибуты, перечисленные в предусловиях действий должны встречаться среди элементов постусловий. Исключение составляю лишь те атрибуты, которые используются исключительно для передачи параметров процедурам выполнения действий. Таким образом, процесс построения схемы управления заканчивается, когда эксперт оказывается в состоянии объяснить происхождение и назначение всех атрибутов, упомянутых в описаниях действий.

5.5 Метод доводки имен

Общение экспертной системы с пользователем (п. 3.3.1) основывается на использовании атрибутов и их значений. В конечном счете и атрибуты, и значения представляются пользователю своими именами. Понятно, что имена должны грамотно отражать специфику проблемной области. Исходя из этого, перед экспертом в ходе выявления атрибутов стоит не самая легкая задача параллельного конструирования специальной терминологии. Невербализованный характер личных знаний (п. 1.1) помимо задачи "ЧТО сказать?" ставит перед экспертом задачу "КАК сказать?".

Рано или поздно, большинство АСИЗ предлагают ввести с клавиатуры название некоторого атрибута, а также названия его значений. С точки зрения эксперта, необходимость выдерживать строгий формат фраз представляет собой дополнительное усложнение его задачи. Как правило, к этому моменту эксперт уже понимает ЧТО он должен описать, однако дополнительные ограничения на форму изложения могут негативно сказаться на результатах его работы.

Отметим, что во многих случаях дополнительные сложности могут оказаться несущественными, однако можно без труда привести и обратные примеры. В связи с этим предлагаемый метод доводки имен реализуется как режим HELP общей процедуры выявления полного спектра значений.

Рассмотрим отдельный акт построения атрибута с конечным спектром значений. Чаще всего эксперт затрудняется сформулировать имя атрибута. Простейший выход из такой ситуации состоит в том, чтобы разрешить эксперту ввод значений до того, как будет сформулирован атрибут. Однако и в этом случае поиск подходящего названия атрибута может "застопорить" весь процесс извлечения.

Формально метод доводки имен имеет смысл применять, когда диалог о значениях атрибута уже закончен, а имя атрибута еще не сформулировано. В этом случае на местах значений располагаются некоторые фразы Br₁, ..., Br_N, которые можно рассматривать как заготовки будущих значений. С формальной точки зрения каждая заготовка Br_i представляет собой цепочку символов.

Метод 5.11 (Интерактивный метод доводки имен)
Этап 1. Предложить эксперту сформулировать (ввести с клавиатуры) вопросительное предложение - цепочку Qu - по известным на него ответам Br₁, ..., Br_N.
Этап 2. Предложить эксперту для каждой заготовки Br_i (i=1,...,N) ввести с клавиатуры цепочку Wh_i - ответ на вопрос Qu в полной форме (полный ответ). (Предложение считается полным, если оно содержит подлежащее и сказуемое.)
Этап 3. (выполняется без участия эксперта). Из множества полных ответов {Wh₁, ..., Wh_N} выделить атрибут как неизменную часть полных ответов, и значения атрибута как варьирующую часть соответствующих полных ответов.
Этап 4. Предложить эксперту провести корректировку полученных имен.

Пример 5.12
Предположим,что эксперт построил в качестве заготовок следующие имена:
Br1 = "синего цвета", Br2 = "красного", Br3 = "желтого".
Рассмотрим некоторый протокол доводки имен.

 Этап 1. Qu = "Какого цвета предмет?".
 Этап 2. Wh1 = "Цвет предмета - синий"
         Wh2 = "Цвет предмета - красный"
         Wh3 = "Цвет предмета - желтый"
 Этап 3. Имя атрибута = "Цвет предмета -"
         Значения = {"синий", "красный", "желтый"}.

Первый этап метода 5.11 носит вспомогательный характер. Тем не менее, построенное здесь вопросительное предложение имеет смысл сохранить и использовать, например, в сеансе консультации (см., например, 3.3.1). В том случае, когда искомый атрибут является качественным, в формулировке вопросительного предложения обязательно появится название качества. Это название определяется скорее спецификой проблемной области, чем особенностями языка, что ограничивает возможности применения процессоров естественного языка [19].

На втором этапе метода 5.11 эксперт выполняет несколько раз одно и тоже задание, что располагает его давать однотипные ответы. Полученные на втором этапе ответы представляют собой названия фактов, которые могут, например, использоваться в модулях знаний.

Работу эксперта по формулировке полных ответов можно облегчить с помощью процедуры предсказания, которая способна предложить свой вариант очередного полного ответа - цепочку Wh'_i. При этом эксперту остается лишь исправить предсказанный ответ.

Прежде чем перейти к описанию процедуры предсказания, определим формальный аппарат преобразований для цепочек символов.

Определение.
Преобразованием цепочек (или просто преобразованием) будем называть пару цепочек

α = u₀B₁u₁...B_nu_n и β = v₀B₁v₁...B_nv_n, в которых u₀, ..., u_n, v₀, ..., v_n - цепочки (терминальных) символов, причем u_i ≠ e, v_i ≠ e для i=1,...,n-1; B₁, ..., B_n- спецсимволы, которые можно считать нетерминалами или переменными. Преобразование цепочек будем обозначать < α ==> β >.

С каждым преобразованием р свяжем его оценку

cont(p) = |u₀u₁...u_n |

В связи с преобразованиями цепочек нас будут интересовать процедуры их автоматического порождения и применения. Основу этих процедур составляет операция конструирования единой структуры двух цепочек.

Ранее (см. задачу 4.24) была определена операция построения множества общих структур SV(x,y) для двух цепочек x и y. Напомним, что каждый элемент из SV(x,y) однозначно строится по множеству вершин, составляющих путь максимальной длины в некотором ациклическом графе. Модифицируем эту операцию так, чтобы сократить множество общих структур до одного элемента.

Выберем в ациклическом графе общее множество вершин для всех путей максимальной длины. Этому множеству вершин однозначно соответствуют:
(1) цепочка γ = z₀A₁z₁...A_nz_n, которую в дальнейшем будем называть общей структурой;
(2) множество подстановок A → x_i | y_i ( i = 1, ..., n ) такое, что

z₀x₁z₁...x_nz_n = x и z₀y₁z₁...y_nz_n = y.

Обозначим SVS(x,y) результат вычисления описанной модификации метода решения задачи 4.24. При этом будем считать, что SVS(x,y) представляет собой грамматику

S → γ
A_i → x_i | y_i (i=1,...,n),

в которой зафиксирован порядок перечисления цепочек x_i и y_i. таким образом, что все x_i относятся к цепочке x, а все y_i - к цепочке y.

Отметим, что грамматика SVS(x,y) определена для любой пары цепочек x и y. В случае отсутствия ациклического графа или при пустом множестве общих вершин будем считать, что SVS(x,y) есть A₁ → x | y .

Определение.
Пусть x и y - цепочки, и SVS(x,y) имеет вид:

S → z₀A₁z₁...A_nz_n A_i → x_i | y_i (i=1,...,n).

Определим преобразование born(x,y) следующим образом: < B₀x₁B₁...x_nB_n ==> B₀y₁B₁...y_nB_n > При этом будем считать, что спецсимвол B₀ (B_n) входит в преобразование только в том случае, когда z₀ ≠ e (z_n ≠ e).

Пример.

SVS(красный,красного) : S → краснB₁

B₁ → ый | ого

born(красный,красного) = < B₁ый ==> B₁ого >.

Поскольку предсказанный ответ в дальнейшем предлагается эксперту для корректировки, то имеет смысл несколько расширить область применения преобразований.

Определение 5.13
Пусть x - цепочка терминальных символов, и p = < α ==> β > - преобразование цепочек, в котором α = u₀B₁u₁...B_nu_n. Будем говорить, что преобразование p применимо к цепочке x, если все подстановки из SVS(x,α) имеют вид: A_i → x_i | u'_iB_iu"_i ( i=1, ... ,n ). При этом будем считать, что применимость преобразования измеряется величиной

	n
cost(p,x) =	Σ	\|u'_iu"_i\| .
	i = 1

Очевидно, что cost(p,x) < cont(p), если 0 < cont(p).

Определение 5.13 открывает возможность находить псевдорешения строкового уравнения α = x. Псевдорешение считается существующим, если с помощью процедуры SVS все спецсимволы B_i удается разнести по разным нетерминалам A_i. Согласно определению 5.13, для точного решения уравнения α = x имеет место равенство cost(p,x) = 0. Не ограничивая общности, можно считать, что если преобразование p не применимо к цепочке x, то cost(p,x) = 1000000.

Определение.
Пусть p = < α ==> v₀B₁v₁...B_nv_n > - преобразование, применимое к цепочке x. Определим цепочку apply(p,x) следующим образом: apply(p,x) = v₀x₁v₁...x_nv_n, где x₁,...,x_n - первые цепочки из множества подстановок грамматики SVS(x,α).

Перейдем к непосредственному описанию процедуры предсказания полного ответа Wh'_i (i ≤ N) по известным:
— заготовке Br_i;
— вопросительному предложению Qu;
— полным ответам Wh_j, ранее построенных экспертом для заготовок Br_j( j = 1, ..., i-1 ).

Предварительно определим стандартное преобразование

q = < B₁ ==> Qu B₁ >. Ясно, что cont(q) = 0. Неформально, преобразование q означает такую конструкцию ответа, когда заготовка помещается после вопроса.

Метод 5.14 (Процедура предсказания ответов)
Шаг 1. Построить множество преобразований

Пр₁ = { born(Br_j,Wh_j) | j=1, ..., i-1 } ∪ {q}
Шаг 2. Построить подмножество преобразований

Пр₂ =	argmax	\| cont(p)-cost(p,Br_i) \|
	p ∈ Пр₁

Шаг 3. Построить подмножество преобразований

Пр₃ =	argmin	cost(p,Br_i);
	p ∈ Пр₂

Шаг 4. Построить подмножество преобразований

Пр₄ =	argmax	cost(p);
	p ∈ Пр₃

Шаг 5. Из множества Пр₄ выбрать произвольное преобразование p и положить Wh'_i = apply(p,Br_i).

Преобразование q, которое вносится на шаге 1, демонстрирует самый примитивный подход к построению искомого ответа, однако присутствие именно этого преобразования гарантирует решение поставленной задачи. Шаги 2-4 реализуют построение и выбор из конфликтного множества преобразований. Шаг 2, в частности, позволяет при малейшей возможности исключить из рассмотрения преобразование q. Шаг 3 отдает предпочтение "самым точным" решениям. Шаг 4 при прочих равных выбирает самое частное преобразование. Идеологически метод 5.14 опирается на алгоритм разрешения конфликтов в продукционных системах с исключениями [15]. Особенность данного подхода состоит в расширенной трактовке (см. определение 5.13) применимости преобразований.

Пример.
Рассмотрим применение метода 5.14 при построении полного ответа Wh3 из примера 5.12.

На шаге 1 будет построено множество Пр₁, содержащее два преобразования:
p₁ = < B₁ого ==> Цвет предмета - B₁ый > и
q = < B₁ ==> Какого цвета предмет? B₁ >.

Причем cont(p₁) = 3, cost(p₁,желтого) = 0,

cont(q) = 0, cost(q ,желтого) = 0.

Поэтому Пр₂ = Пр₃ = Пр₄ = {p₁}.
На шаге 5 будет построен ответ:

"Цвет предмета - желтый". (В программной реализации метода 5.11 подчеркнутая часть ответа выделяется окраской букв.)

В целом метод 5.14 дает удовлетворительные результаты для фраз достаточно сложного строения.

Возвращаясь к обсуждению метода 5.11, отметим, что на третьем этапе по множеству полных ответов { Wh₁, ..., Wh_N } строится их общая структура α_N следующим образом:
α_N есть цепочка Wh₁ при N = 1, и
α_N есть общая структура SVS(α_N-1,Wh_N) при N > 1.

При таком подходе значение атрибута представляет собой некоторый набор подстановок в цепочку α_N. Кроме того, в программной реализации метода 5.11 по желанию эксперта имя атрибута может быть сформировано как общий префикс цепочек Wh₁, ..., Wh_N.

Программная реализация метода доводки имен обладает одним уникальным свойством. Известно, что многие люди предпочитают скрывать черновую работу по поиску формулировок. В этих обстоятельствах помощь неодушевленного компьютера выглядит предпочтительнее посреднических услуг когнитолога.

Написать автору

К следующей главе