Стартовая страница G l o s s a r y   C o m m a n d e r

Служба тематических толковых словарей

glossary.ru
park.glossary.ru
Служебная библиотека
 н а  п р а в а х  р е к л а м ы 

 Теория: 1  | 2  | 3  | 4  | 5  | 6  | 7  | 8  | 9  | 10  | 11  | 12
 

М.Г.Мальковский, С.Ю.Соловьев

СТРУКТУРНЫЙ    МЕТОД    ФОРМИРОВАНИЯ    ЗАПРОСОВ
К    ИНФОРМАЦИОННОЙ    СИСТЕМЕ

доклад на международной конференции ДИАЛОГ'2004
"Компьютерная лингвистика и интеллектуальные технологии",
"Верхневолжский", июнь 2004.   >>  Точная ссылка



Все современные пользователи Интернет знают, что без поисковых систем обойтись нельзя, но работа с ними требует терпения и везения. В нашем случае под везением понимается быстрый выход на такое специфическое слово или словосочетание, которое выделит из океана документов ровно те, что хочется видеть. При этом наибольшую сложность представляет необходимость изложить поисковый запрос на "чистой" станице, любезно предоставленной Яндекс-ом или иной информационно-поисковой системой.

Альтернативный, хотя и ограниченный по охвату проблемных областей подход к формированию запросов предложен в проекте www.glossary.ru, реализующим концепцию универсального терминологического пространства (УТП) [1,2]. УТП есть семантическая сеть, вершинами которой являются термины научной и деловой лексики, связанные бинарными отношениями (ребрами) типа "это-есть" и "относится-к". В общем случае вершина семантической сети задается термином, его синонимами, его определением и семантическими связями с вершинами более высокого уровня абстракции.

Семантическая сеть обеспечивает пользователям навигацию в терминологическом пространстве. Кроме того, семантическая сеть позволяет выполнять "интеллектуальные" преобразования терминологии, возникающие при формировании глоссариев.

Каждую вершину семантической сети можно рассматривать как потенциальный запрос, передающий информационно-поисковой системе термин-словосочетание. Такие потенциальные запросы активизируются пользователем по мере надобности. Это соображение было реализовано в проекте www.glossary.ru, причем для определенности информационные запросы передаются ИПС Яндекс. Статистика востребованности этой функциональной возможности показывает, что пользователи Интернет чрезвычайно охотно формируют запросы к ИПС в режиме меню.

Следующий этап в развитии функциональных возможностей интерфейса доступа к ИПС предусматривает формирование "тонких" запросов, использующих язык расширенных запросов. Фактически речь идет об отображении фрагмента топологии сети в запрос к ИПС.

Метод построения тонких запросов исходит из того, что пользователь, во-первых, инициирует обращение к ИПС в связи с некоторой вершиной семантической сети, и, во-вторых, утверждает окончательный вид запроса, используя предложенную заготовку.

Алгоритм формирования заготовки выполняется на серверной стороне ресурса. В качестве исходных данных алгоритм получает адрес вершины семантической сети. Наименования понятий, с которыми связана вершина образуют потенциальный набор ограничений на класс документов, интересующих пользователя. В заготовке перечисляются все эти фразы-ограничения, однако окончательный выбор остается за пользователем. Термин, определяемый заданной вершиной, составляет обязательную основу запроса, которая может редактироваться и дополняться с учетом возможностей расширенного языка запросов. Обычно такие возможности позволяют зафиксировать порядок слов, расстояние между словами и т.п.

Особый случай обработки составляют многозначные термины, которым соответствуют несколько вершин семантической сети [3]. С формальной точки зрения контекст каждого обращения пользователя фиксирован, поэтому многозначностью можно пренебречь. Однако с практической точки зрения (массовому) пользователю совершенно безразлично из каких соображений термин, скажем, "Андеррайтер" порождает две различные заготовки формирования запросов. При обработке многозначных терминов предварительно выполняется виртуальная операция слияния соответствующих вершин, позволяющая определить единое множество семантических связей.

Заготовка запроса с отметками и уточнениями пользователя поступает на вход конструктора тонких запросов, который преобразует ее в собственно запрос на расширенном языке и передает его на исполнение ИПС. Конструктор тонких запросов также функционирует на серверной стороне ресурса.

Описанный метод формирования тонких запросов доступен в сети Интернет по адресу www.glossary.ru.
 
ЛИТЕРАТУРА

1. Мальковский М.Г., Соловьев С.Ю. Универсальное терминологическое пространство. Труды Международного семинара Диалог'2002 "Компьютерная лингвистика и интеллектуальные технологии", т.1. М.: Наука, 2002, с.266-277.

www.park.glossary.ru/serios/theory01.php


2. Мальковский М.Г., Соловьев С.Ю. Технология формирования универсального терминологического пространства. Сб. "Информационные компьютерные технологии и Интернет в образовании и науке". М.: Изд-во МИИ для инвалидов с нарушением ОДС, 2002, с.54-55.

3. Мальковский М.Г., Соловьев С.Ю. Методы формирования глоссариев в универсальном терминологическом пространстве. Труды Международного семинара Диалог'2003 "Компьютерная лингвистика и интеллектуальные технологии", М.: Наука, 2003, с.438-440.

www.park.glossary.ru/serios/theory02.php



--------- * ---------

 

Точная ссылка: Мальковский М.Г., Соловьев С.Ю. Структурный метод формирования запросов к информационной системе. Труды международной конференции "Компьютерная лингвистика и интеллектуальные технологии", М.: Наука, 2004, стр.612-613.

П|р|о|д|о|л|ж|е|н|и|е ►



Copyright ©
2000-2014
Web-and-Press


webadmin@glossary.ru