Стартовая страница G l o s s a r y   C o m m a n d e r

Служба тематических толковых словарей

glossary.ru
park.glossary.ru
Служебная библиотека
 н а  п р а в а х  р е к л а м ы 

 Теория: 1  | 2  | 3  | 4  | 5  | 6  | 7  | 8  | 9  | 10  | 11  | 12
 
Мальковский М.Г., Соловьев С.Ю., Сотников А.Н.
РЕДАКТОР-НАВИГАТОР ЭЛЕКТРОННЫХ КАРТОТЕК
Москва, 2008.   >>  Точная ссылка


Творческий процесс порождения новых идей зачастую скрыт от сознания и изолирован от воли человека. Тем не менее пассивное ожидание вдохновения совершенно бесплодно. Вдохновение оставляет следы только на подготовленной "почве" в головах у тех, кто терпеливо, но активно ждет его. Общепризнанным занятием на период "ожидания идей" является ведение личной картотеки "по теме ожидания" [1]. Картотека как систематизированное собрание однотипных бумажных карточек известна с давних времен. На карточках "соискателем идей" записываются цитаты, тезисы, ссылки, новости и пр. Дальнейшая работа с картотекой состоит в ее постоянном пополнении и изменении, а также в кластеризации и классификации накопленных карточек. А однажды группа карточек "сама-собой" превращается в окончательный продукт интеллектуальной деятельности: в статью, в рецепт, в словарь и т.д.

Стремление переложить ведение личной картотеки на персональный компьютер выглядит почти естественно:
  • хотя теряется "аромат", и
  • отпадает необходимость думать о линейном порядке карточек, зато
  • появляется возможность использовать мощные средства поиска, сравнения и порождения.

На первый взгляд для поддержания картотек существует большое количество разнообразных программных продуктов: от почтовых клиентов до органайзеров. Однако все эти продукты в большей степени ориентированы на первоначальное порождение картотеки, чем на систематическую деятельность по ее ведению. В связи с этим интерес представляют принципы организации многофункционального редактора-навигатора, предназначенного для творческой работы с электронными карточками и генерации интеллектуальных произведений, завершающих эту работу.

Концепция редактора-навигатора исходит из того, что:
  • электронные карточки связаны между собой бинарными отношениями, типы которых известны заранее;
  • электронная карточка представляет собой последовательность символьных строк, каждой из которых приписаны цвет переднего плана и цвет фона;
  • электронная карточка допускает однозначный разбор на группы одинаково окрашенных, подряд расположенных строк, в дальнейшем именуемых цветолями;
  • набор цветолей, образующих карточку, и семантика каждого их них известны заранее.

Считается, что каждая карточка помимо содержательного наполнения имеет:
  • обязательный блок служебной информации, включающий формальный уникальный идентификатор и различные метки; и
  • необязательное (осмысленное) уникальное наименование.

Бинарное отношение, связывающее две карточки, задается посредством записи в одну из карточек уникального наименования другой карточки. Запись производится в цветоль, однозначно соответствующий типу отношения. Фактически отношения моделируются посредством ссылок, а типы отношений определяются "стартовыми" цветолями. При таком подходе изменение связей между карточками, а также изменение их содержимого сводятся к редактированию специально устроенного текстового файла (Т-фрагмента) с последующей его интерпретацией.

Классификация функциональных возможностей редактора-навигатора имеет следующий вид:
  • функции копирования карточек в Т-фрагмент:
    • функции выбора;
    • функции поиска;
    • функции проверки;
  • функции модификации Т-фрагмента:
    • функции интерактивного редактирования; и
    • функции пакетной обработки, в том числе:
      • функции анализа;
  • функции (локального) преобразования картотеки:
    • функции загрузки Т-фрагмента в картотеку; и
    • функции экспорта карточек.

Многие функции редактора-навигатора реализуются в виде самостоятельных утилит, подключаемых посредством технологии plug-in. Вообще говоря, редактор-навигатор можно рассматривать как совокупность сведенных "под одну крышу" утилит, использующих и модернизирующих (по мере необходимости) единый индекс картотеки. Рассмотрим основные функциональные возможности редактора-навигатора.

Функции копирования карточек в Т-фрагмент различаются механизмами выявления карточек, подлежащих копированию.

Функции выбора позволяют пользователю перемещаться по структуре картотеки, заданной бинарными отношениями, и "поштучно" выбирать карточки. Формируемый редактором-навигатором набор отправных точек для "путешествия" обеспечивает доступность любой карточки за конечное число прямых и обратных переходов по ссылкам-отношениям.

Функции поиска позволяют находить карточки по фразам, заданным для тех или иных цветолей. Дополнительно, функции поиска могут обнаруживать в картотеке "двойников" выделенного подмножества картотек. Понятие двойника уточняется в поисковом запросе.

Функции проверки выявляют карточки подозрительные на наличие дефектов. Открытый список проверок, в частности, включает:
  • выявление карточек без завершающей точки в цветоле, предназначенном для размещения заметки;
  • выявление двух одинаковых подряд расположенных слов;
  • выявление связей-дубликатов.

Конструктивный подход к устранению ошибок - важнейшее условие существования больших картотек. Вместе с тем, утилиты, реализующие упрощенные алгоритмы проверки, могут раз за разом объявлять подозрительными одни и те же карточки, вполне качественные с точки зрения пользователя. Универсальный механизм защиты проверенных пользователем карточек от повторных проверок использует метки, которые:
  • автоматически размещаются в блоках служебной информации проверенных карточек,
  • отменяют последующие проверки,
  • существуют до момента очередного редактирования карточек.

Функции модификации Т-фрагмента реализуются посредством текстового редактора и утилит пакетной обработки Т-фрагмента.

Редактор, ориентированный на работу с карточками, дополнительно к стандартным функциям правки текста предоставляет пользователю некоторые специальные операции:
  • создать/удалить цветоль;
  • открыть служебную информацию для просмотра/редактирования;
  • скрыть служебную информацию;
  • удалить карточку;
  • породить новую карточку.

Операции пакетной обработки реализуют отдельные преобразования Т-фрагмента:
  • стандартное форматирование карточек;
  • разделение по определенным правилам больших по объему карточек на несколько малых;
  • установление однотипных связей для карточек из Т-фрагмента;
  • факторизация множества карточек по заданному цветолю и т.п.

Кроме того, пакетная обработка может использоваться для поддержки творческих операций. Реализованные с этой целью функции не изменяют Т-фрагмент, но позволяют пользователю по-новому оценить его. К таким функциям относятся:
  • эвристическая сортировка карточек;
  • визуализация бинарных отношений;
  • представление электронной картотеки в бумажном виде и др.

Функции преобразования картотеки позволяют загружать (исправленный) Т-фрагмент в картотеку, а также экспортировать карточки, попавшие в Т-фрагмент, из картотеки во внешний файл. Экспорт реализуется как частный случай применения загрузки.

Утилита загрузки исследует Т-фрагмент на корректность и в зависимости от результатов исследования либо возвращает его на доработку, либо исполняет, изменяя содержимое картотеки. Алгоритм загрузки состоит из пяти последовательных этапов.

Этап 1. Формирование списка уникальных идентификаторов для карточек из Т-фрагмента. Если совпала хотя бы одна пара идентификаторов, то загрузка отменяется.
Этап 2. Проверка условия уникальности наименований карточек с учетом предполагаемого изъятия части карточек и включения новых. Если обнаруживается пара карточек с совпадающими наименованиями, то загрузка отменяется.
Этап 3. Проверка корректности бинарных отношений. Если обнаруживается, что в результате загрузки появляется связи "в никуда", то загрузка отменяется.
Этап 4. Все карточки с уникальными идентификаторами, выявленными на этапе 1, отмечаются как удаленные.
Этап 5. В картотеку переписываются карточки из Т-фрагмента и при этом изменяются и/или удаляются метки проверенных карточек.

Существуют два обстоятельства, существенно усложняющих реализацию четвертого этапа.

Если реализуется коллективная картотека, то есть предполагается, что картотеку могут одновременно редактировать несколько пользователей, то
- карточки должны иметь индивидуальные номера версий, изменяемые после каждой модификации,
- попытка удалить карточку с номером версии, отличным от номера, скопированного в Т-фрагмент, отменяет загрузку.

Если удаляется карточка,
- которая, судя по меткам, существует в картотеке достаточно давно и
- для которой, судя по Т-фрагменту, не предполагается никакой замены,
то желательно запросить подтверждение операции. В противном случае можно потерять важную информацию по элементарному недосмотру.

Работа пользователя с редактором-навигатором сводится к повторению (с вариациями) группы из трех операций:
Формирование → Редактирование → Загрузка
Таким образом, шаг за шагом нарабатывается структурированный массив карточек, в котором роль разделов исполняют созданные с этой целью специальные карточки. Важно, что одна и та же карточка может участвовать в нескольких разделах.
Описанный редактор-навигатор является главным звеном технологии подготовки терминологической сети проекта www.glossary.ru - Служба терминологических толковых словарей [2]. По состоянию на начало 2008 года сеть объединяет 52 тысячи карточек с определениями терминов научной и деловой лексики. Конечно, с ростом объемов данных технологию придется менять кардинальным образом, но по субъективным ощущениям, это событие произойдет не ранее достижения объема в 120 тысяч карточек. Тогда же прояснятся и подходы к реализации редактора-навигатора сверхбольших электронных картотек.
 
Список литературы

1. Альтшуллер Г.С. О личной картотеке // Теория и практика решения изобретательских задач / Под ред. Г.С.Альтшуллера - Горький, 1976. cтр.178-181.

2. Мальковский М.Г., Соловьев С.Ю. Универсальное терминологическое пространство // Труды международного семинара "Компьютерная лингвистика и интеллектуальные технологии". - М.: Наука, 2002, т.1, стр.266-270.

www.park.glossary.ru/serios/theory01.php



--------- * ---------

 

Точная ссылка: Мальковский М.Г., Соловьев С.Ю., Сотников А.Н., Редактор-навигатор электронных картотек // Программные продукты и системы No.2 (82), 2008. стр.20-22.
http://www.swsys.ru/index.php?page=article&id=732


П|р|о|д|о|л|ж|е|н|и|е ►



Copyright ©
2000-2014
Web-and-Press


webadmin@glossary.ru