Стартовая страница G l o s s a r y   C o m m a n d e r

Служба тематических толковых словарей

glossary.ru
park.glossary.ru
Служебная библиотека
 н а  п р а в а х  р е к л а м ы 

 Теория: 1  | 2  | 3  | 4  | 5  | 6  | 7  | 8  | 9  | 10  | 11  | 12
 
Мальковский М.Г., Соловьев С.Ю., Сотников А.Н.
СИСТЕМЫ ПОДДЕРЖКИ ТВОРЧЕСКИХ ПРОЦЕССОВ
Москва, 2010.   >>  Точная ссылка


 
Введение

Экономисты и политологи, историки и повара, врачи и финансисты используют в своей профессиональной деятельности цитаты и факты, патенты и письма, финансовые сообщения и истории болезней, определения и библиографические ссылки. Для обозначения субъекта творческой деятельности выберем нейтральный термин "исследователь" и взглянем на очевидное. Известно, что все исследователи так или иначе используют реальные или виртуальные, раскрашенные и/или разлинованные информационные карточки [1,2]. С помощью карточек усваивается новая информация, выстраивается система взаимосвязей, конструируются сценарии, задумываются статьи и другие интеллектуальные продукты [3]. Например, картотека научных понятий "сама собой" выявляет:
— индикативную роль денежных агрегатов в экономических циклах;
— влияние способов картографических изображений на развитие дизайна Web 2.0;
— центральное положение страхования в предпринимательской деятельности;
— отсутствие предмета исследования у некоторых "логий"; (и, наконец)
— позитивную роль антиалкогольной компании в обновлении виноградных насаждений.

Для организации картотек ИТ-индустрия предлагает: редакторы семантических сетей, тезаурусов, онтологий и гипертекстов, почтовые программы-клиенты, органайзеры и пр. Каждый из перечисленных продуктов решает задачу поддержки творческого процесса лишь частично, в пределах структур данных, ориентированных на решение главной задачи: задачи построения семантической сети, онтологии или гипертектста, задачи обмена письмами и пр. Между тем поддержка творчества - едва ли не самая естественная область приложения информационных технологий.

Рассмотрим основные направления и практические подходы к построению систем поддержки творческой деятельности (Т-систем) с учетом возможностей современного программирования.
 
1. Концепция

Оригинальность творчества неизбежно предполагает применение нестандартных методов обработки данных: выявление аналогий, рифм и структурного сходства, вычисление частотных характеристик, поиск точек равновесия и др. Обработка данных реализуется программным модулем, а модуль создается программистом по заказу исследователя. Относительно привлечения программистов не может быть никаких иллюзий. Т-системы могут развиваться только энтузиастами и только по остаточному принципу за счет собственного программирования, за счет привлечения родственников и студентов, а также силами симпатичного сообщества свободных программистов, породивших феномен freeware. Серьезные программистские команды в эту область не придут, здесь не просматривается финансирование. Учитывая это обстоятельство, Т-системы должны проявлять максимум дружелюбия к свои "временно прикомандированных" создателям, в них не должно существовать никаких затруднений
-1- с форматом данных;
-2- с использование программного инструментария для построения новых функций;
-3- с включением вновь построенных функциональных модулей в Т-систему.

Конструктивный ответ на три заявленных требования выглядит так:
-1- текстовые файлы;
-2- любые средства программирования;
-3- T-система как совокупность утилит.

Текстовые файлы являются простым, универсальным и понятным типом данных. С точки зрения внутреннего устройства (формата) текстовый файл состоит из строк. Каждая строка файла состоит из последовательности символов-литер, имеющих печатный образ, и ограничена справа специальным "невидимым" символом конца строки и, возможно, символом "возврат каретки".

Программный инструментарий обработки текстовых файлов имеется во всех языках программирования за исключением ранних версий Фортрана и Алгола-60. Пользовательский инструментарий обработки текстовых файлов представлен большим количеством текстовых редакторов для всех операционных систем.

Таким образом, хранение данных в текстовых файлах не создает затруднений ни с форматом данных, ни с использование программного инструментария для построения новых утилит обработки.

Самое простое решение по наращиванию функциональных возможностей Т-систем состоит в отказе от единых правил оформления функциональных модулей при неукоснительном соблюдении форматов представления данных.

Данные плюс утилиты - по этой формуле создавались программные системы в ОС РАФОС и в MS DOS. По этой же формуле конструируются сайты с динамическими веб-страницами.

Замечание. В ранних операционных системах для соединения утилит в единый комплекс дополнительно использовались командные файлы или их заменители. В Интернет-ресурсах обращения к программам-сценариям встраиваются в html-страницы.

Интернет вдохнул новую жизнь в оборот программ-утилит. С одной стороны, значительно увеличилось количество пользователей утилит. C другой стороны, увеличилось количество программистов, порождающих freeware программы. Все это позволяет надеяться на коллективное развитие Т-систем сообществом свободных программистов.

Итак, дефицит профессиональных ресурсов накладывает существенные ограничения на внутреннее устройство Т-систем. С точки зрения типологии компонент Т-система представляет собой
— набор текстовых файлов (Т-архив) для хранения персональных данных; (и)
— набор утилит, обрабатывающи х эти данные.

Перейдем к более полной спецификации данных и утилит.
 
2. Данные

Для представления в текстовых файлах информационных карточек необходимо принять ряд естественных соглашений. Будем считать, что строки текстовых файлов имеют префикс стандартной длины, предназначенный для размещения индивидуальных меток строк. Длина префикса зависит от конкретной реализации. Метки позволяют:
— разделить текстовый файл на отдельные страницы; (и)
— задать цветовое решение строки: цвет переднего плана и цвет фона.

В универсальном текстовом редакторе префикс не отличается от прочих литер строки. В специальном текстовом редакторе Т-системы (в Т-редакторе) префикс не предъявляется пользователю, но используется редактором при выборе цветового решения и разделителей строк.
 
Если, например, в универсальном текстовом редакторе строка имеет вид
":YB:Проектирование интеллектуальных систем",
то в Т-редакторе, настроенном на обработку четырехсимвольных префиксов, эта строка представляется желтыми (Y) буквами на синем (B) фоне и графически выглядит так:
"Проектирование интеллектуальных систем".

Замечание. В дальнейшем будем считать строкой файла последовательность литер, расположенных за префиксом.

Раскрашенная страница текста представляет собой структуру данных для представления информационной карточки. В статическом состоянии раскрашенную страницу можно однозначно разделить на компоненты-цветоли.

Цветоль (неологизм - существительное мужского рода, единственного числа) есть нерасширяемая последовательность строк
— расположенных в пределах одной раскрашенной страницы; (и)
— имеющих одинаковое цветовое решение.

Замечание. В банковской информатике цветолю соответствует поле финансового сообщения.

Не ограничивая общности, можно считать, что цветовое решение группы строк определяет назначение (смысл, семантику) этих строк и алгоритмы ее обработки.

Например:
— желтое на синем - это текст цитаты;
— белое на зеленом - литературный источник.

Соглашение о наборе цветолей и об их интерпретации принимается при создании Т-системы. В зависимости от назначения Т-системы цветоли могут быть весьма разными, однако их стандартная типология просматривается достаточно ясно:
-1- цветоли-журналы;
-2- цветоли-наименования;
-3- цветоли-заметки;
-4- цветоли-перечисления.

Цветоль-журнал:
— является обязательным элементом каждой раскрашенной страницы;
— занимает, в зависимости от реализации, одну или несколько строк, в которых размещаются:
  • уникальные (цифровые) идентификаторы раскрашенных страниц;
  • даты порождения и последней модификации раскрашенной страницы;
  • метки обработки;
  • другая служебная информация.

Строго говоря, вмешательство исследователя в журнальную информацию крайне нежелательно. Можно полагать, что цветоль-журнал служит началом очередной раскрашенной страницы в текстовом файле.

Цветоль-наименование не является обязательным элементом раскрашенной страницы, но если он присутсвует, то должен содержать уникальное осмысленное наименование.

Например, в политологической систематизации событий новейшей истории должны присутствовать раскрашенные страницы с наменованиями "Оранжевая революция" (одна штука) и "Цветные революции" (одна штука). В то же время достаточно ординарное известие об очередном митинге может и не удостоиться собственного наименования в Т-системе.

Цветоль-заметка занимает несколько строк и предназначен для размещения текстовой записки. Такой цветоль может содержать специальные знаки разделения записки на абзацы и выделения в записке линейных списков.

Замечание. Вопрос о включении в записку таблиц, формул и иллюстраций остается открытым. Видимо, наилучшим решением для представления таких объектов, является решение, принятое в системе TEX/LATEX [4]: ссылки на стилевые пакеты и команды-макровызовы, встраиваемые в текст. Хотя при таком подходе и нарушается принцип WYSIWIG, однако сохраняется максимально простой формат данных.

Цветоль-перечисление представляет собой множество однородных строк, каждая из которых содержит законченную порцию информации.

Например, содержание цветоля-перечисления
—  с альтернативными именами может иметь вид:
Санкт-Петербург
бывш.Ленинград
бывш.Петроград
жарг.Питер
— с URL-адресами:
О.Смирнов Картотека >> www.improvement.ru/zametki/oskartot/
О.Смирнов Картотека >> e-dacha.narod.ru/job/kartoteka.html
— с набором иллюстраций:
Рис.1 Архитектура \PICT\sch1.gif
Рис.2 Функциональная схема \PICT\sch2.jpg
Рис.3 Схема информационных потоков \PICT\sch3.png
Конечно, с каждым таким цветолем связано правило разделения строки на комментарий и содержательную часть.

Особый подкласс цветолей-перечислений составляют цветоли-указатели, в строках которых приводятся уникальные наименования некоторых других раскрашенных страниц. Например, раскрашенная страница для представления цитат помимо цветоля-заметки с текстом цитаты может иметь цветоль "белое на зеленом" с указателем на литературный источник и цветоль "красное на синем" с указателями на статьи, в которых используется эта цитата. Другими словами, если в странице-цитате имеется зеленая строка, в которой белыми буквами записано "Война и мир", то это означает, что
-1- цитата взята из романа "Война и мир"; и
-2- в Т-архиве представлена раскрашенная страница "Война и мир".

Раскрашенная страница может содержать несколько цветолей-указателей, различающихся семантикой связей. Так, один цветоль может предназначаться для родо-видовых связей, а другой - для связей часть-целое.

Посредством цветолей-указателей устанавливаются бинарные связи между раскрашенными страницами. Наличие наименования d страницы D (см.рис.1) в цветоле-указателе C, находящемся на странице F, означает существование ребра, исходящего из F, входящего в D и помеченного меткой C. Здесь C - цветовое решение цветоля.
 
Рис. 1


Формально, с помощью цветолей-указателей можно построить любой ориентированный граф на заданном множестве раскрашенных страниц. При этом возникает естественное понятие целостности Т-архива, заключающееся в том, что
для любого наименования d
из любого цветоля-указателя C
любой раскрашенной страницы F
должна существовать принимающая страница D c наименованием d.

Используя естественную возможность порождения новой страницы, в Т-архиве можно создавать любые группы раскрашенных страниц. Для этого в каждую страницу группы необходимо включить дополнительную ссылку на новую страницу. Конечно, новая страница должна получить уникальное наименование - знаменитое "Я подумаю об этом завтра!" или прозаическое "-?-К рассмотрению!" со стандартной приставкой "-?-" для еще необработанных материалов. Важно, что при построении новой группы все старые группы сохраняются без изменений.
 
3. Утилиты

Подход к построению функционального наполнения Т-систем базируется на двух важных принципах.

Во-первых, неограниченные возможности построения групп
— наилучшим образом решают задачу представления в утилитах исходных данных и результатов и
— весьма плодотворно вписываются в технологию творческого процесса.

Во-вторых, редакторские изменения в Т-архиве выполняются только на копиях раскрашенных страниц, собранных во временный текстовый файл (Т-фрагмент), с последующим корректным замещением старых страниц новыми. Таким образом гарантируется целостность Т-архива.

Замечание. Порядок расположения и содержимое раскрашенных страниц в Т-фрагменте могут изменяться практически бесконтрольно.
 
Рис. 2


Классификация утилит, составляющих функциональное наполнение Т-систем, представлена на рис.2. Утилиты подразделяются на пять классов:
-1- утилиты-конверторы, преобразующие данные из внешних источников в формат раскрашенных страниц;
-2- утилиты-подборщики, копирующие в Т-фрагмент отдельные страницы из Т-архива;
-3- утилиты-преобразователи Т-фрагмента;
-4- утилита-загрузчик, позволяющая корректно внести в Т-архив изменения, зафиксированные в Т-фрагменте;
-5- утилиты-приложения, отвечающие за формирование конечного продукта интеллектуальной деятельности.

Совокупность текстовых файлов, образующих Т-архив, размещается в некотором каталоге. Последовательность раскрашенных страниц в файлах является произвольной. В концептуальном плане Т-архив можно рассматривать как неупорядоченное множество страниц. Это обстоятельство принципиально отличает Т-архивы от бумажных картотек, карточки в которых разложены по разделам и отсортированы по алфавиту. В то же время отдельные утилиты позволяют рассматривать Т-архив как на упорядоченную совокупность раскрашенных страниц; эти утилиты создают и используют временные индексы прямого доступа к страницам.

Размеры раскрашенных страниц не ограничены, однако в хорошо структурированных Т-архивах средний объем одной страницы не должен превышать две тысячи знаков. В противном случае страницы практически невозможно "разместить рядом" и сравнить их содержимое. Отметим, что документы большого размера, как правило, поддаются разделению на более компактные единицы, связанные в единое целое посредством указателей. Отказ от возможности сравнения информационных единиц немедленно превращает Т-систему в примитивное подобие электронной библиотеки.

Утилиты-конверторы
-E- извлекают информацию из внешних источников;
-T- приводят ее к представлению в виде группы страниц;
-L- размещают страницы в Т-архиве.

В качестве внешних источников могут выступать тексты и другие данные в электронной форме. Что касается личных наблюдений и выписок из бумажных изданий, то такого рода информация заносится посредством Т-редактора.

Замечание. Одним из внешних источников могут быть коллективные картотеки, составленные группой авторов. Набор инструментальных средств ведения коллективных картотек повторяет набор инструментальных средств для личных картотек; разница лишь в акцентах и деталях.

На первый взгляд извлечение информации, непосредственно зависящее от форматов данных внешних источников, практически не поддается автоматизации. Однако в действительности значительная часть информации, полученной экспортом из внешних источников, обрабатывается небольшим количеством стандартных процедур. Затруднения возникают при попытке сохранить семантические связи источника в системе бинарных отношений Т-архива. Достаточно сложно, например, реализовать алгоритм преобразования гиперссылок в отношения между раскрашенными страницами.

По формальным признакам конверторы реализуют ETL-процессы [5], отличие состоит лишь в том, что на этапе приведения не предполагаются сколько-нибудь сложные преобразования данных; загруженные страницы рассматриваются не более чем сырье для последующего изучения. "Когда б вы знали из какого сора // растут стихи...".

Утилиты-подборщики различаются механизмами выявления страниц, подлежащих копированию; всего можно выделить три подкласса таких утилит: утилиты выбора, утилиты поиска и утилиты проверки.

Утилиты выбора позволяют исследователю перемещаться по структуре Т-архива и "поштучно" выбирать раскрашенные страницы. Формируемый этими утилитами набор отправных точек для "путешествия" должен обеспечивать доступность любой раскрашенной страницы за некоторое число прямых и обратных переходов по ссылкам (см.рис.1) из цветолей-указателей.

Утилиты поиска позволяют находить раскрашенные страницы по фразам, заданным для тех или иных цветолей. Дополнительно, утилиты поиска позволяют обнаруживать в Т-архиве дойников выделенного подмножества страниц по содержанию заданного цветоля-перечисления. При разумных ограничениях на объем Т-архива, исходя из нормальных потребностей в поисковых операциях, и с использованием современной вычислительной техники поиск поддается вполне качественной "лобовой" реализации без предварительного индексирования.

Утилиты проверки выявляют страницы подозрительные на наличие дефектов. Открытый список проверок, в частности, включает:
— выявление страниц без завершающей точки в цветоле-заметке;
— выявление двух одинаковых подряд расположенных слов;
— выявление дубликатов в цветолях-перечислениях;
— выявление повторяющихся идентификаторов в цветолях-журналах.

Несмотря на всю свою незамысловатость, регулярное применение утилит проверки позволяет подчистить большое количество огрехов, невольно допущенных исследователем при редактировании.

Замечание. Утилиты проверки, в силу простоты внутреннего устройства, могут объявить дефектными и некоторые качественные страницы. Поэтому возникает необходимость в защите проверенных исследователем раскрашенных страниц от повторного выявления той же проверкой. Механизмы защиты страниц могут быть разными: от использования для проверенных страниц специальных меток в цветоле-журнале до ограничений на времена модификаций проверяемых страниц.

Утилиты-преобразователи Т-фрагмента включают интерактивный Т-редактор и различные функции пакетной обработки Т-фрагмента.

Т-редактор, специально ориентированный на работу с раскрашенными страницами, помимо стандартных функций правки текста включает некоторые специальные операции:
— изменить цветовое решение строки;
— скрыть цветоли-журналы;
— открыть цветоли-журналы для просмотра/редактирования;
— удалить раскрашенную страницу;
— породить новую раскрашенную страницу.
Естественно, что при порождении новой строки Т-редактор использует принцип наследования цветового решения.

"Ближайшими родственниками" Т-редактора можно считать LEXICON для MS DOS, NotePad для MS Windows и семейство редакторов для Norton Commander.

Утилиты пакетной обработки реализуют отдельные преобразования Т-фрагмента:
— стандартное форматирование раскрашенных страниц;
— разделение по определенным правилам больших страниц на несколько малых;
— присоединение страниц Т-фрагмента к указанной группе;
— преобразование повторяющихся идентификаторов страниц;
— факторизация множества страниц по заданному цветолю-перечислению и т.п.
Кроме того, пакетная обработка может использоваться для поддержки творческих операций. Строго говоря, эти функции не изменяют содержимое Т-фрагмента, но позволяют по-новому взглянуть на него. К таким функциям относятся:
— эвристическая сортировка карточек;
— визуализация бинарных отношений (см. рис.1);
— представление электронной картотеки в бумажном виде и др.

Загрузчик - это самая ответственная утилита Т-системы, расплачивающаяся за необременительную "легкость бытия" остальных утилит. Загрузчик получает на входе Т-фрагмент, исследует его на корректность и в зависимости от результатов исследования либо возвращает его на доработку, либо исполняет, изменяя содержимое Т-архива. Загрузка раскладывается на пять последовательных этапов.

Этап 1. Формирование списка уникальных идентификаторов для страниц из Т-фрагмента. Если совпала хотя бы одна пара идентификаторов, то загрузка отменяется.

Этап 2. Проверка условия уникальности наименований раскрашенных страниц с учетом предполагаемого изъятия части страниц и включения новых. Если обнаруживается пара страниц с совпадающими наименованиями, то загрузка отменяется.

Этап 3. Проверка корректности бинарных отношений. Если обнаруживается, что в результате загрузки нарушится целостность Т-архива, то загрузка отменяется.

Этап 4. Все страницы, выявленные на этапе 4, отмечаются как удаленные.

Этап 5. В Т-архив переписываются раскрашенные страницы из Т-фрагмента и при этом изменяются и/или удаляются метки из цветолей-журналов, приписанных страницам.

Существуют два обстоятельства, существенно усложняющих реализацию четвертого этапа.

Если реализуется коллективная картотека, то есть предполагается, что Т-архив могут одновременно редактировать несколько пользователей, то
— каждая раскрашенная страница должна иметь в цветоле-журнале номер версии, изменяемый после каждой модификации;
— попытка удалить раскрашенную страницу с номером версии, отличным от номера, скопированного в Т-фрагмент, отменяет загрузку.

Если удаляется страница
— которая, судя по меткам в цветоле-журнале, существует в Т-архиве достаточно давно (и)
— для которой, судя по Т-фрагменту, не предполагается никакой замены,
то желательно запросить у исследователя подтверждение операции.
Иначе можно потерять важную информацию по элементарному недосмотру.

Утилиты-приложения предназначены для построения интеллектуальных продуктов на базе сформированного Т-архива. Речь идет о некоторых трансформациях, позволяющих представить Т-архив:
— в виде линейного текста;
— в виде гипертекста;
— в виде набора параметризованных запросов к информационно-поисковой системе [6] и др.

В сущности, все утилиты-приложения реализуют боле или менее естественные эвристические алгоритмы, позволяющие "глубоко копнуть" собранный в Т-архиве материал. В любом случае результаты, предоставляемые приложениями, нуждаются в ручной доводке.

Замечание. Возможность реализации приложений существенно отличает электронные картотеки от их бумажных аналогов.
 
Заключение

Концепция Т-систем родилась из наблюдения за эволюцией программного сервиса проекта wwww.glossary.ru - Служба тематических толковых словарей [7]. В этом проекте основной объем работы занимает обработка и структурирование электронных карточек с определениями терминов; время от времени построенная часть картотеки преобразуется в базу данных общедоступного веб-ресурса.

Программный сервис проекта всегда рассматривался как продукт необходимый, но второстепенный. Утилиты разрабатывались и модифицировались исключительно из потребностей развития картотеки. Сюрпризом оказалась переносимость найденного программного решения на другие области применения картотек. А однажды набор утилит стабилизировался, и в этот момент, как всегда бывает в таких ситуациях, наконец-то пришло понимание "правильного" подхода к программировнию инструментальных систем поддержки творческой деятельности.
 
 
Литература

  1. Смирнов О.С. Картотека нужна приличному человеку. // Рекламные идеи, 2003, No.1. - c.131-132.
  2. Дановский Н.Ф. Вводное слово в искусство перевода. - Рига-Харьков, 1983. - 174с.
  3. Альтшуллер Г.С. О личной картотеке. // Теория и практика решения изобретательских задач /Под ред. Г.С.Альтшуллера - Горький, 1976. - c.178-181.

    www.altshuller.ru/engineering/engineering1.asp

  4. Львовский С.М. Набор и верстка в системе LATEX. - М.: МЦНМО, 2006. - 448с.
  5. Хоббс Л., Хилсон С., Лоуенд Ш. Oracle9iR2: разработка и эксплуатация хранилищ баз данных. - М.: Кудиц-Образ, 2004. - 586с.
  6. Мальковский М.Г., Соловьев С.Ю. Структурный метод формирования запросов к информационной системе. // Труды международного семинара Диалог'2004 "Компьютерная лингвистика и интеллектуальные технологии". - М.: Наука, 2004. стр.612-613.

    www.park.glossary.ru/serios/theory04.php

  7. Мальковский М.Г., Соловьев С.Ю. Универсальное терминологическое пространство. // Труды Международного семинара Диалог'2002 "Компьютерная лингвистика и интеллектуальные технологии", т.1. М.: Наука, 2002, с.266-277.

    www.park.glossary.ru/serios/theory01.php



--------- * ---------

 

Точная ссылка: Мальковский М.Г., Соловьев С.Ю., Сотников А.Н. Системы поддержки творческих процессов
// Сб. Программые системы и инструменты. / Под ред. Л.Н.Королева - М.: ВМК: МАКС Пресс, 2010. С.3-14


П|р|о|д|о|л|ж|е|н|и|е ►



Copyright ©
2000-2014
Web-and-Press


webadmin@glossary.ru