Структурно гипертекст состоит из информационного материала, тезауруса гипертекста, списка главных тем и алфавитного словаря. Информационный материал подразделяется на информационные статьи, состоящие из заголовка статьи и текста. Информационная статья может представлять собой файл, закладку в тексте, web-страницу и др. Заголовок (имя файла) - это название темы или наименование описываемого в информационной статье понятия. Текст информационной статьи содержит традиционные определения и понятия, то есть содержит описание темы. Он должен быть легко обозримым, чтобы пользователь мог понять, стоит ли его внимательно читать или перейти к другим, близким по смыслу статьям. Текст, включаемый в информационную статью, может сопровождаться пояснениями, числовыми и табличными примерами, документами, рисунками, диаграммами, объектами реального времени (аудио и видео).
В тексте информационной статьи выделяются ключи, или гиперссылки, являющиеся заголовками связанных информационных статей, в которых может быть дано определение, разъяснение или обобщение выделенного понятия. Ключи должны визуально отличаться (подсветка, выделение, другой шрифт и т. д.) от остального текста. Ключом может служить слово или предложение. Они обеспечивают ассоциативную, семантическую, смысловую связь или отношение между информационными статьями.
Тезаурус гипертекста - это автоматизированный словарь, отображающий семантические отношения между информационными статьями и предназначенный для поиска слов по их смысловому содержанию. Термин “Тезаурус” был введен для названия энциклопедии. С латыни этот термин переводится как сокровище, запас, богатство.
Тезаурус гипертекста состоит из тезаурусных статей. Тезаурусная статья имеет заголовок и список заголовков родственных тезаурусных статей, где указаны тип родства и заголовки информационных статей. Заголовок тезаурусной статьи совпадает с заголовком информационной статьи. Тип родства или отношений определяет наличие или отсутствие смысловой связи. Существуют референтные и организационные типы связи родства, или отношений.
Референтные отношения указывают на смысловую, семантическую, ассоциативную связь двух информационных статей. В информационной статье, на которую сделана ссылка, может быть дано определение, разъяснение, понятие, обобщение, детализация понятия, выделенного в качестве ключа. Референтные отношения реализуют семантическую связь типа: род - вид, вид - род, целое - часть, часть – целое. Пользователь получает более общую информацию по родовому типу связи, а по видовому – более детальную информацию без повторения общих сведений из родовых тем. Тем самым глубина индексирования текста зависит от родо - видовых отношений.
К организационным отношениям относятся те, для которых нет ссылок с отношениями род – вид, целое – часть, то есть между информационными статьями нет смысловых связей. Они позволяют создать список главных тем, оглавление, меню, алфавитный словарь.
На основе референтных и организационных отношений может быть построена гипертекстовая модель текста (не структурируемого материала). Гипертекстовая модельизображается в виде сети или графа. Модель референтных отношений обычно изображается сетью. Модель организационных отношений изображается в виде графа или сети. В вершинах сети или графа (узлах) находятся заголовки информационных статей (имена файлов, страниц, закладок). Ребро определяет ключ (гиперссылку) для связи с другой информационной статьей, то есть ключ служит указателем заголовка в списке заголовков тезаурусной статьи. Тем самым тезаурус гипертекста реализует поисковый аппарат по смысловым и организационным связям.
Пример гипертекстовой модели приведен на рис.5.1. Для простоты изложения информационная статья примера содержит одну фразу, в которой выделены ключи. В скобках дан заголовок информационной статьи (имя файла). Текст информационных статей примера приведен ниже.
Институт состоит из факультетов . (ИНСТ)
На факультете обучаются студенты разных курсов. (ФАК)
Курс – одна или более группстудентов. (КУРС)
Группа состоит из нескольких студентов. (ГР)
Студент – тот, кто учится в институте. (СТУД)
В примере тезаурусная статья ИНСТ(ФАК) содержит список из одного заголовка ФАК, на которое указывает ключевое слово ФАКУЛЬТЕТ. А список тезаурусной статьи ФАК(СТУД, КУРС) содержит два имени. По ключевому слову СТУДЕНТ будет выбрана информационная статья СТУД, по ключевому слову КУРС - информационная статья КУРС. В данном примере все ссылки - референтные.
Модель гипертекста позволяет структурировать материал, выделить основные и частные пути создания и просмотра материала, чтобы пользователь не пропустил главного, не «утонул» в деталях, понял смысл написанного. Умение построить гипертекстовую модель облегчает создание web - страниц, гипертекстовых документов и баз гипертекстовых документов. Пользователю гипертекстовая модель обеспечивает комфорт
Формирование тезаурусных статей в соответствии с моделью гипертекста означает индексирование текста. Полнота связей, отражаемых в модели, и точность установления этих связей в тезаурусных статьях, в ко нечном итоге, определяют полноту и точность поиска информационной статьи гипертекста.
Список главных тем содержит заголовки информационных статей с организационными отношениями. Обычно он представляет собой меню, содержание книги, отчета или информационного материала.
Рис.5.1. Пример гипертекстовой модели
Алфавитный словарь содержит перечень наименований всех информационных статей в алфавитном порядке. Он реализует организационные отношения.
|