Информатика
Проектирование
Геометрия
Алгебра
Курсовой
Графика
Электротехника
Задачи

Сопромат

Лабораторные
Методика
Физика
Чертежи
Энергетика
Математика
Реактор

Классификация средств ЛО

Исходя из изложенного, средства, входящие в состав ЛО, целесообразно разделить на 2 класса. К одному классу относятся языки, предназначенные непосредственно для представления данных в ЭБ. Именно для этого класса языковых средств корректно применять широко распространенный термин «информационно-поисковые языки» (ИПЯ). Эти языки достаточно естественно классифицируются в зависимости от уровня отображения информации, представленной в цифровых объектах. Таких уровней можно выделить четыре:

Отображение цифрового объекта в целом, включая его формальные характеристики.

Отображение тематики или содержания цифрового объекта.

3. Отображение семантики единиц естественного языка, содержащихся в цифровом объекте.

4. Отображение фактов, содержащихся в цифровом объекте.

Для цифровых объектов типа документов первому уровню отображения соответствуют языки описания документов, весьма детально разработанные в традиционных областях информационной деятельности: библиотековедении, архивном деле, делопроизводстве, картографии и др. Самый известный тип этих языков образуют языки библиографических данных, включающие правила библиографического описания и форматы библиографической записи.

В настоящее время происходит активная интеграция языков библиографических данных с языками, применяющимися для описания других видов цифровых объектов. Особенно активно этот процесс развивается в Интернете. Общее название для языков, предназначенных для комплексного описания цифровых объектов – системы метаданных.

На втором уровне отображения используются языки классификационного или предкоординатного типа, также имеющие большую историческую традицию. Принципиальным свойством этих языков является разбиение множества цифровых объектов на классы, описанные при помощи априорного связывания (предкоординации) поисковых признаков этих классов, чаще всего, в виде иерархического дерева. Судьбы языков этого типа с учетом перспектив глобальных информационных сетей вызывают оживленные дискуссии, в связи с их имманентными недостатками, главный из которых – необходимость интеллектуального индексирования. При этом классификационные языки обладают заметными преимуществами перед другими типами поисковых языков, прежде всего наглядностью, простотой для пользователя и независимостью от естественного языка. В настоящее время классификационные языки являются обязательным компонентом практически всех АИС рассматриваемого класса.

Новым типом языковых средств, появившимся только в рамках автоматизированных систем в 1950-х гг. XX века, являются языки, ориентированные на использование в качестве лексики единиц естественного языка. Поэтому вполне адекватное название этой группы языков – вербальные языки. Однако наиболее распространенное название этих языков – дескрипторные, в соответствии с названием общепринятой формы представления лексических единиц этих языков (дескрипторов). Иногда эти языки также называют посткоординатными, подчеркивая противопоставление с классификационными языками по базовой функции – способу отражения информации текста. Если в классификационных языках используется априорное связывание поисковых признаков, то в дескрипторных языках признаки связываются непосредственно в цифровом объекте (посткоординация).

Большое развитие, по крайней мере, в АИС НТИ получили языки, ориентированные на представление и поиск фактов, содержащихся в документах. Этот класс языков находится на стыке АИС типа «электронной библиотеки» и АИС типа «банк данных». Поскольку основной и чуть ли не единственный тип фактов, которые удается автоматически извлекать из плохо структурированной информации – это факты типа «объект – признак – значение», постольку языки данного класса принято именовать «объектно-признаковыми». Иногда их также называют фактографическими или объектографическими.

Следует иметь в виду, что такая терминология принята почти исключительно среди специалистов электронных библиотек, иначе говоря, специалистов по поиску слабоструктурированной информации. В других направлениях информатики, прежде всего в теории систем управления базами данных, эти средства именуют «моделями данных», языками описания данных и др. Однако в теории СУБД принято иметь дело в основном с хорошо структурированной информацией. В настоящее время теоретики в этой сфере активно обсуждают проблему взаимодействия различных языков данного класса в рамках интегрированных электронных библиотек. Эта проблема получила название проблемы «интероперабельности».

Кроме языковых средств для поиска используются другие средства как языковые, так и неязыковые. Сюда можно отнести весьма многочисленные, но не слишком успешные методы поиска, основанные на анализе статических свойств текста и запроса, методы поиска, использующие сведения о пользователе, поиск по аналогии и т. д. Весьма распространенным методом при поиске в Интернет в последние годы стало использование данных о распределении гипертекстовых ссылок.

Рассмотренные выше языковые средства имеют некоторую общую часть, представленную в интерфейсе пользователя с АИС. Это операторы и синтаксические правила, которые непосредственно применяются при составлении запросов. Эти средства естественно рассматривать отдельно от конкретных типов языков, поскольку в любом сколько-нибудь дружественном интерфейсе пользователя язык запросов интегрирует средства различных ИПЯ – библиографических, классификационных и вербальных. Эти средства обычно называются языками запросов. Все перечисленные выше виды языковых средств можно с большей или меньшей степенью условности назвать языками. Однако, определив некоторый объект как язык, мы должны уметь выделять в его составе обязательные для любого языка компоненты. В любом языке выделяются знаковые единицы трех уровней:

алфавит – т. е. множество допустимых символов;

лексика – множество семантически интерпретированных знаков;

тексты (дискурс) – семантически интерпретированные знаковые единицы речи.

В любом языке также выделяются два класса правил (грамматики):

морфология – правила образования и изменения лексических единиц;

синтаксис – правила образования текстов.

Семантически интерпретированные знаковые единицы языка (лексика и тексты) согласно семиотическим представлениям обладают тремя типами отношений (свойств):

синтактика – отношения между знаками;

семантика – отношение знака к означаемому (денотату);

прагматика – отношение знака к участнику дискурса.

В теории и практике ЛО ЭБ эта схема обычно модифицируется. Алфавиты в большинстве случаев определяются программно-технологическими возможностями ЭБ и объектом проектирования в составе ЛО не являются.

Структура и особенности текстов на ИПЯ (поисковых образов документов и поисковых предписаний) обычно рассматривается как результат действий синтаксических правил, а не как самостоятельные знаки.

Под грамматикой ИПЯ обычно имеют в виду только синтаксис, морфологию ИПЯ, если она и выделяется, рассматривают на уровне лексики.

Отношения между знаками, в семиотике относимые к сфере синтактике, обычно разделяются на два типа – синтагматические (отношения знаков в тексте) и парадигматические (отношения знаков вне контекста). Поскольку парадигматические отношения в реальных языках устанавливаются на уровне лексики, конкретно в словарях или классификациях, то эти отношения рассматриваются как средство организации лексики.

Таким образом, в составе ИПЯ реально выделяются два основных компонента – лексика (в том числе организованная в словари с использованием парадигматики) и грамматика, при помощи которой порождаются тексты на этих языках.

Что же касается прагматических свойств ИПЯ, связывающих текста на ИПЯ с участником коммуникации, в данном случае поиска, то эти свойства реализуются в виде методик и алгоритмов индексирования, а также непосредственно в процессе поиска, при проектировании интерфейса, диалога пользователя с ЭБ, критериев ранжирования и выдачи результатов поиска.

Второй класс средств, входящих в состав ЛО ЭБ, не является языками. Выше мы назвали их лингвистическими процессорами. Как уже было отмечено, это достаточно широкий класс информационных и программных продуктов и технологий, но конкретно применительно к ЭБ к этим средствам мы будем относить два класса технологий: системы автоматической обработки текста и лингвистические банки данных.

Под автоматической обработкой текста понимаются процессы автоматического формирования описания текста (документа) на одном или нескольких информационных языках, включая и автоматическое индексирование, аннотирование или реферирование. В основе этих процессоров лежат конкретные лингвистические алгоритмы, прежде всего, морфологического и синтаксического анализа.

Лингвистические банки данных (ЛБД) – важный обеспечивающий компонент развитых ЛО АИС. Практически значительная доля затрат на создание и эксплуатацию ЛО – это затраты на создание и поддержание ЛБД. В этой части ЛО АИС смыкается с таким направлением информатики как компьютерная лексикография.

Итак, ЛО включает следующие виды языков и лингвистических процессоров:

1. Информационно-поисковые языки.

Системы метаданных.

Классификационные языки.

Вербальные языки. 

Фактографические (объектно-признаковые) языки.

В современных условиях информация превратилась в важнейший интеллектуальный ресурс, целенаправленная обработка которого, называемая информационной технологией позволяет резко повысить обоснованность и эффективность применяемых методов экономического развития на уровне предприятия, региона, страны. Специалист экономического профиля (предприниматель, банковский служащий, работник управленческих отделов государственного предприятия) может рассчитывать на перспективы успешной деятельности только в том случае, если имеет представление о сущности, особенностях и возможностях информационной технологии, а также обладает хорошими практическими навыками ее использования.

Курс электрических цепей