logo
456834

Понятие об информационно-поисковом языке, основные признаки и структура ипя.

ИПЯ – разновидность ИЯ предназначенная для индексирования документов, информационных запросов, описания фактов с целью последующего хранения и поиска.

Назначение ИПЯ: устранение избыточности и недостаточности естественного языка, для целей информационного поиска. Ликвидация присутствующей в искусственных языках синонимии и омонимии для реализации однозначности информационного поиска.

Требования:

- полно и точно передавать содержание, а при необходимости – форму и назначение документа;

- обеспечить однозначное толкование терминов индексирования;

- допускать многоаспектное индексирование;

- допускать внесение изменений (дополнений и исправлений) - гостепреимность;

- обеспечивать достаточную простоту и удобство индексирования, информационного поиска и ведение данной ИПС;

- отражать современное состояние терминосистемы в данной области знания;

- наличие логических и ассоциативных отношений между словами полезных для поиска (иерархия).

Структура ИПЯ:

1. Алфавит - совокупность знаков и символов и правила их применения, используемые для представления лексических единиц и их взаимоотношений. В состав знаков и символов входят : совокупность букв алфавита какого-либо естественного языка (латинского, кириллического и др.); арабских и римских цифр; знаков пунктуации (точка, запятая, двоеточие, кавычки, дефис, круглые и квадратные скобки, апостроф и др.); знаков арифметических операций (плюс, минус, косая черта, знак процента и др.); знаков отношений (больше, меньше, равно); операторов булевой алгебры (знаки конъюнкции, дизъюнкции, отрицания); специальных знаков и символов (стрелки, двойное двоеточие, квадрат, знак конгруэнтности, астериск и др.).

2. Грамматика – правила построения ЛЕ.

3. Лексика – словарный состав, совокупность ЛЕ (обозначение отдельного понятия принятое в ИПЯ, и неделимое в этой функции), то есть группировка ЛЕ в определенной последовательности (комбинации).

4. Отношения (связи):

- парадигматические – смысловые, логические отношения между ЛЕ независящие от контекста, они позволяют осуществить избыточное индексирование путем включения в поисковый образ близких по смыслу ЛЕ с целью повышения полноты поиска. Представление ПарО: деревом систематической классификации (иерархия), ссылочно-справочным аппаратом, фасетные формулы, пометы в словарной статье дескрипторных языков – уточняют содержание понятий.

- синтагматические – отношения между ЛЕ, по средствам фонетики (звук), синтаксиса (построения предложения), морфологии (предложения, слова, части речи). Синтаксические категории – способ организации слов в словосочетании. Это отношения слов, их сочетаемость, способность соединится с другими словами для образования словосочетаний и предложений.

5. Система ведения

6. Правила интерпретации (с естественного языка и наоборот).