Skip to content
vivalaakam edited this page Jun 15, 2015 · 12 revisions

1. Охарактеризуйте соотношение понятий «информация», «данные», «знание»

Знания - организованная, интегрированная совокупность фактов, событий, предположений и правил, организованных для системного использования.

Информация - Любой факт, интегрированная совокупность фактов, событий, предположений и правил, организованных для системного использования.

Данные - представление информации в некотором формализованном виде, пригодном для передачи, интерпретации или обработки.

Информация появляется при использовании данных в процессе решения конкретных задач – формирования нового знания субъекта.

2. Приведите классификацию и охарактеризуйте основные компоненты ИС

С точки зрения применения информационные системы могут классифицироваться:

1. по характеру использования результатной информации:

  • информационно-поисковые (сбор, хранение, выдача информации по запросу пользователя);
  • информационно-советующие (системы поддержки принятия решений);
  • информационно-управляющие (результатная информация непосредственно участвует в формировании управляющих воздействий);

2. по функциональному назначению:

  • производственные ИС;
  • коммерческие ИС;
  • маркетинговые ИС;
  • финансовые ИС и т.д.

3. по объектам управления:

  • ИС автоматизированного проектирования;
  • ИС управления технологическими процессами;
  • ИС управления предприятием и т. д.

4. по степени автоматизации процессов обработки

  • ИС с ручной обработкой информации;
  • ИС механизированной обработки информации;
  • ИС автоматизированной обработки информации;
  • ИС автоматической обработки информации

С точки зрения назначения и применения ИС могут классифицироваться по следующим признакам:

  • по характеру использования результатной информации:
  • по области (сфере) применения:
  • по объектам управления:
  • по степени автоматизации
  • по степени специализированности возможного применения:


3. Дайте определение понятия «база данных»

Под базой данных (БД) обычно понимается именованная совокупность данных, отображающая состояние объектов и их отношении в рассматриваемой предметной области. Характерной чертой баз данных является постоянство: данные постоянно накапливаются и используются; состав и структура данных, необходимых для решения тех или иных прикладных задач, обычно постоянны и стабильны во времени; отдельные или даже все элементы данных могут меняться — но и это есть проявление постоянства постоянная актуализация.

4. Перечислите преимущества и недостатки использования БД

Иерархическая МД:

  • простота, использование отношений предок/потомок, быстродействие
  • нужно проходить всю цепочку групп.

Сетевая модель

  • гибкость, стандартизированность, быстродействие
  • жесткость БД, изменение структуры означало перестройку всей БД.

Реляционная модель более высокий уровень абстракции данных, за счет использования математической теории отношений

5. Определите основные функции и назначение СУБД

Система управления базами данных (СУБД) —это совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователям.

Обеспечивает:

  • сокращение избыточности данных
  • совместное использование
  • некоторая стандартизация
  • разграничение доступа
  • целостность данных

6. Перечислите основные требования, предъявляемые к БД

  • адекватность отображения предметной области;
  • возможность взаимодействии с БД разных пользователи при решении разных прикладных задач;
  • обеспечение независимости программ и данных;
  • надежность функционировании БД и зашита от несанкционированного доступа

Высокое быстродействие, время отклика, простота обновления данных, независимость данных, совместное использование многими пользователями, безопасность данных(защита от нарушения секретности) , адекватное отображение данных ,дружелюбный интерфейс.

7. Прямая и инвертированная формы представления информации

При прямой форме документы выводятся в есстественной последовательности (например, поисковая выдача), а при инвертированной будут представлены те же данные, но отсортированные или сгруппированные по определенным параметрам (например, по алфавиту)

8. Типология простых запросов

В Мартин приводится следующая типология простых (атомарных) запросов:

  1. А(Е) = ? Каково значение атрибута А для объекта Е?
  2. А(?) = V Какие объекты имеют значение атрибута равное V?
  3. ?(Е) = V Какие атрибуты объекта Е имеют значение равное V?
  4. ?(Е) = ? Какие значения атрибутов имеет объект Е?
  5. А(?) = ? Какие значения имеет атрибут А в наборе?
  6. ?(?) = V Какие атрибуты объектов набора имеют значение равное V?

Здесь в запросах типов 2, 3, 6 вместо оператора равенства может быть использован другой оператор сравнения (больше, меньше, не равно или другие).

Запросы типа 1 выполняются поиском по «прямому» массиву: доступ к записи производится по первичному ключу.

Запросы типа 2 выполняются поиском по инвертированному списку: доступ к записи(ям) производится по указателю, выбираемому из списка по значению вторичного ключа. Ответом в этих случаях будет значение атрибута или идентификатора.

Запросы типа 3 имеют ответом имя атрибута.

Запросы типа 2, 5, 6 относятся к нескольким атрибутам, и в этом случае могут быть построены несколько индексов, облегчающих поиск по этим ключам

9. Обобщенная булевоподобная форма выражения запроса документальных ИС

ПЗ ::= УП | ПЗ ЛО ПЗ | (ПЗ ЛО ПЗ)

ЛО ::= И | AND | ИЛИ | OR | , | НЕ | NOT | ^

ПЗ - предложение запроса

УП - условие поиска

ЛО - логический оператор

10. Перечислите основные операции процесса поиска информации

Алгоритм поиска включает, по крайней мере (необходимо), следующие операции:

  • выборку очередного объекта из массива для выполнения сравнения с запрашиваемым;
  • сравнение выбранного объекта с образцом;
  • принятие решения, соответствует ли объект образцу (определение степени соответствия и применение некоторого критерия для принятия решения на уровне двузначной логики «соответствует» / «не соответствует»);
  • переход к выборке следующего объекта или завершение процесса поиска

11. Охарактеризуйте типы информационной неопределенности при поиске

Особенности представления информации на разных уровнях человеко-машинной среды обуславливают различные типы неопределенности – семантическую, лингвистическую, метаинформационную.

Семантическая неопределенность связана с формализацией запроса. Формирую запрос, пользователь явно или неявно синтезирует ту информацию, которая, возможно, есть в отыскиваемом тексте.

Определяются понятия и связи между ними, т.е. происходит реконструкция пользователем гипотетического текста, предположительно совпадающего в известной части проблемы с возможно уже существующим текстом, и обозначение связи известного знания с выявлением неизвестного.

Лингвистическая (лексическая) неопределенность связана с формулировкой ПОЗа. Формулирую запрос, пользователь должен учитывать, что его представление об информации термина необязательно совпадает с представлениями индексатора. Для ИПЯ дескрипторного типа это в значительной степени лексическая неопределенность.

Метаинформационная неопределенность связана с тем, что пользователь должен иметь адекватное представление о самой системе и способе представления информации в ней. Например, как и по каким полям проводить поиск.

12. Определите условия установления соответствия информационной потребности и содержания БД

Простейшим вариантом критерия отбора является правило: доку мент считается формально релевантным, если количество общих слов, которые он имеет с запросом, не менее заданного порогового значения.

Этот критерии может быть усилен путем взвешивания, в частности, ранжирования терминов по их важности.

Сущность метода заключается в назначении пользователем терминам запроса весовых коэффициентов. При поиске документ будет релевантным, если сумма весовых коэффициентов совпавших терминов будет больше заранее установленной величины. Оценка семантической близости функцией «косинус» является своеобразной нормированной суммой «весовых» коэффициентов совпадающих терминов. Здесь запрос и документ представляются «-мерными векторами в пространстве терминов, где их /-е координаты принимают значения «единица» или «ноль» в зависимости от того, входит ли /-и термин в соответствующий поисковый образ.

Документ считается формально релевантным, если мера принимает значение не меньше порогового. В большинстве реальных ИПС критерии задается выражением алгебры логики, сформулированным пользователем на основании семантической структуры информационной потребности.

13. Охарактеризуйте основные этапы процесса информационного поиска. Перечислите основные и технологические объекты, используемые при поиске.

Процесс поиска информации представляет собой последовательность шагов, приводящих при посредстве системы к некоторому результату, и позволяющих оценить его полноту.

Цель создания ПОДа – представить изначально уникальный смысл документа компактной композицией признаков (например, в случае дескрипторных ИПЯ – ключевых слов), по возможности, не увеличивая комбинативность порождаемых ими возможных смыслов.

Цель построения ПОЗа – сохраняя уникальность проблемной ситуации, увеличить комбинативность смыслов, порождаемых композицией поисковых признаков запроса, для того, чтобы максимально охватить аспекты представления объекта поиска.

Следующий шаг – переход на лингвистический уровень – это нахождение множества имен понятий и, соответственно, терминов, образующих класс условий эквивалентности для каждого из исходных объектов в заданном аспекте. Другими словами, это формирование возможных вариантов грамматических конструкций, выражающих существо ИПП в каждом из возможных аспектов рассмотрения.

Метаинформационный компонент обеспечит семантику словоупотреблений, характерную для языка и отражающую практику индексирования Поисковый образ документа (ПОД) – описание документа, выраженное средствами ИПЯ и характеризующее основное смысловое содержание или какие-либо другин признаки этого документа, необходимые для его поиска по запросу.

Поисковый образ запроса (ПОЗ) – записанный на ИПЯ текст, выражающий смысловое содержание информационного запроса и содержащий указания необходимые для наиболее эффективного осуществления поиска

Алгоритм поиска

  1. определение темы запроса
  2. формирование запроса
  3. отбор документов
  4. формирование и управление выдачей найденных документов
  5. оценка результатов
  6. итоговая оценка
  7. развитие запроса

14. Определите назначение «обратной связи» в процессе информационного поиска.

Обратная связь по релевантности на уровне отдельных терминов должна обеспечить пользователю возможность целенаправленно изменять поисковой запрос путем повышения роли одних и понижения роли других терминов, не вникая в тонкости составления запроса.

Рассмотрим диалоговую модель поиска:

  1. Построение и ранжирование словника релевантных документов.
  2. Формирование матрицы поисковых результатов.

Использование в запросе терминов, выбираемых из текста релевантных документов, является по существу реализацией схемы реформулирования запроса по обратной связи. По характеру контекста здесь мы имеем два типа обратной связи: внутреннюю – на лингвистическом уровне, и внешнюю – на уровне семантики предметной области.

15. Определение и место понятия «Информационная технология»

Информационная технология (по Коллину 1995) - представленное в проектной форме (формализованном виде, пригодном для практического использования) концентрированное выражение научных знаний практического опыта, позволяющее рациональным образом организовать тот или иной достаточно часто повторяющийся информационный процесс. При этом достигается экономия затрат труда, энергии людских и материальных ресурсов, необходимых для реализации данного процесса.

Информационные технологии, в отличие от производственных(как следствие свойств самого объекта – информации), обладают рядом относительно специфических функций, таких как: сбор, регистрация, хранение, поиск, накопление, генерация, анализ, передача и распространение данных, информаци и и знаний. Информационная технология направлена на обработку и/или переработку “сырья” (в качестве которого выступают данные, информация) путем использования соответствующих “машин”, “механизмов” и“организационно-технологических приемов” (в качестве которых выступают аппаратные, программные, а так же организационно-методические средства).

Таким образом, информационную технологию (ИТ) можно определить как систему методов, способов и средств сбора, регистрации, хранения, поиска, накопления, обработки, генерации, анализа, передачи и распространения данных, информации знаний на основе применения средств вычислительной техники, программных средств и телекоммуникаций.

16. Технологии информирования. Основные схемы видов информирования: трансинформирование, дезинформирование, псевдоинформирование, конфузионное информирование.

Трансинформирование –правдивое информирование,при котором информация от источника воздействия (индуктора) передается к приемнику воздействия (реципиенту) без искажения.

Дезинформирование заключается в намеренном предоставлении объекту такой информации, которая вводит его в заблуждение относительно истинного положения дел. Оно включает в себя использование заведомо ложных данных и сведений.

Псевдоинформирование – полуправдивое, полуложное информирование, при котором в определенных пропорциях присутствуют как правда, так и ложь, логически взаимосвязанные между собой. Псевдоинформирование осуществляется путем увеличения или уменьшения объема информации. Избыточное целенаправленное информирование позволяет создавать ложное представление о наличии чего–либо. Обобщенное информирование создает расплывчатые (неясные) образы. Кажущееся информирование связано с повторением чужого оригинала, при чем оригинал каждый раз меняется на равнозначный.

Конфузионное дезинформированние - комбинация ложных и скрытых оригиналов . Информирование, которое в одних случаях приводит к превратному, в других –неудачному, в–третьих –необоснованному толкованию (объяснению) информации, называют парадезинформированием

17. Обобщенная схема абстрактного технологического процесса. Классы ИТ.

Целевая обработка — функционально-ориентированное преобразование получаемых или хранимых объектов обработки, обеспечивающее получение проектного результата под управлением субъекта (в качестве которого, так или иначе, выступает человек).

Информационные ресурсы — внешние по отношению к функциональному процессу источники информации, использование которых (обычно при управлении процессом) позволяет обеспечить эффективность целевой обработки.Интерфейсные средства реализуют тот или иной способ (режим) взаимодействия субъекта с компонентами функциональной обработки.

С точки зрения обобщенной схемы, ИТ можно подразделить на три основных класса:

  1. технологии собственно обработки информации (ввода, обработки, хранения, поиска и передачи данных)
  2. технологии человеко-машинного взаимодействия, реализуемые в интерфейсах
  3. инструментальные и другие вспомогательные технологии, позволяющие эффективно создавать и развивать ИТ предшествующих классов.

Разделение, отражающее специализированость используемых методов и средств, соответствует и «специализации» пользователей соответствующих технологий, где давно сложилось разделение на «разработчиков», «конечных пользователей» и «администраторов». С точки зрения этой «специализации» представляется целесообразным подразделять технологии на базовые, обеспечивающие и инструментальные.

18. Технологии распределенной обработки данных. Типовые схемы организации хранения данных и доступа по технологии «клиент-сервер».

Два класса систем распределенной обработки и системы распределённых данных: системы распределенной обработки в основном отражают структуру и свойства многопользовательских операционных систем с базой данных, размешенной на центральном компьютере;

Основные условия и требования к распределенной обработке данных:

  • прозрачность относительно расположения данных (СУБД должна представлять все данные так, как если бы они были локальными);
  • гетерогенность системы (СУБД должна работать с данными, которые хранятся в системах с различной архитектурой и производительностью);
  • прозрачность относительно сети (СУБД должна одинаково работать в условиях разнородных сетей);
  • поддержка распределенных запросов (пользователь должен иметь возможность объединять данные из любых баз, даже если они размешены в разных системах);
  • поддержка распределенных изменений (пользователь должен иметь возможность изменять данные в любых базах, на доступ к которым у него есть права, даже если эти базы размещены в разных системах);
  • поддержка распределенных транзакций (СУБД должна выполнять транзакции, выходящие за рамки одной вычислительной системы, и поддерживать целостность распределенной БД даже при возникновении отказов как в отдельных системах, так и в сети);
  • безопасность (СУБД должна обеспечивать защиту всей распределенной БД от несанкционированного доступа);
  • универсальность доступа (СУБД должна обеспечивать единую методику доступа ко всем данным).

Модель «клиент — сервер» - приложения, реализующие какой-либо тип модели, отличаются способом распределения функций ранее приведенных групп обработки данных между как минимум двумя частями: клиентской, которая отвечает за целевую обработку данных и организацию взаимодействия с пользователем; серверной, которая обеспечивает хранение данных, обрабатывает запросы и посылает результаты клиенту для специальной обработки.

В общем случае предполагается, что эти части приложения функционируют на отдельных компьютерах, т. е. к серверу БД с помощью сети подключены компьютеры пользователей (клиенты).

Сервер — это программа, реализующая функции собственно СУБД: определение данных, запись-чтение данных, поддержка схем внешнего, концептуального и внутреннего уровней, диспетчеризация и оптимизация выполнения запросов, защита данных.

Клиент — это различные программы, написанные как пользователями, так и поставщиками СУБД, внешние или «встроенные» по отношению к СУБД. Программа-клиент организована в виде приложения, работающего «поверх» СУБД и обращающегося для выполнения операций над данными к компонентам СУБД через интерфейс внешнего уровня. Инструментальные средства, в том числе и утилиты, не отнесены к серверной части очень условно. Являясь не менее важной составляющей, чем ядро СУБД, они выполняются самостоятельно, как пользовательское приложение.

19. Коммуникативные форматы. Назначение. Принципы построения само определенных форматов.

Коммуникативный формат - это информационно-техническое соглашение о представлении документа как совокупности отдельных элементов данных, их составе и правилах их записи на машиночитаемом носителе.

Отдельная запись в коммуникативном формате — это совокупность полей, описывающая одну или несколько информационных единиц (документов), рассматриваемых как единое целое. Но при этом каждый экземпляр записи в одном файле может иметь свой состав полей переменной длины и свой вариант представления данных Это достигается тем, что в структуре записи имеется три блока: заголовок, справочник, область элементов данных.

Размещение полей данных определяется справочником переменной длины. В свою очередь структура справочника и состав идентифицирующих элементы данных компонентов определяется заголовком.

В частности, заголовок содержит длину записи, базовый адрес области элементов данных (равный общей длине маркера записи и справочника), план справочника (длина компонента «длина поля данных», длина компонента «позиция начального символа»), идентификатор системы кодирования данных, длины индикатора и идентификатора, используемых для идентификации элементов данных данной записи.

Справочник состоит из переменного числа статей, каждая из которых идентифицирует соответствующее поле данных. Все статьи справочника имеют одинаковую структуру, задаваемую в плане справочника. Первые 3 позиции статьи справочника всегда занимает трехзначная метка поля.

Поля данных переменной длины следуют за справочником и содержат библиографические данные. Поле может состоять из одного или более элементов данных или подполей. Поле помимо метки идентифицируется индикатором, а подполе — идентификатором.

Такая структура формата может быть охарактеризована как «самоопределенная».

20. Объектная модель документа

Объектная модель документа (DOM) определяет некоторый стандартный набор объектов для представления HTML- и XML-документов, а также методы для доступа к ним и выполнения операций над ними. В целом API-интерфейсы XML подразделяются на две категории: основанные на древовидном представлении и основанные на обработке событий.

Интерфейс объектной модели документа, предложенной WWW-консорциумом представляет собой API-интерфейс для XML, основанный на древовидном представ­лении. Он описывает ряд независимых (от платформы и языка программирования) интерфейсов, позволяющих преобразовывать во внут­реннюю форму любые формально правильные документы XML или HTML. Интерфейс DOM формирует древовидное представление XML-документа в оперативной памяти и предоставляет доступ к классам и методам, позволяющим выполнять такие структурные манипуляции, как добавление или удаление элементов, а также изменение порядка следования элементов.

В частности, DOM определяет интерфейс Node с подклассами Element, Attribute и CharacterData. Интерфейс Node содержит методы для доступа к таким компонентам узла, как parentNode, который возвращает родительский узел, и childNodes, который возвращает множество дочерних узлов. В целом интер­фейс DOM в наибольшей степени подходит для выполнения таких структурных манипуляций с деревом XML, как добавление или удаление элементов, а также изменение порядка следования элементов.

21. XML. Назначение. Основные элементы языка DTD. XML-cхема

XML (Extensible Markup Language) - это язык разметки, описывающий целый класс объектов данных, называемых XML- документами. Этот язык используется в качестве средства для описания грамматики представления и контроля правильности составления документов. Т.е. сам по себе XML не содержит никаких тэгов, предназначенных для разметки – идентификации тех или иных конкретных полей данных, он просто определяет порядок их создания. Как отмечалось ранее, для описания данных в XML используются средства DTD или схема.

Если XML-документ не нарушает правила синтаксиса XML, то он называется формально-правильным или - хорошо оформленным документом, и разборщики XML-документов, будут работать с ним корректно. Правильные (то есть хорошо оформленные) XML-документы, удовлетворяющие требованиям, определяющим посредством DTD или XML-схем структуру и содержание, называются состоятельными. Однако кроме проверки на формальное соответствие грамматике языка, в документе могут присутствовать средства контроля за соблюдением правил, определяющих необходимые структурные соотношений между элементами, то есть семантику документа.

На сегодняшний день существует два средства, обеспечивающих контроль правильности XML-документа: это DTD-определения (Document Type Definition) и XML-схемы данных (Semantic Schema). Отметим, что определение DTD-правил для XML-документов не является необходимостью. Это позволяет создавать любые по структуре и наполнению XML-документы, однако не способствует эффективности информационного обмена, затрудняя понимание пользователем семантики принимаемых данных.

Определения типа документа (DTD) в XML-документах определяет набор действительных элементов, идентифицирует элементы, которые могут находиться в других элементах, и определяет действительные атрибуты для каждого из них.

XML-схемы данных являются альтернативным способом создания правил построения XML-документов. По сравнению с DTD, схемы обладают более широкими возможностями для определения типов данных и интеграции пространства имен, реализуя тем самым открытую модель данных. Безусловным достоинством схем является также то, что они позволяют описывать правила для XML-документа средствами самого же XML.

XML-документы, как и HTML, имеют два раздела: пролог и тело документа.

Пролог, предваряющий любой XML-документ, включает объявление XML и объявление типа документа. Объявление XML заключается между парами символов и ?> и может включать указание текущего стандарта, объявление кодировки и объявление самостоятельности, например объявление XML-документа с внешним DTD-определением в файле sample.dtd:

К телу документа относится все кроме пролога. Тело XML-документа состоит из элементов разметки и непосредственно содержимого документа - данных. XML-тэги предназначены для определения элементов документа, их атрибутов и других конструкций языка. Любой XML- документ должен всегда начинаться с инструкции , внутри которой также можно задавать номер версии языка, номер кодовой страницы и другие параметры, необходимые программе-анализатору в процессе разбора документа.

22. локальные и глобальные сети

Локальная вычислительная сеть (ЛВС) — коммуникационная система, поддерживающая в пределах одного здания или некоторой ограниченной территории один или несколько высокоскоростных каналов передачи цифровой информации, предоставляемых подключаемым устройствам для кратковременного монопольного использования.

Глобальная вычислительная сеть — сеть передачи данных, охватывающая значительное географическое пространство (регион, страну, ряд стран, континенты).

23. Web технология. схема организации доступа к web страницам

  • Программы-клиент(браузер)
  • Программы просмотра документов отличных от web
  • Программы-серверы обмена текстовой информацией
  • Программы подготовки публикаций
  • Поисковые машины
  • Программы анализа статистики посещения
  • Воздействие по протоколу TCP/IP

24. Технологическая схема организации доступа к информации по протоколу HTTP.

Основными компонентами данных технологий, состоящих в применении гипертекстовой модели к информационным ресурсам, распределенным в Internet, являются:

  • HTML — язык гипертекстовой разметки документов;
  • URL — универсальный способ адресации ресурсов в сети;
  • HTTP (Hypertext Transfer Protocol) — протокол обмена гипертекстовой информацией;
  • дополнительные средства (CGI, Java, JavaScript).

HTTP (Hypertext Transfer Protocol) — протокол прикладного уровня, который разработан для обмена гипертекстовой информацией в сети Internet и используется в Word Wide Web с 1990 г

Реальная информационная система требует гораздо большего количества функций, чем только поиск данных. HTTP позволяет реализовать в рамках обмена информацией широкий набор методов доступа.

Программа-клиент посылает после установления соединения запрос серверу. Этот запрос может быть в двух формах: в форме полного запроса и в форме простого запроса. Простой запрос содержит метод доступа и запрос ресурса. Например:

get http://polyn.net.kiae.su

25. Поисковые системы в Internet. Назначение, область применения.

Назначение:

Свободный поиск информации в информационных массивах по совокупности признаков (обычно ключевых слов) - ретро-поиск

Поиск информации по заранее подготовленным запросам с определенной периодичностью - избирательное распространение информации.

Основные причины существования ИПС:

  • большой объем информации
  • ее недостаточная или чересчур подробная структуризация
  • широкий тематический профиль информационных массивов

Работа поисковой системы обеспечивается тремя составляющими:

  • Программа «робот» (спайдер). Она анализирует ресурсы и производит их индексацию.
  • Индексы поисковой системы. Они формируют создаваемые поисковой системой собственные БД.
  • Программа, которая в соответствии с запросом пользователя готовит ему ответ на основе анализа индексов, то есть собственных БД.

Поисковики:

  • Яндекс
  • Mail.ru
  • Google
  • Rambler
  • Yahoo

26. Назначение и архитектура протокола Z39.50. Понятие абстрактной базы данных.

Назначение: протокол описывает интерактивную сессию между источником запросов и приемником, обслуживающим эти запросы. Это возможность сохранения состояния системы и присвоение ему идентификатора.

В основе лежит абстрактная БД – каждый элемент этой модели имеет описание с однозначным толкованием и стандартизируется с присвоением уникального идентификатора

Модель службы Z39.50 предусматривает обмен сообщениями типа "запрос - ответ" между соответствуюшими приложениями -клиентом и сервером. Формат таких сообщений и определяется протоколом Z39.50. После установления ТСР-соединения (или любого другого, зависящего от способа передачи данных) устанавливается Z39.50-соединение.

Получив от клиента запрос на инициализацию сессии, сервер формирует ответ - сообщения о параметрах сеанса, видах услуг, поддерживаемых клиентом и сервером, после получения которого клиентом Z39.50-соединение считается установленным. Далее клиент может либо продолжить работу с такими параметрами, либо закрыть соединение и попытаться затем установить новое - быть может, с другими параметрами, и передавать запрос на поиск информации.

27. Примерный состав и структура электронной библиотеки.

  1. ЭБ РГБ формируется как единая база данных, состоящая из электронного каталога электронной библиотеки (ЭКЭБ) и фонда ЭБ.
  2. РГБ стремится в будущем объединить ЭК РГБ и ЭБ в единую систему на основе общего программного обеспечения. Основой для объединения ЭКЭБ и ЭК РГБ являетс я единый формат библиографических записей MARC21.
  3. Фонд ЭБ будет иметь трехуровневую структуру: коллекция (и ее метаинформация) — документ (и его метаинформация) — объект (и его метаинформация).
  4. Структуры данных в ЭБ могут состоять из нескольких составляющих с различными типами данных, могут быть связаны с другими материалами связями типа “часть/целое” или “последовательность”. Электронный документ может состоять из страниц, глав, индексов, иллюстраций и других элементов, может физически сохраняться в виде нескольких файлов, содержащих текст и графику со связями между ними. Однако любой отдельный документ, состоящий из нескольких файлов, “собирается” в один файл и снабжается титульным листом. На каждый многостраничный документ, включаемый в ЭБ, формируется новый титульный лист.

28. Человеко-машинные интерфейсы. Типы интерфейсов и их характеристика



Текстовые (текст-ориентированные) интерфейсы


В качестве примера, можно привести интерфейс командной строки DOS или shell-интерпретатор UNIX. Пользователь взаимодействует с вычислительной системой с помощью клавиатуры, набирая специальные команды, для задания различных опций служат параметры. Система как ответ на действия
пользователя выдаёт или сообщения, или результат выполнения введенной команды в текстовом виде. Курсор может иметь вид мигающего прямоугольника или чёрточки, обозначающей место ввода.


В таком режиме можно одновременно взаимодействовать лишь с одной программой, хотя потенциально могут выполняться несколько различных программ. Управлять взаимодействием этих программ можно только с командной строки, причём проверить результат – по окончании
работы. Главный недостаток подобных систем – для эффективного использования их пользователю необходимо знать синтаксис всех команд, а также все ключи и опции.


Смешанные (псевдографические) интерфейсы


Псевдографическими будем обозначать интерфейсы, где уже присутствуют графические интерфейсные элементы, например кнопки, индикаторы прогресса выполнения, меню, но всё это реализуется с помощью псевдографики набора ANSI. Как пример, можно привести всем известную программную оболочку FAR. Псевдографический интерфейс можно отнести к промежуточномумежду чисто командным интерфейсом и графическим. Он в большинстве случаев обладает всеми преимуществами первого (использование мощных языков, расширяемость), и устраняет некоторые недостатки (позволяет легче управлять системой, нагляднее представить файловую систему, например). К большинству его недостатков
относятся практически те же: бедность вариантов представления данных, невыразительность интерфейса, нарастающая сложность при попытке перенести команду с множеством опций в режим, когда в окне следует просто выбрать нужные пункты.



Графические интерфейсы


К этому типу интерфейсов относят все оконные чисто графические системы Windows, оболочки для UNIX – KDE, GNOM, CDE, X-Window, Photon из ОС QNX, Aqua из MacOS X. Графическими они называются потому, что все элементы пользовательского интерфейса, как и сами
данные в окнах, отображаются в графическом режиме, с помощью 256, 16-битной или 32-битной глубины цветового буфера. Это позволяет сформировать привлекательные с точки зрения пользователя окна,кнопки, пиктограммы, ползунки, индикаторы.


Интерфейс пользователя – это совокупность правил, методов и программно-аппаратных средств, обеспечивающих взаимодействие пользователя с компьютером. Пользовательский интерфейс часто понимают только как внешний вид программы. В действительности интерфейс пользователя включает в себя все аспекты, оказывающие влияние на взаимодействие пользователя и системы, и определяется такими факторами, как:


  1. «набор задач пользователя, которые он решает с помощью системы;

  2. используемая системой метафора (например, рабочий стол и т.п.);

  3. элементы управления системой;
  4. навигация между структурными компонентами системы;

  5. визуальный дизайн системы».


Главная задача интерфейса – дать возможность пользователю эффективно работать с нформацией без помощи человека-посредника.

29. Метафора управления графических интерфейсов. Типы интерфейсов и их характеристики.

Графический интерфейс пользователя, графический пользовательский интерфейс — разновидность пользовательского интерфейса, в котором элементы интерфейса (меню, кнопки, значки, списки и т. п.), представленные пользователю на дисплее, исполнены в виде графических изображений. Графический интерфейс пользователя является частью пользовательского интерфейса и определяет взаимодействие с пользователем на уровне визуализированной информации.

В отличие от интерфейса командной строки, в GUI пользователь имеет произвольный доступ (с помощью устройств ввода — клавиатуры, мыши, джойстика и т. п.) ко всем видимым экранным объектам (элементам интерфейса) и осуществляет непосредственное манипулирование ими. Чаще всего элементы интерфейса в GUI реализованы на основе метафор и отображают их назначение и свойства, что облегчает понимание и освоение программ неподготовленными пользователями.

Отправной точкой хорошего интерфейса является метафора. Обстановка на экране и способы взаимодействия с системой должны апеллировать к ситуации, хорошо знакомой пользователю. Так, оконный интерфейс задумывался как метафора рабочего стола с документами. Использование метафоры очень важно. Во-первых, пользователю легче понимать и интерпретировать изображение на экране. Во-вторых, ему не нужно каждый раз заглядывать в руководство, чтобы узнать, как выполняется то или иное действие. По крайней мере, некоторые действия должны «естественно» следовать из метафоры. В-третьих, у пользователя возникает чувство психологического комфорта, характерного для встречи с чем-то знакомым.

Диалог – регламентированный обмен информацией между человеком и компьютером, осуществляемый в реальном масштабе времени и направленный на совместное решение конкретной задачи: обмен информацией и координация действий. Каждый диалог состоит из отдельных процессов ввода-вывода, которые физически обеспечивают связь пользователя и компьютера.

Типы диалога. Тип диалога определяет, кто из «собеседников» управляет процессом обмена информацией. Различают два типа диалога: управляемые программой; управляемые пользователем.

Диалог, управляемый программой, предусматривает наличие жесткого, линейного или древовидного, т.е. включающего возможные альтернативные варианты, сценария диалога, заложенного в программное обеспечение. Такой диалог обычно сопровождают большим количеством подсказок, которые уточняют, какую информацию необходимо вводить на каждом шаге.

Диалог, управляемый пользователем, подразумевает, что сценарий диалога зависит от пользователя, который применяет систему для выполнения необходимых ему операций. При этом система обеспечивает возможность реализации различных пользовательских сценариев.

30.  Назначение и примеры кросстехнологий.

К данному классу отнесены технологии  пользователя, ориентированные на следующие (или аналогичные) виды преобразования информации:

  • распознавания символов
  • звук-текст
  • текст—звук
  • автоматический перевод

ABBYY FineReader Google-translate,технология «text-to-speech» («текст в речь», чтение синтезированным голосом, синтез речи)

31. Основные принципы распознавания символов (OCR)



При сканировании, чтобы превратить группы пикселей в доступные для редактирования символы и слова, изображение должно пройти сложный процесс, известный как оптическое распознавание символов (optical character recognition — OCR).

OCR-технология в настоящее время приобрела следующий вид:


  • считывание исходного документа осуществляется универсальным сканером, осуществляющим создание растрового образа и запись его в оперативную память и/или в файл; 
* функции распознавания полностью возлагаются на программные продукты, которые, естественно, получили название OCR-software

32. Основные принципы система распознавания речи


Системы распознавания речи обычно состоят из двух компонентов, которые могут быть выделены в блоки или в подпрограммы
—акустической и лингвистической. Лингвистическая часть может включать в себя фонетическую, фонологическую, морфологическую, синтаксическую и семантическую модели языка.

Акустическая модель отвечает за представление речевого сигнала. Лингвистическая модель
 интерпретирует информацию, получаемую от акустической модели, и отвечает за представление результата распознавания потребителю.


33. Основные принципы систем генерации речи



Обратная распознаванию задача — синтез речи, или Text-to-Speech (TTS). Качество речи прямо пропорционально размеру синтезатора и объему потребляемых им ресурсов системы (загрузка процессора, выделение памяти и т. п.) Для характеристики качества речи обычно
используют такие понятия, как естественность звучания, фонетическая разборчивость, комфортность восприятия и время привыкания.

34. Основные принципы систем автоматизированного перевода.

Текст на входном языке поступает в систему перевода, на этапе семантико-синтаксического анализа выявляется его грамматическая структура, распознаются наименования понятий и устанавливаются отношения между понятиями.

На этапе трансфера производится переход от наименований понятий и структуры текста на входном языке к наименованиям и структуре текста на выходном языке.

В результате семантико-синтаксического синтеза на основании полученных эквивалентов получается текст на выходном языке (его грамматическое оформление)

Clone this wiki locally