ІПС – це… Призначення та функції інформаційно-пошукових систем

Сучасній людині важко уявити собі життя без інтернету і практично миттєвого доступу до джерел інформації. Користувач рідко замислюється про те, як здійснюється пошук потрібного контенту в мережі. А адже це дуже цікаво.

Інформаційно-пошукова система (ІПС) – це складний програмно-апаратний комплекс, що здійснює відбір інформації за запитом користувача. Інформація зберігається на серверах в цифровому вигляді, як раніше стояли книги на полицях бібліотек. Система складається з безлічі підсистем. Кожна виконує свою задачу в процесі обробки запиту користувача та надання йому інформації в текстовому або звуковому вигляді. Множинністю розв’язуваних завдань і обумовлена складність архітектури сучасних ІПС (абревіатура інформаційно-пошукової системи). Такий собі “чорний ящик”: на вході – текст запиту, що всередині – невідомо, на виході – вичерпна інформація.

Вхідні потоки

Запити на отримання інформації, які формує людина в текстовому вигляді на екрані свого гаджета, становлять малу частину оброблюваних пошуковою системою запитів. Основні масиви запитів для пошуку формують роботи приймають запит людини і здійснюють багатокроковий пошук і зворотний зв’язок з користувачем. До інформаційно-пошуковим системам ставляться відомі всім Google, “Яндекс” і інші, які обробляють щодня мільйони запитів.

Початкові об’єкти пошуку

Набором вихідних об’єктів, що представляють інтерес для пошуку, є документи, записи, відеофільми, зображення та інше. Створюються вони поза ІПС. Загальна система зберігання і пошуку інформації повинна мати вбудовану бібліографічну систему – своєрідний каталог, що дозволяє здійснювати пошук будь-якого роду об’єктів.

Об’єкти або їх цифрові перетворення стають “ресурсом входу” в ІПС. Це серед них відбирають потрібну користувачу інформацію.

Зовнішні джерела

У поданні вибору інформації використовуються зовнішні джерела знань. Це та інформація, яку шукає користувач. Назва фільму, цитата з книги та інше. Для комп’ютерного пошуку цю інформацію необхідно перевести в запит на алгоритмічній мові. В ІПС це здійснюється з допомогою створення блоку, індексування та розробки запитів.

В ідеалі ці три процеси – репрезентація, індексація та розробка запитів –повинні спиратися на ідентичні джерела знань, але на практиці це недосяжно.

Необхідно постійно переглядати та оновлювати джерела знань, причому оновлення повинно бути ідентичним і синхронізованим. Та й зовнішній джерело знань завжди хронологічно передує використанню його в пошукових системах для запиту, іноді на кілька років.

Подання

Подання вихідних об’єктів складаються із вхідних даних в деяку комбінацію або перетворюються у відповідності з правилами та алгоритмами конкретної інформаційно-пошукової системи.

Уявлення – це більш або менш перетворені копії вихідного об’єкта пошуку. У колекції невідредаговані повних текстів кожен текст є власним уявленням. У колекції об’єктів музейних експонатів і артефактів поданням може бути трансформована опис об’єкта з його зображенням. У деяких випадках подання може бути частково отримано з вихідного об’єкта і частково з опису: у бібліографічних системах пошуку уявленнями є похідні від об’єкта – наприклад, назва, ім’я автора буде поєднуватися з анотацією твори.

Індекс пошуку

Так як інформація в інформаційно-пошукових системах зберігається у формі подання, логічно припускати, що пошук здійснюється за поданням після відбору видається користувачу. На практиці це не так. Наприклад, поточні каталоги мережевих бібліотек зазвичай обмежують пошук по декільком полям: автору, заголовка і підзаголовків подання, що містить інших поля, за яким пошук не виконується. Це достатня причина, чому необхідно розрізняти поданням і індекс пошуку, який є частиною пошукової подання. Він визначає все, що повинно бути доступно для пошуку. Індекс з можливістю пошуку, як уявлення і вихідний об’єкт, може бути розділений на окремі субіндекси, щоб забезпечити більш точний, цільовий пошук

Пошукові системи зазвичай мають всередині синтетичну структуру для зіставлення допустимих результатів пошуку. Ця структура є другим компонентом індексу з можливістю пошуку.

Процедурно процес індексації може бути реалізований по-різному: індекс, доступний для пошуку, може бути отриманий шляхом:

  • буквального копіювання подання, доступного для пошуку;
  • шляхом копіювання деталей подання. Це може бути частина або всі подання, які існують фізично тільки у вигляді фрагментів, розподілених за правилами створення індексу для пошуку, який буде зібраний при необхідності.

Правила розробки запитів і формальні запити

Розробка запитів – це функція, яка є посередником між запитом користувача і формальним запитом. Вона перетворить запит користувача, погоджуючи його зі словниками команд вилучення, специфікації індексу та індексу до вилучення. На зорі розвитку ІПС ця роль традиційно відводилася кваліфікованих IT-фахівців.

Розробка комп’ютерних запитів, які можуть зіставляти запити зі словником в індекс системи з можливістю пошуку, зазвичай називається модулем “введення словника”. Автоматизація цієї функції перспективна і пропонує можливості для експертних та імовірнісних методів пошуку.

Формальний запит стає таким після перетворення запиту користувача. Приклади таких формальних перетворення включають усічення, підстановку, нормалізацію, векторизацію та інші перетворення “зовнішнього” подання во “внутрішні” подання комп’ютерних ІПС (розшифровка – інформаційно-пошукова система).

Отримані набори посилань на документи

Отриманий набір джерел інформації логічно є підмножиною уявлень, створений за правилами зіставлення, застосованого до формального запитом індексом з можливістю пошуку.

Зазвичай, але не обов’язково, існує окремий процес сортування відновленого набору інформації. Онлайн-каталоги бібліотек зазвичай переупорядочивают отримані набори в алфавітному порядку за автору перед відображенням. В системах пошуку інформації, які виробляють суворе ранжування, ранговий порядок передує будь-якому переупорядочиванию.

Вихідні потоки

Висновок результатів пошуку здійснюється традиційно на дисплей, частіше у вигляді потоку об’єктів, які будуть використовуватися в іншому місці або для деяких інших цілей, завершує основний цикл пошуку.Такі потоки можуть бути спрямовані на пристрої візуалізації, зберігання для подальшої обробки або використання в якості вхідних потоків інші служби відбору.

Інформаційно-пошукові системи дозволяють здійснювати зворотний зв’язок з виходом будь-якого процесу відбору. Вихідні дані будь-якого процесу можуть представляти собою зворотний зв’язок з іншими процесами. Зворотній зв’язок може забезпечити основу для експертного судження на будь-якому етапі.