Інформаційний супровід ідей і систем

Просте завдання: парсинг

З розвитком Інтернету перестали бути актуальними дані про кількостях, але утворився помітний інтерес до якісних показників. Шукати інформацію – класична задача, яку доводиться вирішувати щодня. Людина постійно щось збирає, аналізує і приймає рішення.

У практичному сенсі, коли потрібно прийняти рішення з конкретної виробничої або побутової проблему, людина звертається за допомогою до пошукових машин: Google, Yandex, Rambler і ін

Веб-ресурси надають необхідний сервіс. Маючи багаторічний досвід, розвинену програмно-технічну базу, ці сервіси не потребують інформаційному супроводі, впевнено займають свої ніші на ринку і в суспільній свідомості. Але не варто помилятися лідерам пошукової видачі. Їх позиція недосконала. Інформаційний супровід для них як і раніше актуально.

Правильно сформульований запит – велика ймовірність отримати достовірну відповідь, але достовірність не є метою сучасних пошукових машин. Яскраве підтвердження цьому – численні парсинги веб-ресурсів з метою пошуку необхідної і достовірної інформації.

Парсинг HTML-коду – це дуже просто. Гіпертекст – гранично формалізований текст. Проблема в тому, щоб розпізнане зміст веб-ресурсу правильно лягло на пошуковий запит і гарантовано дозволило отримати потрібну інформацію.

Але! Парсинг HTML-коду – це проблематичний тимчасової результат: власник ресурсу може змінити HTML-сторінку, і парсинг доведеться переписувати знову.