Структуровані дані: визначення та призначення

Управління даними

Робота зі структурованими ресурсами часто здійснюється за допомогою мови запитів (SQL). Це загальноприйнятий стиль програмування, створена для управління і виклику перевірки структурованих даних у системах роботи з реляційними базами.

Структуровані матеріали були величезним поліпшенням у порівнянні з неструктурованими системами на строго паперовій основі, але життя не завжди вписується в акуратні маленькі коробочки. В результаті всього, перший вид даних завжди повинен був доповнюватися сховищем паперу або мікрофільмів. Оскільки продуктивність технологій продовжувала поліпшуватися, а ціни знижувалися, стало можливим вводити обчислювальні системи неструктуровані і напівструктуровані матеріали.

Різні види

Неструктуровані дані — це всі ті речі, які не можуть бути легко класифіковані і поміщені в акуратну коробку або бібліотеку. Це, наприклад, фотографії і графічні зображення, відео, потокові дані інструментів, веб-сторінки, файли PDF, презентації PowerPoint, електронні листи, записи в блогах, вікі і документи для обробки текстів.

Напівструктуровані матеріали — це щось середнє між ними. Даний вид є тип аналізу структурованих даних, але в ньому відсутня суворе будова моделі інформації. У разі напівструктурованих варіантів, теги або інші типи маркерів використовуються для ідентифікації певних елементів, але відомості не мають жорсткої системи.

Як структурувати дані, приклад: програмне забезпечення для обробки текстів тепер може включати метадані, що показують ім’я автора, дату створення, при цьому основна частина документа являє собою неструктурований текст.

Електронні листи мають відправника, одержувача, дату, час та інші фіксовані поля, додані до змісту повідомлення електронної пошти і будь-яких вкладень. Фотографії або інші графічні об’єкти можуть бути помічені ключовими словами, такими як творець, дата, місце розташування та інше, що дозволяє упорядковувати і розміщувати графіку. XML та інші мови розмітки часто використовуються для управління полуструктурированными даними.