Вид, створення і структура XML-файлу

XML – це розширення файлу Extensible Markup Language, застосовуваного для створення загальних інформаційних форматів і спільного використання як формату, так і даних у Всесвітній павутині, интрасетях і в інших місцях з використанням стандартного тексту ASCII. Це універсальний формат даних і структурованих документів з розширенням XML. Як і HTML, він використовує теги слова, розділені символами “>” і “<” для структурування даних в документі. Але що входить в структуру XML-файлу?

Короткий вступ в мову

Досліджуваний мову (EXtensible Markup Language) почав розвиватися з вересня 1996 року, за підтримки W3C, з метою створення оптимізованого інструменту для інтернету. Структура XML-файлу поєднує простоту HTML з виразними можливостями свого попередника, SGML. У його розробці взяли участь такі компанії, як Microsoft, IBM, Sun Microsystems, Novell і Hewlett-Packard. Версія 1.0 була ратифікована W3C на конференції SGML/XML, що відбулася у Вашингтоні в грудні 1997 року. Через кілька років XML став мовою, які надали найбільший вплив на розробку додатків для публікації контенту в інтернеті.

Редакція документів переслідує наступні цілі:

  • Розрізняти зміст і структуру XML-файлу за поданням на папері або на екрані.
  • Уточнювати пристрій і інформативний зміст.
  • Створювати документи, якими можна обмінюватися і легко обробляти в різнорідних комп’ютерних системах.
  • Створення форматів, у якому мітки встановлюються в тексті документів, щоб розрізняти його частини або елементи структури XML-файлу.
  • Основними характеристиками мови є:

  • Можливість описової маркування, з відкритим набором тегів. В HTML і XML мітки перемежовуються в документах. Основна відмінність між тим і іншим полягає у функції цих брендів.
  • Функція диференціації інформативного вмісту документів у порівнянні з використанням в HTML, де мітки служать для вказівки того, як вміст має проглядатися.
  • З іншого боку, в той час, як HTML повідомляє, які мітки можна використовувати при створенні документа, вивчає мову не визначає припустимий набір тегів. Але він пропонує правила створення XML-файлів, які дозволяють встановлювати нові словники і набори міток для різних типів.
  • В ньому встановлена чітка різниця між структурою документа та його поданням. Мітки XML-документа нічого не вказують на те, як він повинен бути представлений. Щоб представити його на екрані або на папері, необхідно буде створити окрему таблицю стилів і пов’язати її пізніше з документом.
  • При підключенні клієнтського комп’ютера до бази даних, SQL відправляється в БД об’єднання використовує оболонку XML для доступу до них з файлу. Вони повертаються на клієнтський комп’ютер у вигляді структурованих даних, що містяться в реляційній таблиці результатів.

    За допомогою оболонки XML можна відображати дані з зовнішнього джерела в реляційну схему, що складається з набору псевдонімів. Структура документа логічно еквівалентна реляційною схемою, де повторюються і вкладені елементи моделюються як окремі таблиці з зовнішніми ключами.

    Безперервна еволюція мови

    З часу свого першого виходу в інтернет мову XML викликав велику кількість ініціатив, пов’язаних з обміном і кодуванням контенту і метаданих. XML одноголосно став основним варіантом для управління і відновлення даних. Список ініціатив є широким, і хоча не всі з них досягли однакового рівня прийняття, існують численні приклади успішного застосування мови в академічній, ділової та інституційній сферах.

    Протягом 2004 року з’явилися публікації нових пропозицій та ініціатив, пов’язаних з використанням мови. В якості прикладів можна згадати постійну публікацію нових версій комп’ютерних програм, призначених для роботи з XML, розробку нових словників або прийняття мови в різних сферах роботи.

    Extensible Markup Language має велику підтримку з боку міжнародних органів стандартизації, що дозволило забезпечити високий рівень стандартизації сфери електронної торгівлі між компаніями. Доказом цього є публікація в якості стандарту ISO специфікацій мови і недавнє оновлення стандарту UDDI (універсальне опис структури XML-файлу і виявлення). Ці два стандарти пробудили інтерес до нових інвестицій в інформаційні технології, який у попередні роки сповільнився через недовіру до інтернет-ринків.

    Розширювана мова розмітки

    XML схожий на HTML. Вони містять символи розмітки для опису сторінки або файлу. HTML, однак, описує зміст веб-сторінки в основному у вигляді текстових і графічних зображень, тільки з точки зору того, як вони повинні відображати і взаємодіяти.

    XML описує в термінах вміст даних, які описуються. Наприклад, слово «phonenum», поміщене в теги розмітки, може вказувати, що наступними даними буде номер телефону. Файл XML може оброблятися програмою виключно як дані, зберігатися з аналогічними на іншому комп’ютері або відображатися, як HTML-файл. Наприклад, в залежності від того, як додаток на приймаючому комп’ютері буде обробляти номер телефону, воно може бути збережено, відображено або набрано.

    XML вважається розширюваним, тому що, на відміну від HTML, символи розмітки є необмеженими і самоопределяющими. XML – це просте і легке у використанні підмножина стандарту Standard Generalized Markup Language (SGML) для створення структури документа. Очікується, що HTML і XML будуть використовуватися разом у багатьох веб-додатках. Наприклад, розмітка XML може відображатися на сторінці HTML.

    Псевдоніми відповідності

    Псевдоніми, відповідні XML-документом, організовані в деревоподібну структуру, де дочірні псевдоніми співвідносяться з елементами, які відповідають батьківському. Коли вони повторюються або мають диференційовані ідентифікатори зі складними структурами, можна вказати різні псевдоніми для кожного вкладеного елемента.

    Псевдоніми батьки і діти пов’язані первинними і зовнішніми ключами, що генеруються оболонкою. Виразу XPath використовуються для кореляції документа XML з реляційною схемою, що складається з набору псевдонімів. XPath – це механізм адресації для ідентифікації частин файлу XML, наприклад, груп вузлів і атрибутів в дереві XML-документа.

    Основний синтаксис аналогічний адресації файлової системи. Кожен псевдонім визначається виразом XPath, яке ідентифікує елементи представляють окремі кортежі, і набір виразів, що встановлюють, як витягувати значення стовпців кожного елемента.

    XML-документа співвідноситься з набором псевдонімів, а батьківські і дочірні відносини встановлюються з використанням зовнішнього і первинного ключів. Виразу XPath використовуються для визначення окремих кортежів, і стовпців в кожному елементі документа, а також спосіб виконання запиту в документі XML після його реєстрації в системі об’єднання.

    Деревоподібна структура зразка документа

    Документи XML повинні мати кореневий елемент – батьківський для всіх інших. Вони можуть містити вкладені елементи, текст і атрибути. Дерево, представлене таким документом, починається з елемента-кореня і розгалужується до самого нижчого рівня елементів. Хоча немає єдиної думки щодо термінології, використовуваної в деревах XML, W3C випустив принаймні дві стандартні термінології:

  • Термінологія, що використовується в моделі даних XPath.
  • Термінологія, використовувана в інформаційному наборі XML.
  • XPath визначає синтаксис з ім’ям виразів, який ідентифікує один або декілька внутрішніх компонентів елементів і атрибутів документа XML. XPath широко використовується для доступу до XML-кодованих даних.

    Інформаційний набір XML описує абстрактну модель даних для документів в термінах інформаційних елементів. Він часто використовується в специфікаціях власної мови для зручності опису обмежень на конструкції, що допускаються ними.

    Обмін даними

    Можливість відокремлювати зберігання даних від перегляду означає, що з XML можна зберігати свої дані в одному форматі і переглядати їх різними способами, не змінюючи спосіб зберігання. Мова може описувати те, що представляють дані. Це означає, що можна описати, як їх відображати – колір, шрифт, форматування і що вони представляють, наприклад, сигнал, отриманий з осцилографа, значення індикатора тривоги і багато іншого.

    Разом ці переваги дозволяють зберігати будь-яку інформацію в єдиному форматі зберігання, які можна визначити для додатків. Також можна отримати доступ до них у будь-якому іншому додатку, просто знаючи, що воно читає файли XML. Це корисно на одному комп’ютері для обміну даними між додатками, а реальна перевага цієї функції полягає в мультикомпьютерной середовищі.

    Можна використовувати наступний приклад в якості моделі того, як створити файл XML та відобразити дані з нього. Припустимо, завершено отримання ряду точок даних з тестової платформи та проведено деякий базовий аналіз цих даних.

    Далі потрібно записати всі ці необроблені дані разом з аналізом у файл. Щоб вивести їх у файл, необхідно спланувати, як повинен виглядати XML-файл, який потрібно створити. За допомогою цієї схеми записуються всі дані та результати аналізу в XML-файл. Можливість налаштовувати поля у файлі, такі як «дані», «середнє», «max» та «min», є частиною гнучкості і могутності XML.

    Розробка тестових додатків

    Коли у користувача є XML-файл, який містить корисні дані, рано чи пізно, буде потрібно їх застосувати. Для цього можна легко відобразити їх у будь-якому текстовому редакторі, або відкрити в браузері з підтримкою XML, наприклад, в Microsoft Internet Explorer. Якщо потрібно відобразити їх не просто у вигляді тексту, можна використовувати всі – від додатків бази даних до веб-браузерів.

    Для читання XML-файлу програми потрібна таблиця стилів. Використовуючи таблиці стилів, можна переглядати одні й ті ж дані різними способами. Наприклад одну таблицю стилів для відображення інформації для клієнтів та іншу для подання інформації фахівцям, яким може знадобитися конкретна інформація для усунення проблеми. І також можна використовувати третю таблицю стилів для завантаження даних у загальну систему БД підприємства.

    При виконанні цього завдання заздалегідь потрібно буде створити три різних методи виведення даних. Використовуючи XML і таблиці стилів, потрібно всього лише створити один файл даних, який можна переглядати в декількох форматах, відповідних конкретних задач. Більш того, більше не потрібно вказувати тип додатка, який буде переглядати дані, тому що кінцевий користувач може створити свою власну таблицю стилів для задоволення потреб додатки, як тільки буде надано файл XML.

    XML визначить загальнокорпоративні стандарти даних, тому розробнику потрібно буде спроектувати тільки один файл схеми, який може використовувати, застосовуючи відповідні частини схеми у відповідності з потребами свого додатка. Потім залишається тільки розробити таблицю стилів для кожного подання даних.

    За допомогою цієї системи тестові та вимірювальні програми можуть легко обмінюватися даними з будь-яким додатком на підприємстві і кожне з них може створювати дані, і відображати їх в іншому.

    Механізм XDTO в 1С

    Творці 1С, ставлячи перед собою завдання обміну даних з використанням мови, що вивчається, розробили механізм – XDTO для об’єктів передачі структури XML-файлу 1С. Які переваги? Версія програми 8.1 і вище дозволяє обмін інформацією з системами, не заглиблюючись в теми створення XML-файлу, вирішуючи більшість проблем 1С. І також можна відправляти тільки необхідну інформацію для утворення документа. Для цього програмісту потрібно заздалегідь виконати деякі процедури.

    Для завантаження файлів XML з використанням XDTO, потрібно передати структуру файлу 1C з допомогою набору схем, створених у текстовому редакторі або використовувати спеціальне ПЗ. Результатом повинен бути файл, що описує унікальний тип і структуру, використовують XML. Перш ніж читати або писати останній файл, програміст завантажує отриману конфігурацію в області «Пакети XDTO». Для відтворення у користувача повинен бути основний елемент і вкладення з атрибутами. Отримана схема експортується в файл XSD і відправляється разом з досліджуваним, таким чином формуючи пакет XDTO.

    Найбільше розходження між використанням для відображення даних в інтернеті і іншими технологіями полягає в тому, що перед тим як створити XML-файл спочатку необхідно використовувати його для відображення даних на веб-сторінці, яке аналогічно використанню електронної таблиці.

    Поширені помилки

    Мова XML настільки простий, що його може освоїти практично кожен. Широкий доступ є ключовим перевагою мови. Недоліком XML є те, що правила, які існують в мові, є абсолютними. Синтаксичні аналізатори XML залишають мало місця для помилок. Незалежно від того, є розробник новачком або багато років працював на мові, одні і ті ж поширені помилки з’являються знову і знову. Розглянемо їх, щоб не допускати.

    Отже, поширені помилки структури XML файлу:

  • Потрібно вказати мову з допомогою оператора оголошення, щоб браузер розумів код, на якому він написаний.
  • XML працює в ієрархічному стилі. Це означає, що всі дочірні елементи повинні мати батьків, рядки даних повинні бути між тегами елемента, коментарі повинні бути всередині тегів.
  • XML вимагає, щоб були закриті всі теги. В HTML можна уникнути випадкового відкриття тега, і деякі браузери навіть закривають теги при відображенні сторінки. Документ XML з відкритим тегом завжди буде видавати помилку.
  • Оскільки досліджуваний мову працює в цій структурі, кожна сторінка повинна мати кореневий елемент на вершині дерева. Ім’я елемента не має значення, але воно повинно бути там перед тим, як отримати структуру XML-файлу. Інакше наступні теги не будуть належним чином вкладені.
  • XML інтерпретує 50 прогалин так само, як і один. Мова збирає кілька пробілів, відомих як пробільні символи, і скомпактирует їх в один. Це не має нічого спільного з візуальним відображенням або дизайном. Пробіл використовується для вирівнювання тексту, нічого не значить у коді XML, тому якщо розробник додає багато зайвих пробілів, щоб спробувати продемонструвати якийсь візуальний макет або дизайн, він просто втрачає час.
  • XML пропонує гарне рішення для обміну даними для широкого кола зацікавлених споживачів в зручному і простому у використанні форматі. Такі додатки, як 1 С, продовжують інтегрувати нові технології, такі як XML, щоб надати користувачеві нові можливості обробки даних.