Преглед, създаване и структура на xml файла

XML е разширение на файла Extensible Markup Language, което се използва за създаване на споделена информация формати и споделяне на формат и данни в World Wide Web, интранет и другаде, като се използва стандартен ASCII текст. Това е универсален формат за данни и структурирани документи с разширение XML. Подобно на HTML, той използва тагове за думи, разделени със знаци ">" и "<" за структуриране на данни в документ. Но какво влиза в структурата на един XML файл?

Кратко въведение в езика

Кратко въведение в езика XML

EXtensible Markup Language започва да се разработва през септември 1996 г. с подкрепата на W3C, като целта е да се създаде оптимизиран инструмент за интернет. Структурата на един XML файл съчетава простотата на HTML с изразителната сила на неговия предшественик SGML. В разработването му участваха компании като Microsoft, IBM, Sun Microsystems, Novell и Hewlett-Packard. Версия 1.0 е ратифициран от W3C на конференцията SGML/XML във Вашингтон през декември 1997 г. В рамките на няколко години XML се превърна в езика с най-голямо влияние върху разработването на приложения за публикуване на съдържание в интернет.

Основните характеристики на езика са

Редактирането на документите има следните цели:

  1. Разграничаване на съдържанието и структурата на XML файл чрез представянето му на хартия или на екран.
  2. Изясняване на устройството и информационното съдържание.
  3. Създаване на документи, които могат да се обменят и обработват лесно в хетерогенни компютърни системи.
  4. Създаване на формати, при които в текста на документите се поставят етикети за разграничаване на частите или елементите на структурата на XML файла.

Основните характеристики на езика са

  1. Описателно маркиране с отворен набор от етикети. В HTML и XML таговете са разположени в документите. Основната разлика между едната и другата е във функцията на тези марки.
  2. Функция за разграничаване на информационното съдържание на документите в сравнение с използването в HTML, където таговете служат за указване на начина, по който трябва да се разглежда съдържанието.
  3. От друга страна, докато HTML ни казва какви етикети могат да се използват за създаване на документ, разглежданият език не определя валиден набор от етикети. Но той предлага правила за създаване на XML файл, който ви позволява да създавате нови речници и набори от етикети за различни видове.
  4. Тя установява ясно разграничение между структурата на документа и неговото представяне. Етикетите в XML документ не показват нищо за, както трябва да бъдат представени. За да го визуализирате на екрана или на хартия, ще трябва да създадете отделен набор от стилове и да го свържете по-късно с документа.
Кратко въведение в езика XML

Когато клиентски компютър се свърже с база данни, SQL се изпраща към базата данни на асоциацията, като се използва XML обвивка за достъп до тях от файла. Те се връщат на клиентския компютър в под формата на структурирани на данните, съдържащи се в релационната таблица с резултати.

С помощта на XML обвивка можете да съпоставите данни от външен източник в релационна схема, състояща се от набор от псевдоними. Структурата на документа е логически еквивалентна на релационна схема, в която повтарящите се и вложените елементи се моделират като отделни таблици с външни ключове.

Непрекъснато развитие на езика

Непрекъснато развитие на езика

След първоначалното си въвеждане в интернет XML предизвика голям брой инициативи, свързани със споделянето и кодирането на съдържание и метаданни. XML единодушно се превърна в основен вариант за управление и реконструкция на данни. Списъкът на инициативите е широк и макар че не всички от тях са достигнали еднакво ниво на възприемане, има многобройни примери за успешно приложение на езика в академичната, бизнес и институционалната сфера.

През 2004 г. бяха публикувани нови предложения и инициативи, свързани с употребата на езика. Примери за това са непрекъснатото публикуване на нови версии на компютърни приложения, предназначени да да работите с с XML, разработването на нови речници или приемането на езика в различни области на работа.

Разширяемият език за маркиране се ползва със силната подкрепа на международните органи за стандартизация, което позволява високо ниво на стандартизация в електронната търговия между компаниите. Доказателство за това е публикацията като Стандарт ISO езиковите спецификации и неотдавнашната актуализация на стандарта UDDI (Universal Description of XML File Structure and Discovery). Тези два стандарта събудиха интереса към нови инвестиции в информационни технологии, която се забави през предходните години поради липсата на доверие в интернет пазарите.

Разширяем език за маркиране

XML е подобен на HTML. Те съдържат знаци за маркиране, с които се описват страници или файлове. HTML обаче описва съдържанието на уебстраницата главно по отношение на текста и графиките, само по отношение на начина, по който те трябва да бъдат показвани и да взаимодействат.

XML описва по отношение на съдържанието какви данни се описват. Например думата "phonenum", поставена в таговете за маркиране, може да означава, че следните данни ще бъде телефонен номер. XML файлът може да се обработва от програмата изключително като данни, да се съхранява с подобен на друг компютър или показани като HTML файл. Например, в зависимост от начина, по който приложението на приемащия компютър обработва телефонния номер, той може да бъде съхранен, показан или въведен.

XML се счита за разширяем, тъй като за разлика от HTML символите за маркиране са неограничени и се самоопределят. XML е по-опростено и по-лесно за използване подмножество на стандарта SGML (Standard Generalized Markup Language) за създаване на структура на документи. Очаква се HTML и XML да се използват заедно в много уеб приложения. Например маркировката на XML страница може да се покаже в HTML.

Съответстващи псевдоними

Съответстващи псевдоними

Псевдонимите, съответстващи на XML документ, са подредени в дървовидна структура, в която подчинените псевдоними се свързват с елементи, съответстващи на родителския документ. Когато те се повтарят или имат диференцирани идентификатори със сложна структура, за всеки вложен елемент могат да се посочат различни псевдоними.

Псевдонимите родител-дете се свързват с първични и чужди ключове, генерирани от обвивката. Изразите XPath се използват за свързване на XML документ с релационна схема, състояща се от набор от псевдоними. XPath е механизъм за адресиране за идентифициране на части от XML файл, като например групи от възли и атрибути в дърво на XML документ.

Основният му синтаксис е подобен на адресирането на файловата система. Всеки псевдоним се определя от израз XPath, който идентифицира елементите, представляващи отделни кортежи, и набор от изрази, които определят как да се извличат стойностите на колоните на всеки елемент.

XML документът е свързан с набор от псевдоними, а връзките между родители и деца се установяват с помощта на външни и първични ключове. XPath изразите се използват за дефиниране на отделни кортежи и колони във всеки елемент на документа, както и като начин за изпълнение на заявка в XML документ, след като той е регистриран в системата за сливане.

Дървовидната структура на примерен документ

Дървовидната структура на примерен документ

Документи XML трябва да има коренов елемент, който е родител на всички останали. Той може да съдържа вложени елементи, текст и атрибути. Дървото, представено от документа, започва с коренов елемент и се разклонява до най-ниското ниво на елемента. Въпреки че няма консенсус по отношение на терминологията, използвана в XML дърветата, W3C е създал поне две стандартни терминологии:

  1. Терминология, използвана в модела на данни XPath.
  2. Терминология, използвана в информационния набор XML.

XPath дефинира синтаксис от изрази и имена, който идентифицира един или повече вътрешни компоненти на елементите и атрибутите на XML документ. XPath се използва широко за достъп до данни, кодирани в XML.

Информационният набор XML описва абстрактен модел на данни за документи по отношение на информационни елементи. Често се използва в спецификациите на вашите собствени език за удобството да се опишат ограниченията на конструкциите, които позволяват.

Обмен на данни

Възможността за разделяне на съхранението от преглеждането означава, че с XML можете да съхранявате данните си в един формат и да ги преглеждате по различни начини, без да се променя начинът им на съхранение. Езикът може да опише какво представляват данните. Това означава, че е възможно да да опишете как да ги показвате - цвят, шрифт и форматиране, и какво представляват, напр. сигнал, получен от осцилоскоп, стойност на алармен индикатор и др.

Заедно тези предимства позволяват всякаква информация да се съхранява в единен формат за съхранение, който може да бъде определен за приложения. Може да се използва и от всяко друго приложение, ако се знае, че чете XML файлове. Това е полезно за един компютър за обмен на данни между приложенията, но истинското предимство на тази функционалност е в среда с много компютри.

Можете да използвате следния пример като модел за създаване на XML файл и показване на данните от него. Да предположим, че са попълнени определен брой точки с данни от тестова платформа и е извършен основен анализ на тези данни.

След това ще трябва да запишете всички тези необработени данни заедно с анализа във файл. За да ги изведете във файла, трябва да планирате как да бъде създаден XML файлът. С помощта на тази схема всички данни и резултати от анализа се записват в XML файл. Възможността за персонализиране на полетата във файла, като например "data", "average", "max" и "min", е част от гъвкавостта и силата на XML.

Разработване на тестови приложения

Разработване на тестови приложения

Когато потребителят разполага с XML файл, който съдържа полезни данни, рано или късно ще му се наложи да ги приложи. Това може лесно да се покаже във всеки текстов редактор или да се отвори в браузър с поддръжка на XML, например Microsoft Internet Explorer. Ако искате да го покажете като нещо повече от текст, можете да използвате всичко - от приложения за бази данни до уеб браузъри.

Тези приложения се нуждаят от таблица със стилове, за да прочетат XML файла. С помощта на таблици със стилове можете да видите едни и същи данни по различни начини. Например една таблица набор от стилове за за показване на информация на клиенти и за представяне на информация на специалисти, които може да се нуждаят от конкретна информация за решаване на даден проблем. И можете да използвате трети лист със стилове, за да заредите всички данни в обща корпоративна система за бази данни.

За тази задача е необходимо предварително да се създадат три различни метода за показване на данните. С помощта на XML и таблици със стилове трябва само да създадете един файл с данни, който може да бъде разглеждан в няколко различни формата, за да отговаря на вашата задача. Освен това вече не е необходимо да се посочва видът на приложението, което ще показва данните, тъй като крайният потребител може да създаде свой собствен набор от стилове, който да отговаря на нуждите на приложението, след като му бъде предоставен XML файлът.

XML ще дефинира стандарти за данни в цялата компания, така че разработчикът трябва да разработи само един файл със схема, който да използва, като прилага съответните части от схемата според нуждите на своето приложение. След това остава само да разработите таблица със стилове за всяко представяне на данни.

С тази система програмите за изпитване и измерване могат лесно да обменят данни с всяко приложение в предприятието, като всяко от тях може да създава данни и да ги показва в другото.

Механизъм XDTO в 1C

Механизъм XDTO в 1C

Създателите на 1С, които си поставиха за цел да обменят данни, използвайки език за обучение, разработиха механизъм - XDTO за прехвърляне на структурата на 1С XML файл. Какви са ползите? Версия на програмата 8.1С и по-нови версии позволяват обмен на информация със системи, без да се навлиза в темите за създаване на XML файлове, което решава повечето проблеми на 1С. Можете също така да изпратите само необходимата информация за формиране на документа. За да направи това, програмистът ще трябва да извърши някои процедури предварително.

За да качите XML файл с помощта на XDTO, трябва да прехвърлите структурата на 1C файла, като използвате набор от схеми, създадени в текстов редактор, или да използвате специален софтуер. Резултатът трябва да бъде файл, описващ уникален тип и структура, използвани в XML. Преди да прочете или запише последния файл, програмистът зарежда получената конфигурация в областта "XDTO Packages". За да пресъздаде, потребителят трябва да разполага с основен елемент и атрибути. Получената схема се експортира в XSD файл и се изпраща заедно с изучаваната схема, като по този начин се образува пакет XDTO.

Най-голямата разлика между използването му за показване на данни в уеб и други технологии е, че преди да бъде създаден XML файл, той трябва първо да бъде използван за показване на данни в уеб страница, което е подобно на използването на електронна таблица.

Често срещани бъгове

XML е толкова прост, че почти всеки може да го научи. Широкият достъп е основна характеристика на езика. Недостатъкът на XML е, че правилата, които съществуват в езика, са абсолютни. XML парсерите оставят малко пространство за грешки. Независимо дали разработчикът е начинаещ, или работи с езика от много години често срещани грешки се появяват отново и отново. Помислете за тях, за да избегнете.

Общите грешки в структурата на XML файла

  1. Трябва да посочите езика с декларация, за да може браузърът да разбере кода, на който е написан.
  2. XML работи в йерархичен стил. Това означава, че всички подчинени елементи трябва да имат родители, низовете с данни трябва да са между таговете на елементите, коментарите трябва да са вътре в таговете.
  3. XML изисква всички тагове да са затворени. В HTML можете да избегнете случайно отваряне на таг, а някои браузъри дори затварят таговете при показване на страницата. XML документ с отворен таг винаги генерира грешка.
  4. Тъй като изучаваният език работи в дървовидна структура, всяка страница трябва да има коренов елемент в горната част на дървото. Името на елемента няма значение, но той трябва да е там преди, как да получите Структура на XML файла. В противен случай следващите тагове няма да бъдат правилно вложени.
  5. XML интерпретира 50 интервала по същия начин като един. Езикът събира множество пространства, известни като бели полета, и ги обединява в едно. Това няма нищо общо с визуалното представяне или дизайна. Използвано пространство за подравняване текст, не означава нищо в XML кода, така че ако разработчикът добави много допълнителни интервали, за да демонстрира някакво визуално оформление или дизайн, той просто си губи времето.

XML предлага добро решение за обмен на данни за широк кръг заинтересовани клиенти в удобен и лесен за използване формат. Приложения като 1C продължават да интегрират нови технологии, като XML, за да предоставят на потребителя нови възможности за обработка на данни.

Статии по темата