Дивитися що таке "Мова розмітки" в інших словниках. Мови розмітки документів мову розмітки Яка роль мови розмітки мову

Іноді можна почути про "програмуванні" Web-сторінки, однак форматування тексту у вікні броузера фактично не відноситься до програмування. Як випливає з назв мов форматування, вони відносяться до мов розмітки (markup languages). Іншими словами, вони складаються з різних символів, вставлених в тіло документа, що вказують, як повинен виглядати файл при друку або відображенні або для визначення його логічної структури (наприклад, абзаців і маркованих списків). Якщо не використовувати мову розмітки, які відображаються дані представляють собою неструктурований текст (raw text), без форматування символів або абзаців.
Мови розмітки визначають зовнішній вигляд документа за допомогою кодів, які називаються дескрипторами або тегами (tags), які мають приблизно таку форму: . Перший дескриптор вказує точку початку форматування, а другий (з похилою рискою) - закінчення коду. Якщо опустити другий дескриптор, кодування, що задається першим дескриптором, застосовується до кінця документа.

Примітка:
Мова розмітки можна застосувати до неструктурованого тексту або вручну, або за допомогою текстового редактора (наприклад, Notepad), або за допомогою графічного інструменту, який додає код, коли ви візуально впорядковує текст на власний смак.
Новачкам простіше працювати з графічними інструментами, які не так точні, як текстові редактори.

Мова розмітки гіпертексту (HTML)

Мова HTML (HyperText Markup Language - мова розмітки гіпертексту) - основа кодування і "становий хребет" більшості Web-сторінок. HTML дозволяє публікувати текст і малюнки, вміст електронних таблиць і навіть створювати звіти на основі баз даних для читання в інтерактивному режимі. Він прекрасно підходить для організації та форматування статичної інформації будь-якого типу, оскільки дозволяє:

● встановлювати розмір і шрифт тексту;
● форматувати текст напівжирним шрифтом, курсивом або виділяти підкресленням;
● задавати посилання на інші сторінки;
● вставляти зображення;
● створювати заголовки сторінок;
● створювати таблиці;
● вставляти метадані, необхідні для роботи машин пошуку.

Примітка:
Метаданими (metadata) називають приховані дані, які не відображаються на Web-сторінці, проте можуть бути виявлені машиною пошуку (engine search), що дозволить потрапити на даний вузол.

Застосовуються дескриптори HTML трьох типів.

● Для форматування тексту або окремих символів.
● Для форматування абзаців або інших великих текстових блоків.
● Невидимі дескриптори, які забезпечують інші функціональні засоби, наприклад метадані, щоб здійснити пошук.

Основна перевага HTML перед іншими мовами розмітки - приголомшлива універсальність. Поточну версію HTML підтримує практично будь-який броузер (зрозуміло, сучасний і підтримує графічні засоби). Це не завжди вірно для динамічного HTML (DHML), XML, Java і ActiveX. Якщо ви хочете, щоб ваші Web-вузли були доступні для браузерів всіляких типів, рекомендуємо використовувати HTML.

Динамічний HTML (DHML)

Динамічний HTML (Dynamic HTML - DHML) більш гнучкий в порівнянні з HTML.
Замість того щоб виставляти на загальний огляд статичну Web-сторінку, ви можете використовувати DHTML і створити Web-сторінку, яку користувач зможе настроювати без порушення виду вихідного документа. Наприклад, сторінка, підготовлена ​​за допомогою DHTML, може містити різні елементи, які користувач зможе переміщати по сторінці, щоб перегрупувати її вміст (за власним смаком). Однак при оновленні (refreshing) зображення на сторінці зміни пропадають, і вона приймає вихідний вид.
DHTML підтримує такі кошти, відсутні в HTML.

● Динамічні стилі.
● Точне позиціонування.
● прив'язку даних.
● Динамічний вміст.

Вам незрозуміло, що це таке? Не турбуйтеся - нижче наведені пояснення.

Застосування стилів до документів Web. Динамічні стилі (dynamic styles) засновані на принципах каскадирования таблиць стилів (CSS - cascading style sheets), коли вони застосовуються до сторінці в цілому замість ручного форматування окремих частин сторінки.
Якщо ви працювали з сучасними текстовими процесорами, то, можливо, знайомі з таблицями стилів (style sheets), що дозволяють автоматично сформатувати текстові блоки тим чи іншим методом в залежності від стилю, який ви їм задали. Форматування має на увазі зміна кольору тексту, шрифту, розміщення, видимості - взагалі практично все, що відноситься до реквізитів тексту. CSS (і DHTML), робить те ж саме, тільки застосовується для обробки Web-сторінок, а не для текстів.
У динамічних стилях, що реалізуються за допомогою DHTML, передбачені кошти, відсутні в текстових процесорах. Наприклад, ви можете при створенні посилань розмітити текст так, що його колір буде автоматично змінюватися при наведенні на нього покажчика миші або відображатися, коли ви проводите курсор над певною областю екрану.
Єдиний недолік цих стилів полягає в тому, що ви повинні включати таблиці стилів в більшість документів. Це трудомістка робота, особливо для тих, хто недосвідчений в роботі з таблицями стилів або займається конвертацією документів.

Розміщення тексту в потрібному місці. Ще одна перевага DHML - його здатність точно вказати місце розміщення елементу на сторінці. Для вказівки положення об'єкта використовують горизонтальну (х), вертикальну (у) і навіть об'ємну (z) координати. (Завдання положення об'єкта в тривимірній системі координат дозволяє "перекривати" об'єкти.) Точне позиціонування дозволяє розташувати текст навколо зображення, а також переміщати об'єкти в межах вікна броузера.

Примітка:
HTML без CSS не забезпечує точного розміщення об'єктів. У цьому випадку розміщення елементів визначається браузером.

Вставка даних на сторінку. Щоб надати користувачам доступ до деякої внутрішньої інформації (back-end information), наприклад, що зберігається в базі даних, звичайні сторінки HTML повинні бути пов'язані з сервером, на якому знаходяться вихідні дані, і потрібно запитувати дозвіл на маніпулювання цими даними. DHTML дозволяє прив'язати дані до конкретної сторінці, допускаючи роботу з прив'язаними (або точніше - пов'язаними) даними (bound data) без порушення вихідних даних і навіть без взаємодії з сервером, що зберігає їх. Для цього джерела даних вводять в сторінку (їх можна сортувати і фільтрувати точно так же, як і вміст будь-якої бази даних). Це не тільки знижує завантаження сервера, але також дозволяє користувачам переглядати і маніпулювати даними без надання їм доступу до джерела самих даних.

Створення динамічного вмісту. Таблиці стилів (style sheets) дають можливість видавцеві (publisher) Web без праці змінювати зовнішній вигляд сторінки чи кількох сторінок.
Динамічний вміст дозволяє користувачеві Web змінювати зовнішній вигляд (подання) сторінки виконанням сценарію, щоб:

● вставляти або приховувати елементи сторінки;
● модифікувати текст;
● змінювати структуру тексту;
● переміщати дані з внутрішніх джерел (back-end sources) і відображати їх за запитом користувача.

На відміну від мови HTML, що допускає зміну вмісту сторінки тільки до її завантаження в броузер користувача, DHTML може сприймати зміни в будь-який час.
Динамічний вміст дає можливість забезпечити високий рівень інтерактивності, якщо використовується разом зі сценаріями, що дозволяють користувачам визначати елементи, які необхідно переглянути.

Порада:
У розділі "Організація зборів" (див. Вище) згадана карта будівлі, створена на основі Web-даних, що відображає розташування конкретного офісу і портрет службовця, якого користувач намагається відшукати. Ця карта створена за допомогою DHTML-засобів мови розмітки для створення динамічного вмісту.

Розширювана мова розмітки (XML)

Мова XML (Extensible Markup Language - розширювана мова розмітки) не замінює HTML (у всякому разі, він рідко зустрічається на Web-сторінках), проте підтримує його, дозволяючи трохи підвищити універсальність Web-сторінок.
Ідея така: коли ви форматуєте сторінку за допомогою HTML, то можете змінити зовнішній вигляд тексту дескрипторами, форматує його напівжирним шрифтом, курсивом, підкресленням, абзацами і т.д. Однак самі дескриптори практично ніяк не пов'язані з вмістом тексту, а тільки з його форматуванням. Мова XML має дескриптори, що визначають зовнішній вигляд тексту. Ви можете з їх допомогою вказати, що позначає даний текст (імена, адреси, назви продуктів і т.д.).
Навіщо це потрібно? Перш за все, ці метадані дозволяють машинам пошуку знайти попередньо задані елементи. Якщо ви проведете в Web-вузлі вашої корпорації (створеному за допомогою мови HTML) пошук по слову "name", переглядаючи всі згадані в ньому імена, то в результаті повернуться всі екземпляри слова "name", але не самі імена. Однак якщо при створенні вузла використовувалося кодування за допомогою мови XML, в результаті буде повернено будь-який текст, який має дескриптор імені "name". По-друге, забезпечені дескриптором частини тексту можуть бути корисні, якщо вам необхідно застосувати якесь засіб (наприклад, колір або мова) тільки до окремих частин документа Web. Нехай, наприклад, інтерактивний документ являє собою коротку розповідь на іспанською мовою з перекладом на англійську. Тоді замість перемикання документа з підтримки іспанської мови на підтримку англійської, можна визначити ці частини розповіді дескрипторами і застосувати правила іспанської мови тільки до цих частин, а переклади залишити англійською.
По суті, застосування мови XML значно полегшує розробку Web-сторінки, особливо якщо деякі його частини необхідно створити як ізольовані елементи.

Чи можна знизити струм, споживаний від батареї комп'ютера?
Радіопередавач перетворює електричну енергію в радіосигнали, тому батарея в портативному комп'ютері з встановленим бездротовим адаптером буде розряджатися набагато швидше, ніж ...

Взаємодія додатків з мережами
У деяких випадках додатки виконуються на мережевих комп'ютерах не так, як на автономних. Одні програми працюють в мережі точно так же, як і на автономному комп'ютері, інші ж, навпаки, вимагаю ...

Терміни на букву V
Virtual Machines - віртуальні машини. Програмне забезпечення, що імітує роботу фізичного пристрою. У Windows 98 воно використовуються, щоб "обманним шляхом" змусити програму з ...

(Standard Generalized Markup Language), представлений в стандарті ISO 8879. Ця мова прийнятий в якості основного мови оформлення технічної документації, в тому числі інтерактивних електронних технічних керівництв на створювані вироби в CALS-технологіях.

У мові SGML визначається структура документів у вигляді послідовності об'єктів даних. Об'єкти даних, що представляють частини документа, можуть зберігатися в різних файлах. Стандарт SGML встановлює такі безлічі символів і правил для представлення інформації, які дозволяють різним системам правильно розпізнавати та ідентифікувати цю інформацію. Названі безлічі описують в окремій частині документа, званої декларацією DTD (Document Type Decfinition), яку передають разом з основним SGML-документом. В DTD вказують відповідність символів і їх кодів, максимальні довжини використовуваних ідентифікаторів, спосіб представлення обмежувачів для тегів, інші можливі угоди, синтаксис DTD, а також тип і версію документа. Отже, SGML можна назвати метамовою для сімейства конкретних мов розмітки. Зокрема, подмножествами SGML можна вважати мови розмітки XML і HTML.

Технічний опис у вигляді SGML-документа включає:

  • Основний файл з технічним керівництвом, розмічений SGML-тегами;
  • опис сутностей, якщо документ відноситься до групи, в якій використовуються одні й ті ж сутності і мається на увазі їх популярність;
  • словник для пояснення SGML-тегів;

Однак мова SGML складний для освоєння і застосування. Тому для широкого застосування розмітки в документах, що подаються в WWW-технології, в 1991 р на базі SGML був розроблений спрощений мова HTML (HyperText Markup Language), а в 1996 р мову XML (eXtensible Markup Language), який стає в поєднанні з HTML основною мовою подання документів в різних додатках.

Мова HTML розроблений з метою широкого застосування розмітки в документах, що подаються в WWW-технологіях.

Опис на мові HTML є текст в форматі ASCII і послідовність включених в нього команд (керуючих кодів), які називаються також дескрипторами або тегами. Цей текст називають HTML-документом, або HTML-сторінкою, або після розміщення на Web-сервері - Web-сторінкою. Теги розставляються в потрібних місцях початкового тексту, вони визначають шрифти, переноси, поява графічних зображень, посилання і т.п. При використанні WWW-редакторів вставка команд здійснюється простим натисканням відповідних клавіш.

Мова XML, як і HTML, вважається підмножиною мови SGML. В даний час мова XML претендує на роль основного мови подання документів в інформаційних технологіях, його можна розглядати як метамова, що є основою для створення приватних мов розмітки в різних додатках. При цьому XML більш зручний, ніж SGML, що забезпечується усуненням в XML деяких другорядних особливостей SGML. Описи на XML легше сприймаються, пристосовані для використання в сучасних браузерах при збереженні основних можливостей SGML.

Для конкретних додатків створюються свої варіанти XML, звані XML-словниками або XML-додатками. Так, для опису текстів зі специфічною математичної символікою розроблено XML-додаток OSD (Open Software Description). Для CALS інтерес представляє варіант Product Definition eXchange (PDX), присвячений обміну даними. Відомі словники для хімії (CML - Chemical Markup Language), біології (BSML - Bioinformatic Sequence Markup Language) і ін.

Ми випустили нову книгу «Контент-маркетинг в соціальних мережах: Як засісти в голову передплатників і закохати їх у свій бренд».

НTML - це мова гіпертекстової розмітки.

Мова використовується для організації веб-сторінок. Проведемо аналогію. Ви купуєте газету. У ній надруковані кілька статей. У кожної статті є назва, в ній є фотографії. А текст набирається декількома колонками. Це - структура газетної сторінки.

На сайті все відбувається так само. Щоб зробити правильну структуру статті - контенту - потрібно використовувати мову розмітки тексту.

Для чого потрібен HTML

Мова HTML потрібен, щоб повідомити браузеру, як потрібно відобразити сторінку на екрані.

Мова поширений повсюдно. Це універсальний засіб для оформлення контенту на сторінці. Його використання можливе в будь-який браузері. Якщо писати код на мові програмування - потрібно знати якісь особливості, оператори, типи даних і так далі.

HTML складається з набору тегів - команд, і атрибутів - властивостей. Їх нескладно запам'ятати, і завжди можна знайти довідкові матеріали.

Що таке HTML-код

Код - це команди браузеру, як слід відобразити сторінку. Є структура, яка повинна дотримуватися завжди. Наприклад, наявність тільки одного заголовка H1 на сторінці, основна інформація міститься в роздягли т. Д.

У мові є три інструменти.

Теги бувають двох видів - парні і одиночні.

  • - парний тег, що відкриває і закриває. Вони діють на текст, поміщений між ними.
  • Одиночний тег, він діє на текст, що стоїть після нього до наступного тега.

Структура HTML-коду на сторінці

Ми говорили, що структура у будь-якого html-документа завжди одна і та ж. Далі перерахуємо обов'язкові елементи.

  1. !- вказує, що в документі використовується HTML.
  2. ...- в цей тег поміщається весь код сторінки. Все, що в нього не поміщено, що не розпізнається браузером і не відображається.
  3. ...- парний тег, в нього поміщається технріческая інформація, наприклад, про кодування документа.
    1. ...- це заголовок сторінки, він поміщається всередині розділу head. У будь-якої сторінки повинен бути своє унікальне назву.
    2. - це службова інформація. Вона підключає до сторінки окремі стилі - css і т. Д. Чи не відображається користувачеві.
  4. ...- тіло сторінки. Вся основна інформація полягає в цей тег.
    1. ...- гіперпосилання.
    2. - зображення.
    3. ...- жирний текст.
    4. ...- курсив.

Елементів всередині body може бути необмежена кількість.

Наприклад, ось так виглядає частина коду сторінки однієї із записів нашого блогу.

Чим частіше використовувати теги, тим швидше вони запам'ятовуються. Завжди можна знайти довідник з усіма тегами, атрибутами і їх значеннями.

Будь-який документ має три складових:

· Структуру;

Зміст - це ті відомості, які відображені в документі. Зміст документа на папері може бути суто текстовим, а також містити зображення. Якщо документ представлений в електронному вигляді, він може містити і мультимедійні дані, а також посилання на інші документи. Хоча зміст різних документів по-різному, їх можна класифікувати за типами, наприклад, книга або залізничний квиток.

Стиль документа визначає форму виведення його змісту на той або інший пристрій (наприклад, принтер або дисплей). У поняття стиль входять характеристики шрифту (найменування, розмір, колір) всього виведеного документа або окремих його блоків, порядок розбивки на сторінки, розташування блоків на сторінках і інші параметри. Один і той же документ може виводитися різними стилями як на різні носії, так і на один і той же носій.

Мови розмітки документів є штучними мовами, призначеними для опису структури документа і відносин між різними об'єктами структури. Дані розмітки називаються також метаданими.

Першою мовою розмітки є мова GML (Generalized Markup Language -узагальнення мову розмітки), розроблений співробітниками фірми IBM ще в 60-х роках минулого століття. Його безпосередньою спадкоємницею стала мова SGML (Standard Generalized Markup Language - стандартний узагальнений мову розмітки), який визначає правила запису елементів розмітки документа. Документ, відповідний правилам мови, називається документом SGML.

Мова SGML визначено в стандарті ISO 8879, в якому задаються наступні основні вимоги до мови розмітки документів:

· Мова повинна бути доступний для читання людиною.

· Розмічені файли документів повинні бути текстовими і кодуватися за допомогою символів коду ASCII (American Standard Code for Information Interchange - стандартного американського коду для інформаційної взаємодії). Однак зміст документа не обов'язково має кодуватися символами ASCII або бути текстовим.

У мові SGML і подібних йому мовах використовуються спеціальні інструменти розмітки документа:

· Елементи і супутні їм атрибути;

· Суті (entities);

· Коментарі.

Структурною одиницею документа SGML є елемент. У розміченому тексті кожен елемент повинен бути виділений певним чином. Виділення виконується вставкою початкового тега (від англійського слова tag - мітка) на початку елемента (start tag) і кінцевого тега (end tag) в кінці елемента. Початковий і кінцевий теги мають однакові імена. Щоб відрізнити теги від звичайного тексту, вони повинні починатися з символу - ознаки початку тега і закінчуватися символом - ознакою закінчення тега. Крім того, в кінцевому тезі задається символ - ознака кінцевого тега. В SGML як таких ознак можна задати будь-які символи, однак найбільш часто в якості ознаки початку тега використовується символ "<" (левая угловая скобка), в качестве признака окончания тега используется символ ">"(Ліва кутова дужка), а в якості ознаки кінцевого тега - символ" / "(похила риса). Елементи в документі SGML можуть містити в собі інші елементи, в результаті чого в графічному поданні документ SGML є ієрархічною (деревовидної) структурою.


Приклад 4.3.1. Документ SGML, що задає список студентів з результатами їх екзаменаційної сесії можна задати наступним чином:

Список оцінок студентів в сесії

Іванов Іван Іванович

ТС-61

A

B

B

B

Петров Петро Петрович

ТС-62

C

C

D

C

У цьому документі першим елементом є елемент student-list (список студентів). Цей елемент містить в собі один елемент title (заголовок) і кілька елементів student (дані про студента). У свою чергу, кожен елемент student містить в собі один елемент full-name (прізвище, ім'я та по батькові студента), один елемент group-number (номер групи) і один елемент mark-list (список оцінок студента в сесії). І, нарешті, елемент mark-list містить в собі кілька елементів mark (оцінка).

Графічне представлення цього списку на рис. 4.3.1 має деревоподібну структуру:

Мал. 4.3.1. Структура документа SGML в графічному поданні

Для уточнення елементів SGML можна використовувати атрибути. Атрибути записуються в початковому тегу елемента в наступному вигляді:

ім'я-атрибуту = "значення-атрибута".

Для елемента може бути задано кілька атрибутів. Атрибути відокремлюються одна від одної і імені елемента, по крайней мере, одним пропуском.

Приклад 4.3.2. Для елементів mark в прикладі 4.3.1 можна задати атрибут subject, значенням якого є найменування дисципліни, по якій здавався іспит. Тоді для першого студента елементи приймуть такий вигляд:

A

B

B

B

У таких мовах, як SGML, для роботи з групами даних застосовуються суті (entities). Сутністю є будь-які іменовані дані, як текстові, так і нетекстові. При перегляді документа ім'я сутності замінюється її значенням. Так, наприклад, ім'я текстової суті kpi буде замінено її значенням: Київський політехнічний інститут, а нетекстової сутність image1 буде заміна зображенням з ім'ям image1.

Термін «розмітка» походить від традиційної практики розмітки рукописів перед публікацією (тобто додавання символічних команд на полях і між рядків в паперовій рукописи).

Протягом багатьох століть це робили працівники видавництва (редактори і коректори) які відзначали, яким шрифтом, стилем і кеглем повинні бути набрані фрагменти тексту, а потім передавали рукопис складачам, які вручну здійснювали набір тексту з урахуванням символів розмітки.

Мова розмітки- це набір спеціальних інструкцій, називаних тегами (tags), що виконують такі функції:

      завдання функцій обробки виділених елементів;

      виділення логічних елементів даного документа.

Завдання функцій обробки виділених елементів

У текстових процесорах існують вбудовані команди включення / вимикання шрифтів і інше, аналогічні командам управління розміщенням інформації на екрані або при друці. Такий підхід називається командноїабо процедурної розміткою.

Приклади процедурної розмітки

Виділення логічних елементів документа

Служить для формування в документах якоїсь структури і визначення відношень між різноманітними елементами цієї структури без вказівки способу обробки. Така розмітка називається описової.

Змінюючи набір процедур, відповідний описової розмітки, можна змінити зовнішнє уявлення одного і того ж документа.

описова розмітка

Основною перевагою описової розмітки є її гнучкість, оскільки фрагменти тексту відзначені як «ніж вони є» (а не «як вони повинні бути відображені»).

В майбутньому може бути написано програмне забезпечення для такої обробки цих фрагментів, яка навіть не передбачалася розробниками мов. Наприклад, гіперпосилання HTML, спочатку призначені для навігації користувачами за сукупністю зв'язків в мережі, в подальшому стали використовуватися також механізмами пошуку і індексування в мережі, для оцінки популярності ресурсів і так далі.

Приклади мов розмітки

Мови розмітки використовуються всюди, де потрібно висновок тексту фіксованої:

    в друкарні (SGML, TeX, PostScript, PDF),

    призначених для користувача інтерфейсів комп'ютерів (MicrosoftWord, OpenOffice, troff),

    Всесвітній Мережі (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

Тегів структура мови розмітки

Розвиток ідей описової розмітки призвело до визначення розмітки як формального мови.

Теги мови (керуючі дескриптори) певним чином кодуються (виділяються щодо основного вмісту документа) і служать в якості інструкцій для програми, що виробляє показ вмісту документа на стороні клієнта.

У багатьох сучасних мовах для позначення цих команд (теги мови) використовувалися символи< и >, Усередині яких містилися назви інструкцій та їх параметри (HTML і XML). В SGML можна призначати інші символи для обрамлення тега (наприклад, фігурні дужки). Крім того, існують різні системи мов-підмножин, які використовуються, з меншими можливостями, наприклад на веб-форумах і дошках оголошень використовується мова розмітки BBCode, теги якого обмежуються символами квадратних дужок:.

Тегів модель описує документ як сукупність контейнерів, кожен з яких починається і закінчується тегами. У більшості випадків теги використовуються парами. Пара складається з відкриває (start tag) і закриває (end tag) тегів.

Синтаксис відкриваючого тега:<имя_тега [атрибуты]>

Ім'я закриває тега відрізняється від імені відкриває лише тим, що перед ним ставиться похила риса:

Атрибути визначають додаткові характеристики елемента. Атрибути тега записуються в наступному форматі: ім'я [= "значення"]. Для деяких атрибутів значення може не вказуватися. У закриває тега атрибутів не буває.

Дія будь-якого парного тега починається з відкриваючого тега і закінчується при зустрічі відповідного закриває тега.

Пару, що складається з відкриває і закриває тегів, називають контейнером, а частина тексту між ними, - елементом.

Тема 1 рівня

Тема 2 рівня

Залежно від використовуваної мови розмітки додатково можливе застосування одиночного тега і тега порожнього елемента. Ім'я тега визначає тип елемента.

Синтаксис одиночного тега:<имя_тега [атрибуты] />

У деяких мовах розмітки імена тегів заздалегідь визначені (HTML). В інших не регламентуються жорстко, тобто користувачі можуть вводити і використовувати нові теги (XML). Наприклад, тег «persona» можемо визначити тип цього XML елемента, як прізвище ім'я та по батькові. Іванов Іван Іванович

В SGML елементи можуть перетинатися, тобто в SGML можлива така послідовність тегів:

У XML елементи мають строгу синтаксичну структуру, тобто бути строго вкладеними один в одного і завжди закриватися:

Крім того, в SGML, HTML вони не зобов'язані бути закритими:

Практично у всіх мовах розмітки документів значення атрибута інтерпретується як текстове. Значення атрибута прийнято брати в лапки.

Примітка:

Документ, написаний з використанням мови розмітки, містить не тільки сам текст (як послідовність слів і знаків пунктуації), але і додаткову інформацію про різні його ділянках - наприклад, вказівку на заголовки, виділення, списки і т. Д.

Тобто документ являє собою не що інше, як звичайний АSСII-файл, з доданими до нього керуючими кодами (тегами).