Podívejte se, co je „Markup Language“ v jiných slovnících. Značkovací jazyky dokumentů Značkovací jazyk Jaká je role značkovacího jazyka

Někdy můžete slyšet „programování“ webové stránky, ale formátování textu v okně prohlížeče ve skutečnosti není programování. Jak napovídají názvy formátovacích jazyků, odkazují na značkovací jazyky. Jinými slovy, jsou tvořeny různými znaky vloženými do těla dokumentu, které označují, jak má soubor vypadat při tisku nebo zobrazení, nebo definují jeho logickou strukturu (například odstavce a seznamy s odrážkami). Pokud nepoužíváte značkovací jazyk, jsou zobrazená data nezpracovaným textem bez formátování znaků nebo odstavců.
Značkovací jazyky definují vzhled dokumentu pomocí kódů nazývaných deskriptory nebo značky, které mají podobu: ... První deskriptor označuje počáteční bod pro formátování a druhý (s lomítkem) označuje konec kódu. Pokud vynecháte druhý deskriptor, použije se kódování určené prvním deskriptorem na konec dokumentu.

Poznámka:
Značkovací jazyk lze na nestrukturovaný text použít buď ručně, pomocí textového editoru (například Poznámkový blok), nebo pomocí grafického nástroje, který přidá kód, když si text vizuálně uspořádáte podle svých představ.
Pro začátečníky je snazší pracovat s grafickými nástroji, které nejsou tak přesné jako textové editory.

Hypertext Markup Language (HTML)

HTML (HyperText Markup Language) je páteří kódování a páteří většiny webových stránek. HTML vám umožňuje publikovat text a grafiku, obsah tabulky a dokonce vytvářet zprávy z databází pro interaktivní čtení. Je skvělý pro organizaci a formátování statických informací jakéhokoli typu, protože umožňuje:

● nastavit velikost a písmo textu;
● formátujte text tučně, kurzívou nebo podtržením;
● nastavovat odkazy na jiné stránky;
● vkládat obrázky;
● vytvářet nadpisy stránek;
● vytvářet tabulky;
● vložte metadata nezbytná pro fungování vyhledávačů.

Poznámka:
Metadata označují skrytá data, která se nezobrazují na webové stránce, ale mohou být detekována vyhledávačem, který vám umožní dostat se na daný web.

Používají se tři typy deskriptorů HTML.

● Pro formátování textu nebo jednotlivých znaků.
● Pro formátování odstavců nebo jiných velkých textových bloků.
● Neviditelné deskriptory, které poskytují další funkce, jako jsou metadata, provádět vyhledávání.

Hlavní výhodou HTML oproti jiným značkovacím jazykům je jeho obrovská univerzálnost. Aktuální verzi HTML podporuje téměř jakýkoli prohlížeč (samozřejmě moderní a grafický). To neplatí vždy pro dynamické HTML (DHML), XML, Java a ActiveX. Pokud chcete, aby byly vaše webové stránky přístupné všem druhům prohlížečů, doporučujeme použít HTML.

Dynamický HTML (DHML)

Dynamické HTML (Dynamic HTML - DHML) je flexibilnější než HTML.
Místo vystavení statické webové stránky veřejnosti můžete použít DHTML a vytvořit webovou stránku, kterou si může uživatel přizpůsobit, aniž by to narušilo vzhled původního dokumentu. Například stránka vykreslená pomocí DHTML může obsahovat různé prvky, které může uživatel přesouvat po stránce a měnit její obsah (podle svých představ). Když však obnovíte (obnovíte) obrázky na stránce, změny zmizí a vrátí se do původní podoby.
DHTML podporuje následující funkce, které nejsou k dispozici v HTML.

● Dynamické styly.
● Přesné umístění.
● Vazba dat.
● Dynamický obsah.

Nechápeš, co to je? Nebojte se - níže jsou vysvětlení.

Aplikování stylů na webové dokumenty. Dynamické styly jsou založeny na principech kaskádových šablon stylů (CSS), když jsou použity na stránku jako celek, místo ručního formátování jednotlivých částí stránky.
Pokud jste pracovali s moderními textovými procesory, můžete znát šablony stylů, které vám umožňují automaticky formátovat textové bloky tak či onak, v závislosti na stylu, který jim dáte. Formátování znamená změnu barvy textu, písma, umístění, viditelnosti - obecně téměř vše, co souvisí s vlastnostmi textu. CSS (a DHTML) dělá totéž, pouze se vztahuje na vykreslování webových stránek, ne na text.
Dynamické styly implementované pomocí DHTML poskytují funkce, které se v textových procesorech nenacházejí. Například při vytváření odkazů můžete označit text tak, aby se jeho barva automaticky změnila, když na něj umístíte ukazatel myši, nebo se zobrazí, když umístíte ukazatel myši na určitou oblast obrazovky.
Jedinou nevýhodou těchto stylů je, že musíte do většiny dokumentů zahrnout šablony stylů. Jedná se o časově náročnou práci, zejména pro ty, kteří nemají zkušenosti se styly nebo převodem dokumentů.

Umístění textu na správné místo. Další skvělá věc na DHML je jeho schopnost přesně určit přesné umístění prvku na stránce. Horizontální (x), vertikální (y) a dokonce i objemové (z) souřadnice se používají k označení polohy objektu. (Umístění objektu do 3D souřadnicového systému umožňuje objektům se „překrývat“.) Přesné umístění umožňuje umístit text kolem obrázku a také přesouvat objekty v okně prohlížeče.

Poznámka:
HTML bez CSS neposkytuje přesné umístění objektů. V takovém případě je umístění prvků určeno prohlížečem.

Vkládání dat na stránku. Chcete-li uživatelům poskytnout přístup k některým interním informacím (back-endovým informacím), například uloženým v databázi, musí být normální stránky HTML propojeny se serverem, na kterém jsou umístěna původní data, a je vyžadováno povolení k manipulaci tyto údaje. DHTML vám umožňuje vázat data na konkrétní stránku, což vám umožní pracovat s vázanými (nebo přesněji vázanými) daty, aniž byste porušili původní data a dokonce i bez interakce se serverem, který je ukládá. Za tímto účelem se na stránku zadávají zdroje dat (lze je řadit a filtrovat stejným způsobem jako obsah libovolné databáze). To nejen snižuje zatížení serveru, ale také umožňuje uživatelům prohlížet a manipulovat s daty, aniž by jim byl umožněn přístup ke zdroji samotných dat.

Vytváření dynamického obsahu. Šablony stylů umožňují webovému vydavateli snadno změnit vzhled stránky nebo sady stránek.
Dynamický obsah umožňuje uživateli webu změnit vzhled a chování stránky spuštěním skriptu na:

● vložit nebo skrýt prvky stránky;
● upravit text;
● změnit strukturu textu;
● přesunout data z interních zdrojů (back-endové zdroje) a zobrazit je na žádost uživatele.

Na rozdíl od HTML, které umožňuje změnit obsah stránky pouze před načtením do prohlížeče uživatele, může DHTML změny kdykoli vnímat.
Dynamický obsah poskytuje schopnost poskytovat vysokou úroveň interaktivity při použití ve spojení se skripty, které uživatelům umožňují určit, které položky se mají zobrazit.

Rada:
V části „Organizování schůzek“ (výše) je webová mapa budov zobrazující umístění konkrétní kanceláře a portrét zaměstnance, kterého se uživatel pokouší najít. Tato mapa byla vytvořena pomocí značkovacích nástrojů DHTML k vytvoření dynamického obsahu.

Extensible Markup Language (XML)

Jazyk XML (Extensible Markup Language) nenahrazuje HTML (alespoň zřídka na webových stránkách), ale podporuje ho, což umožňuje větší univerzálnost webových stránek.
Myšlenka spočívá v tom, že při formátování stránky pomocí HTML můžete změnit vzhled textu pomocí deskriptorů, které jej formátují tučně, kurzíva, podtržení, odstavce atd. Samotné deskriptory však nemají prakticky nic společného s obsahem textu, ale pouze s jeho formátováním. Jazyk XML má deskriptory, které určují vzhled textu. Můžete je použít k označení toho, co text znamená (jména, adresy, názvy produktů atd.).
Proč je to potřeba? Nejprve tato metadata umožňují vyhledávačům najít předdefinované položky. Pokud prohledáte na webu své společnosti (vytvořené pomocí HTML) slovo „name“ a při pohledu na všechny názvy, které obsahuje, budou vráceny všechny instance slova „name“, nikoli však samotné názvy. Pokud bylo při vytváření uzlu použito kódování XML, bude jako výsledek vrácen jakýkoli text, který má deskriptor „name“. Za druhé, deskriptorem poskytované části textu mohou být užitečné, pokud potřebujete použít médium (například barvu nebo jazyk) pouze na části webového dokumentu. Předpokládejme například, že interaktivní dokument je povídka ve španělštině s anglickým překladem. Poté můžete místo přepnutí dokumentu ze španělské podpory na anglickou podporu definovat tyto části příběhu pomocí deskriptorů a použít pravidla španělského jazyka pouze na tyto části a nechat překlady v angličtině.
XML díky tomu mnohem snáze vytváří webovou stránku, zejména pokud je nutné některé její části vytvořit jako izolované prvky.

Mohu snížit proud odebíraný z baterie počítače?
Rádiový vysílač převádí elektrickou energii na rádiové signály, takže baterie v notebooku s nainstalovaným bezdrátovým adaptérem se bude vybíjet mnohem rychleji než ...

Interakce aplikací se sítěmi
V některých případech aplikace běží na počítačích v síti jinak než na samostatných počítačích. Některé aplikace fungují v síti stejným způsobem jako na samostatném počítači, zatímco jiné naopak vyžadují ...

Výrazy začínající písmenem V
Virtuální stroje jsou virtuální stroje. Software, který simuluje činnost fyzického zařízení. Ve Windows 98 se používá k „oklamání“ programu do ...

(Standard Generalized Markup Language), zastoupený v normě ISO 8879. Tento jazyk je přijat jako hlavní jazyk pro technickou dokumentaci, včetně interaktivních elektronických technických příruček pro produkty vytvořené v technologiích CALS.

SGML definuje strukturu dokumentů jako posloupnost datových objektů. Datové objekty představující části dokumentu lze uložit do různých souborů. Standard SGML stanoví takové sady symbolů a pravidel pro prezentaci informací, které umožňují různým systémům tyto informace správně rozpoznat a identifikovat. Pojmenované sady jsou popsány v samostatné části dokumentu zvané Definice typu dokumentu (DTD), která se předává spolu s hlavním dokumentem SGML. DTD specifikuje korespondenci mezi znaky a jejich kódy, maximální délku použitých identifikátorů, způsob zastoupení oddělovačů značek, další možné konvence, syntaxi DTD a typ a verzi dokumentu. Proto lze SGML nazvat metajazykem pro rodinu specifických značkovacích jazyků. Zejména značkovací jazyky XML a HTML lze považovat za podmnožiny SGML.

Datový list SGML obsahuje:

  • hlavní soubor s technickou příručkou, označený tagy SGML;
  • popis entit, pokud dokument patří do skupiny, ve které jsou použity stejné entity a je implikována jejich sláva;
  • slovník pro vysvětlení značek SGML;

SGML je však obtížné se naučit a používat. Proto bylo pro široké použití značení v dokumentech prezentovaných v WWW technologiích vyvinut v roce 1991 na základě SGML zjednodušený HTML (HyperText Markup Language) a v roce 1996 XML (eXtensible Markup Language), který se v kombinaci s HTML je hlavním jazykem pro prezentaci dokumentů v různých aplikacích.

Jazyk HTML byl vyvinut s cílem rozšířeného používání značek v dokumentech prezentovaných v technologiích WWW.

Popis HTML je text ASCII a v něm obsažená posloupnost příkazů (řídicích kódů), nazývaných také deskriptory nebo značky. Tento text se nazývá dokument HTML nebo stránka HTML, nebo když je zveřejněn na webovém serveru, webová stránka. Značky jsou umístěny na správných místech ve zdrojovém textu, definují písma, dělení slov, vzhled grafiky, odkazy atd. Při použití editorů WWW se vkládání příkazů provádí jednoduchým stisknutím příslušných kláves.

XML, stejně jako HTML, je považován za podmnožinu SGML. V současné době se XML prohlašuje za hlavní jazyk pro zastupování dokumentů v informačních technologiích; lze jej považovat za metajazyk, který slouží jako základ pro vytváření soukromých značkovacích jazyků v různých aplikacích. Současně je XML pohodlnější než SGML, což je zajištěno odstraněním některých menších funkcí SGML v XML. Popisy XML jsou snáze čitelné, přizpůsobené pro použití v moderních prohlížečích při zachování základních schopností SGML.

Pro konkrétní aplikace se vytvářejí jejich vlastní varianty XML, které se nazývají XML slovníky nebo XML aplikace. Například byla vyvinuta aplikace XML OSD (Open Software Description), která popisuje texty se specifickými matematickými symboly. CALS se zajímá o možnost výměny dat Product Definition eXchange (PDX). Známé slovníky pro chemii (CML - Chemical Markup Language), biologii (BSML - Bioinformatic Sequence Markup Language) atd.

Vydali jsme novou knihu „Content Marketing on Social Media: How to Get Into the Heads of Subscribers and Fall in Love with your Brand.“

HTML je hypertextový značkovací jazyk.

Tento jazyk se používá k organizaci webových stránek. Pojďme udělat analogii. Koupíte si noviny. Obsahuje několik článků. Každý článek má název, má fotografie. A text je napsán v několika sloupcích. Toto je struktura stránky novin.

Na webu se všechno děje stejně. Pro vytvoření správné struktury článku - obsahu - je třeba použít textový značkovací jazyk.

K čemu slouží HTML

HTML se používá k informování prohlížeče, jak zobrazit stránku na obrazovce.

Jazyk je velmi rozšířený. Jedná se o univerzální nástroj pro stylování obsahu na stránce. Jeho použití je možné v jakémkoli prohlížeči. Pokud píšete kód v programovacím jazyce, potřebujete znát některé zvláštnosti, operátory, datové typy atd.

HTML se skládá ze sady značek - příkazů a atributů - vlastností. Jsou snadno zapamatovatelné a referenční materiály lze vždy najít.

Co je to HTML kód

Kód je příkazy do prohlížeče, jak má být stránka zobrazena. Existuje struktura, kterou je třeba vždy dodržovat. Například na stránce je pouze jeden nadpis H1, hlavní informace jsou umístěny v sekci atd.

V jazyce existují tři nástroje.

Existují dva typy značek - párové a jednoduché.

  • - spárovaná značka, otevírání a zavírání. Působí na text mezi nimi.
  • Jedna značka, působí na text po ní až do další značky.

Struktura kódu HTML na stránce

Řekli jsme, že struktura jakéhokoli dokumentu html je vždy stejná. Dále uvádíme seznam požadovaných prvků.

  1. !- označuje, že se v dokumentu používá HTML.
  2. ...- celý kód stránky je umístěn v této značce. Cokoli, co do něj není vloženo, prohlížeč nerozpozná a nezobrazí.
  3. ...- spárovaná značka, obsahuje technické informace, například o kódování dokumentu.
    1. ... je název stránky, je umístěn uvnitř hlavní části. Každá stránka musí mít svůj vlastní jedinečný název.
    2. - toto jsou servisní informace. Spojuje samostatné styly se stránkou - css atd. Uživateli se nezobrazuje.
  4. ...- tělo stránky. V této značce jsou obsaženy všechny základní informace.
    1. ...- hypertextové odkazy.
    2. - Snímky.
    3. ...- miniatura.
    4. ...- kurzíva.

Uvnitř těla může být neomezený počet prvků.

Takto například vypadá část kódu stránky v jednom z našich příspěvků na blogu.

Čím častěji používáte značky, tím rychleji si je pamatujete. Vždy můžete najít odkaz se všemi tagy, atributy a jejich hodnotami.

Libovolný dokument má tři součásti:

· Struktura;

Obsah jsou informace, které se zobrazují v dokumentu. Obsah dokumentu na papíře může být čistě textový a může obsahovat také obrázky. Pokud je dokument předložen v elektronické podobě, může obsahovat multimediální data a odkazy na jiné dokumenty. Ačkoli se obsah různých dokumentů liší, lze je klasifikovat podle typu, například podle knihy nebo jízdenky na vlak.

Styl dokumentu určuje, jak se jeho obsah zobrazí na konkrétním zařízení (například na tiskárně nebo na displeji). Koncept stylu zahrnuje vlastnosti písma (název, velikost, barvu) celého výstupního dokumentu nebo jeho jednotlivých bloků, pořadí stránkování, uspořádání bloků na stránkách a další parametry. Stejný dokument lze vydávat v různých stylech na různých médiích i na stejném médiu.

Značkovací jazyky dokumentů jsou umělé jazyky určené k popisu struktury dokumentu a vztahů mezi různými objekty struktury. Data značek se také nazývají metadata.

Prvním značkovacím jazykem je GML (Generalized Markup Language), vyvinutý zaměstnanci IBM již v 60. letech minulého století. Jeho bezprostředním nástupcem se stal SGML (Standard Generalized Markup Language), který definuje pravidla pro zápis značkovacích prvků do dokumentu. Dokument, který odpovídá pravidlům jazyka, se nazývá dokument SGML.

SGML je definován v normě ISO 8879, která specifikuje následující základní požadavky na značkovací jazyk dokumentu:

· Jazyk musí být čitelný člověkem.

· Označené soubory dokumentů musí být textové a kódované pomocí znaků ASCII (American Standard Code for Information Interchange). Obsah dokumentu však nemusí být kódován pomocí ASCII nebo text.

SGML a podobné jazyky používají speciální nástroje pro značení dokumentů:

· Prvky a doprovodné atributy;

Subjekty;

· Komentáře.

Strukturální jednotka dokumentu SGML je prvek. V textu značky musí být každý prvek zvýrazněn konkrétním způsobem. Zvýraznění se provádí vložením počáteční značky (z anglického slova tag - tag) na začátek prvku (start tag) a koncové značky (end tag) na konec prvku. Počáteční a koncová značka mají stejný název. Chcete-li odlišit značky od běžného textu, musí začínat počáteční značkou a končit znakem konce značky. Kromě toho je v koncové značce uveden znak - znaménko koncové značky. V SGML lze jako takové tagy použít libovolné znaky, ale nejčastěji znak „<" (левая угловая скобка), в качестве признака окончания тега используется символ ">„(levý úhelník) a„ / “(lomítko) jako koncová značka. Prvky v dokumentu SGML mohou obsahovat další prvky, což má za následek grafické znázornění dokumentu SGML jako hierarchické (stromové) struktury.


Příklad 4.3.1. Dokument SGML definující seznam studentů s výsledky jejich zkoušek lze specifikovat následovně:

Seznam známek studentů v relaci

Ivanov Ivan Ivanovič

TS-61

A

B

B

B

Petrov Petr Petrovič

TS-62

C

C

D

C

V tomto dokumentu je prvním prvkem prvek seznamu studentů. Tento prvek obsahuje jeden prvek titulu (název) a několik prvků studenta (údaje o studentovi). Každý prvek studenta zase obsahuje jeden prvek celého jména (příjmení, jméno a příjmení studenta), jeden prvek číslo skupiny (číslo skupiny) a jeden prvek seznamu známek (seznam známek studenta v relaci) . Nakonec prvek mark-list obsahuje několik prvků mark (mark).

Grafické znázornění tohoto seznamu na obr. 1 má stromovou strukturu:

Obr. 4.3.1. Vynesená struktura dokumentu SGML

Atributy lze použít k upřesnění prvků SGML. Atributy se zapisují do počáteční značky prvku následovně:

attribute-name = "atribut-hodnota".

Prvek může mít více atributů. Atributy jsou od sebe odděleny a od názvu prvku alespoň jednou mezerou.

Příklad 4.3.2. U známkových prvků v příkladu 4.3.1 můžete nastavit atribut předmět, jehož hodnotou je název disciplíny, pro kterou byla zkouška složena. U prvního studenta pak budou mít prvky následující podobu:

A

B

B

B

Jazyky, jako je SGML, používají entity pro práci s datovými skupinami. Entitou jsou jakákoli pojmenovaná data, textová i netextová. Při prohlížení dokumentu je název entity nahrazen jeho hodnotou. Například název textové entity kpi bude nahrazen jeho hodnotou: Kyjevský polytechnický institut a netextová entita image1 bude nahrazena obrázkem s názvem image1.

Termín „označení“ pochází z tradiční praxe označování rukopisů před zveřejněním (tj. Přidání symbolických příkazů na okraj a mezi řádky v papírovém rukopisu).

Po mnoho století to dělali vydavatelé (redaktoři a korektori), kteří si všimli, jaké písmo, styl a velikost by měly být napsány fragmenty textu, a poté předali rukopis sázecím strojům, kteří ručně zadali text s přihlédnutím k značkovacím znakům.

Značkovací jazyk je sada speciálních pokynů zvaných značky, které vykonávají následující funkce:

      funkce nastavení pro zpracování vybraných prvků;

      výběr logických prvků tohoto dokumentu.

Funkce nastavení pro zpracování vybraných položek

V textových procesorech existují integrované příkazy pro zapnutí / vypnutí písem a další, podobné příkazům pro ovládání umístění informací na obrazovce nebo při tisku. Tento přístup se nazývá příkaz nebo procesní označení.

Příklady procesních značek

Výběr logických prvků dokumentu

Slouží k vytvoření jakékoli struktury v dokumentech a definici vztahů mezi různými prvky této struktury bez zadání metody zpracování. Tomuto označení se říká popisný.

Změnou sady postupů tak, aby odpovídala popisnému označení, můžete změnit vzhled stejného dokumentu.

Popisné označení

Hlavní výhodou popisného označení je jeho flexibilita, protože části textu jsou označeny jako „co jsou“ (spíše než „jak by měly být zobrazeny“).

V budoucnu může být software napsán tak, aby zpracovával tyto fragmenty způsobem, který vývojáři jazyků ani nepředvídali. Například hypertextové odkazy HTML, které byly původně určeny pro uživatele k procházení sadou odkazů v síti, se později začaly používat pomocí vyhledávacích a indexovacích mechanismů na webu, k hodnocení popularity zdrojů atd.

Příklady značkovacích jazyků

Značkovací jazyky se používají všude tam, kde je vyžadován formátovaný text:

    v tiskárně (SGML, TeX, PostScript, PDF),

    uživatelská rozhraní počítačů (MicrosoftWord, OpenOffice, troff),

    World Wide Web (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

Struktura značky značkovacího jazyka

Vývoj popisných nápadů na značkování vedl k definici označení jako formálního jazyka.

Jazykové značky (deskriptory řízení) jsou určitým způsobem zakódovány (přiděleny vzhledem k hlavnímu obsahu dokumentu) a slouží jako pokyny pro program, který zobrazuje obsah dokumentu na straně klienta.

Mnoho moderních jazyků používá symboly k reprezentaci těchto příkazů (jazykové značky)< и >, uvnitř kterého byly umístěny názvy instrukcí a jejich parametry (HTML a XML). V SGML můžete přiřadit další znaky k uzavření značky (například složené závorky). Kromě toho se používají různé systémy jazyků podmnožiny, které mají méně schopností, například značkovací jazyk BBCode se používá na webových fórech a diskusních fórech, jejichž značky jsou ohraničeny hranatými závorkami :.

Model značky popisuje dokument jako kolekci kontejnerů, z nichž každý začíná a končí značkami. Ve většině případů se značky používají ve dvojicích. Dvojice se skládá z počáteční značky a koncové značky.

Syntaxe otevírací značky:<имя_тега [атрибуты]>

Název závěrečné značky se liší od názvu úvodní značky pouze v tom, že jí předchází lomítko:

Atributy definují další vlastnosti prvku. Atributy značek jsou psány v následujícím formátu: name [= "value"]. U některých atributů nemusí být hodnota uvedena. Koncová značka nemá žádné atributy.

Jakákoli spárovaná značka začíná počáteční značkou a končí, když je nalezena odpovídající koncová značka.

Dvojice otevíracích a uzavíracích značek se nazývá kontejner a část textu mezi nimi se nazývá prvek.

Nadpis úrovně 1

Nadpis úrovně 2

V závislosti na použitém značkovacím jazyce je navíc možné použít jednu značku a prázdnou značku prvku. Název značky definuje typ prvku.

Syntaxe jedné značky:<имя_тега [атрибуты] />

V některých značkovacích jazycích jsou názvy značek předdefinovány (HTML). Jiné nejsou přísně regulovány, tj. uživatelé mohou zadávat a používat nové značky (XML). Například značka „persona“ může definovat typ tohoto prvku XML, například příjmení, jméno a příjmení. Ivanov Ivan Ivanovič

V SGML se prvky mohou překrývat, to znamená, že v SGML je možná následující posloupnost značek:

V XML mají prvky přísnou syntaktickou strukturu, to znamená, že jsou přísně vnořeny a vždy uzavřeny:

V SGML, HTML také nemusí být soukromé:

Téměř ve všech značkovacích jazycích dokumentů je hodnota atributu interpretována jako text. Hodnota atributu je obvykle uvedena v uvozovkách.

Poznámka:

Dokument napsaný pomocí značkovacího jazyka obsahuje nejen samotný text (jako posloupnost slov a interpunkční znaménka), ale také další informace o jeho různých částech - například označení záhlaví, zvýraznění, seznamy atd.

Ty. dokument není nic jiného než běžný soubor ASCII s přidanými ovládacími kódy (tagy).