Historie vývoje značkovacích jazyků. Značkovací jazyky dokumentů – jaký je jejich hlavní účel Data Markup Language

Značkovací jazyky

Značkovací jazyk(text) v počítačové terminologii soubor znaků nebo sekvencí vkládaných do textu za účelem předávání informací o jeho výstupu nebo struktuře. Patří do třídy počítačových jazyků. Textový dokument napsaný pomocí značkovacího jazyka obsahuje nejen samotný text (jako posloupnost slov a interpunkčních znamének), ale také Dodatečné informace o jeho různých sekcích - například označení nadpisů, zvýraznění, seznamů atd. V dalších těžké případy Značkovací jazyk umožňuje vkládat do dokumentu interaktivní prvky a obsah z jiných dokumentů.

Je třeba poznamenat, že značkovací jazyk není Turing kompletní a není obvykle považován za programovací jazyk, ačkoli přísně vzato je.

HTML (z angličtiny. Hyper Text Markup Language-- "Hypertext Markup Language") - vyvinutý britským vědcem Timem Berners-Lee kolem roku 1986-1991 ve zdech Evropského centra jaderný výzkum v Ženevě (Švýcarsko). HTML byl vytvořen jako jazyk pro výměnu vědecké a technické dokumentace, vhodný pro použití lidmi, kteří nejsou specialisty v oblasti layoutu. HTML se úspěšně vypořádalo se složitostí SGML tím, že definovalo malou sadu strukturálních a sémantických prvků nazývaných deskriptory. Deskriptory jsou také často označovány jako „tagy“. Pomocí HTML můžete snadno vytvořit relativně jednoduchý, ale krásně navržený dokument. Kromě zjednodušení struktury dokumentu byla do HTML přidána podpora hypertextu. Multimediální funkce byly přidány později.

Zpočátku byl jazyk HTML koncipován a vytvořen jako prostředek pro strukturování a formátování dokumentů, aniž by byl vázán na prostředky reprodukce (zobrazení). V ideálním případě by měl být text s označením HTML reprodukován bez stylistických a strukturálních zkreslení na zařízení s různým technickým vybavením (barevná obrazovka moderního počítače, monochromatická obrazovka organizéru, omezená obrazovka mobilního telefonu nebo zařízení a programy pro hlasovou reprodukci texty). Moderní využití HTML je však svému původnímu účelu velmi vzdálené. Například tag

, který se několikrát používá pro formátování stránky, je určen k vytváření nejběžnějších tabulek v dokumentech. V průběhu času byla základní myšlenka platformy týkající se nezávislosti HTML obětována ve prospěch moderních potřeb pro multimédia a grafický design.

XML(Angličtina) EX napínatelnýM arkupL úhel-- rozšiřitelný značkovací jazyk; vyslovováno [ ex-em-eml]) je značkovací jazyk doporučený konsorciem World Wide Web Consortium (W3C). Specifikace XML popisuje dokumenty XML a částečně popisuje chování procesorů XML (programů, které čtou dokumenty XML a poskytují přístup k jejich obsahu). XML bylo navrženo jako jazyk s jednoduchou formální syntaxí, která by programům umožnila snadno vytvářet a zpracovávat dokumenty a zároveň byla pro lidi snadné číst a vytvářet dokumenty, s důrazem na používání webu. Jazyk se nazývá rozšiřitelný, protože neopravuje značkování používané v dokumentech: vývojář může volně vytvářet značkování podle potřeb konkrétní oblasti, přičemž je omezen pouze pravidly syntaxe jazyka. Kombinace jednoduché formální syntaxe, uživatelsky přívětivého přístupu, rozšiřitelnosti a spoléhání se na kódování Unicode pro reprezentaci obsahu dokumentů vedla k širokému použití jak samotného XML, tak mnoha odvozenin. specializované jazyky založené na XML v široké škále softwarových nástrojů.

XHTML(Angličtina) EX napínatelnýH ypert extM arkupL úhel-- rozšiřitelný hypertextový značkovací jazyk) -- rodina značkovacích jazyků webových stránek založených na XML, které replikují a rozšiřují možnosti HTML 4. Specifikace XHTML 1.0 a XHTML 1.1 jsou však doporučeními World Wide Web Consortium, tento moment jeho vývoj byl zastaven doporučením používat HTML. Nové verze XHTML nejsou vydány.

Hlavním rozdílem mezi XHTML a HTML je zpracování dokumentu. Dokumenty XHTML zpracovává jejich modul (parser) stejně jako dokumenty XML. Během tohoto zpracování se neopravují chyby způsobené vývojáři.

XHTML odpovídá specifikaci SGML, protože XML je jeho podmnožinou. HTML má mnoho funkcí v procesu zpracování a vlastně přestalo patřit do rodiny SGML, což je zakotveno v návrhu specifikace HTML 5.

Prohlížeč zvolí analyzátor ke zpracování dokumentu na základě záhlaví typu obsahu přijatého ze serveru:

HTML - text/html

XHTML - aplikace/xhtml+xml

· Pro místní prohlížení na klientovi je výběr založen na příponě souboru.

· V Internet Exploreru do verze 8 neexistuje žádný parser pro zpracování dokumentů XHTML.

WML(Angličtina) Bezdrátový značkovací jazyk-- "bezdrátový značkovací jazyk") -- značkovací jazyk dokumentů pro použití v mobilních telefonech a dalších mobilních zařízeních podle standardu WAP.

Struktura připomíná poněkud zjednodušený HTML, ale jsou zde klíčové rozdíly, protože WML je zaměřeno na zařízení, která nemají možnosti osobních počítačů (malá obrazovka, ne všechna zařízení mohou zobrazovat grafiku, malá velikost paměti atd.): všechny informace v WML je obsaženo v takzvaných „palubách“ (angl. paluba). Dec je nejmenší jednotka dat, kterou může server přenést. Balíčky obsahují „karty“ ( Kartu) (každá mapa je omezena značkami a). V jednom balíčku by měla být vždy alespoň jedna karta, ale může jich být i několik. Současně se na obrazovce zařízení zobrazuje vždy pouze jedna karta a uživatel mezi nimi může přepínat kliknutím na odkazy - to se provádí za účelem snížení počtu požadavků na informace na server; zároveň by velikost WML stránek neměla přesáhnout 1-4 kilobajty.

VML(Angličtina) Vector Markup Language-- vektorový značkovací jazyk) byl vyvinut společností Microsoft k popisu vektorové grafiky. VML byl předložen W3C v roce 1998 společnostmi Microsoft, Macromedia a další.Přibližně ve stejnou dobu Adobe, Sun a několik dalších společností předložilo dokumenty PGML k posouzení. Oba tyto jazyky se později staly základem pro SVG.

PGML (Precision Graphics Markup Language, volně přeloženo do ruštiny – „jazyk precizní grafiky“) – značkovací jazyk založený na XML používaný k popisu vektorové grafiky na webové stránce (diagramy, jednotlivé prvky rozhraní) ve formě textu ve formátu XML, používá model konstrukce obrázků , podobně jako PDF a PostScript. Byl předložen konsorciu W3C společnostmi Adobe Systems, IBM, Netscape Communications a Sun Microsystems v roce 1998, ale nebyl přijat jako doporučený. Téměř současně Microsoft předložil svůj projekt VML k posouzení, o rok později byl vyvinut pokročilejší jazyk SVG, založený na myšlence dvou technologií. SVG obdržel doporučení W3C a stal se hlavním formátem pro popis vektorové grafiky na webové stránce.

SVG(z angličtiny. S nastavitelnýPROTI ectorG rafika-- škálovatelná vektorová grafika) -- škálovatelný značkovací jazyk pro vektorovou grafiku, vytvořený konsorciem World Wide Web Consortium (W3C) a zahrnutý v podmnožině rozšiřitelného značkovacího jazyka XML, je navržen tak, aby popisoval dvourozměrné vektorové a smíšené vektorové / bitmapové grafiku ve formátu XML. Podporuje jak nehybnou, tak animovanou interaktivní grafiku – nebo, jinými slovy, deklarativní a skriptovanou. Nepodporuje popis trojrozměrných objektů. Jedná se o otevřený standard, který je doporučením W3C, organizace stojící za standardy jako HTML a XHTML. SVG je založeno na značkovacích jazycích VML a PGML. Vyvíjen od roku 1999.

XBRL(Angličtina) EX napínatelnýB podnikáníR hlášeníL úhel, lit. Extensible Business Reporting Language je otevřený standard pro elektronické finanční výkaznictví. Formát XBRL je založen na XML formátu Extensible Markup Language. XBRL používá syntaxi XML a také technologie související s XML, jako je jmenný prostor XML, schéma XML, XLink a XPath. Jedním z účelů XBRL je reprezentovat a vyměňovat si finanční informace jako jsou účetní závěrky společností. Specifikace jazyka XBRL je vyvinuta a publikována společností XBRL International, Inc., nezávislou mezinárodní organizací.

Pro zlepšení vizuálního vnímání webu se široce využívá technologie CSS, která umožňuje nastavit jednotné styly designu pro mnoho webových stránek. Další novinkou, která stojí za zmínku, je systém pojmenování zdrojů URN. Jednotný název zdroje).

Populární koncept pro rozvoj World Wide Web je vytvoření sémantického webu. Sémantický web je doplňkem stávajícího World Wide Web, který je navržen tak, aby informace zveřejňované v síti byly pro počítače srozumitelnější. Sémantický web je koncept sítě, ve které je každý zdroj v lidském jazyce opatřen popisem, kterému počítač rozumí. Sémantický web poskytuje přístup k jasně strukturovaným informacím pro jakoukoli aplikaci, bez ohledu na platformu a bez ohledu na programovací jazyky. Programy budou schopny samy nacházet potřebné zdroje, zpracovávat informace, třídit data, identifikovat logické vztahy, vyvozovat závěry a dokonce se na základě těchto závěrů rozhodovat. Pokud bude široce přijat a dobře implementován, má sémantický web potenciál způsobit revoluci v internetu. K vytvoření počítačově přívětivého popisu zdroje používá sémantický web formát RDF (angl. Rámec popisu zdrojů), který je založen na syntaxi XML a používá identifikátory URI k identifikaci zdrojů. Novinkou v této oblasti je RDFS (angl. Schéma RDF) a SPARQL (angl. Protokol a dotazovací jazyk RDF) nový dotazovací jazyk pro rychlý přístup k datům RDF.

značkovací jazyky) je sada speciálních instrukcí, nazývaných tagy, navržených k vytvoření struktury v dokumentech a definování vztahů mezi různými prvky této struktury. Jinými slovy, označení ukazuje, která část dokumentu je nadpisem, která podnadpisem, co je třeba považovat za jméno autora atd. Označení se dělí na stylistické, strukturální a sémantické.

Stylistické označení

Stylistické označení je zodpovědné za vzhled dokumentu. Například v HTML tento typ označení zahrnuje značky jako např (kurzíva), (tučné), (zdůraznit) (přeškrtnutý text) atd.

Strukturální značení

Strukturální značení definuje strukturu dokumentu. V HTML jsou pro tento typ označení například značky (odstavec), (titul),

(sekce) atd.

Sémantické označení

Sémantické značení informuje o obsahu dat. Značky jsou příklady tohoto typu označení. (název dokumentu), (kód, používaný pro výpisy kódů), (proměnné),

(adresa autora).

Základními pojmy jakéhokoli značkovacího jazyka jsou značky, prvky a atributy.

Tagy a prvky.

Významy značek a prvků jsou často zaměňovány.

Značky nebo řídicí značky, jak se jim také říká, slouží jako instrukce pro vykreslovací program na straně klienta, aby se vypořádal s obsahem značky. Pro zvýraznění tagu vzhledem k hlavnímu obsahu dokumentu se používají lomené závorky: tag začíná znakem menší než (<) и завершается знаком "больше" (>), uvnitř kterého je umístěn název instrukcí a jejich parametry. Například v HTML je značka označuje, že následující text by měl být kurzívou.

Elementem jsou značky spolu s jejich obsahem. Následující konstrukce je příkladem prvku:

Tento text je psán kurzívou .

Prvek se skládá z úvodní značky (v našem příkladu je to značka ), obsah tagu (v příkladu je to text „Toto je text v kurzívě“) a uzavírací tag(), i když někdy v HTML lze uzavírací značku vynechat.

Atributy

Atributy se používají k určení jakýchkoli parametrů, které specifikují vlastnosti tohoto prvku při definování prvku.

Atributy se skládají z dvojice "name" = "value", kterou lze zadat při definování prvku v počáteční značce. Nalevo a napravo od rovnítka můžete ponechat mezery. Hodnota atributu je určena jako řetězec uzavřený v jednoduchých nebo dvojitých uvozovkách.

Jakákoli značka může mít atribut, pokud je tento atribut definován.

Když je použit atribut, prvek má následující podobu:

<имя_тега атрибут = "значение"> obsah značky

Text je zarovnán na střed

Jedna úvodní značka může obsahovat několik atributů, například:

Určena velikost a barva textu

Historie vývoje značkovacích jazyků.

Koncept hypertextu zavedl W. Bush v roce 1945 a od 60. let se začaly objevovat první aplikace využívající hypertextová data. Nicméně hlavní vývoj tuto technologii obdržel, když byla skutečná potřeba mechanismu pro kombinování různých informačních zdrojů, poskytujících možnost vytvářet a prohlížet nelineární text.

V roce 1986 ISO schválila Standardized Generalized Markup Language. Tento jazyk je určen k vytváření dalších značkovacích jazyků, definuje povolenou sadu značek, jejich atributy a vnitřní struktura dokument. Je tak možné vytvářet vlastní značky související s obsahem dokumentu. Nyní je zřejmé, že takové dokumenty je obtížné interpretovat bez definice značkovacího jazyka, která je uložena v definici typu dokumentu (DTD). DTD seskupil všechna jazyková pravidla ve standardu SGML. Jinými slovy, DTD popisuje vztah mezi značkami a pravidly pro jejich aplikaci. Navíc je pro každou třídu dokumentů definována vlastní sada pravidel, která popisuje gramatiku odpovídajícího značkovacího jazyka. Pouze s pomocí DTD lze tedy zkontrolovat správné použití tagů, a proto musí být zaslány spolu s dokumentem SGML nebo součástí dokumentu.

V té době kromě SGML existovalo několik dalších podobných jazyků, které si navzájem konkurovaly, ale popularita (HTML, což je jeden z jeho potomků) poskytla SGML nepopiratelnou výhodu oproti svým protějškům.

Pomocí SGML můžete popsat strukturovaná data, uspořádat informace obsažené v dokumentech a prezentovat tyto informace v nějakém standardizovaném formátu. Ale kvůli své složitosti se SGML používal hlavně k popisu syntaxe jiných jazyků a jen málo aplikací se zabývalo přímo dokumenty SGML. SGML se obvykle používá pouze ve velkých projektech, například pro vytvoření jednotného systému správy dokumentů pro velkou společnost.

Značkovací jazyk HTML je mnohem jednodušší a pohodlnější než SGML , jeho instrukce jsou primárně určeny k řízení procesu zobrazování obsahu dokumentu na obrazovce. HTML jako způsob označování technických dokumentů vytvořil Tim Berners-Lee v roce 1991 speciálně pro vědeckou komunitu. Zpočátku to byla jen jedna z aplikací SGML.

Navzdory skutečnosti, že HTML umí pouze klasifikovat části dokumentu a zajistit jeho správné zobrazení v prohlížeči, jde o nejoblíbenější značkovací jazyk. Je to proto, že HTML je poměrně snadné se naučit. Jediné, co musíte udělat, je naučit se HTML příkazy. DTD pro HTML je uložen v prohlížeči. Kromě toho je třeba poznamenat, že HTML je navrženo tak, aby fungovalo na různých platformách. Má však řadu významných omezení:

  1. HTML má pevnou sadu značek a tuto sadu nelze rozšířit ani změnit;
  2. Značky jazyka HTML ukazují pouze to, jak mají být data prezentována, tedy vzhled dokumentu. HTML nenese informaci o významu obsahu obsaženého ve značkách, struktuře dokumentu.

Každý dokument má tři složky:

  • obsah;
  • struktura;
  • styl.

Obvykle není obsah dokumentu prezentován v libovolném pořadí, ale má určité struktura . Struktura je složení a posloupnost částí (bloků) dokumentu.

Styl Dokument definuje formu, ve které bude jeho obsah vydán na konkrétní zařízení (například na tiskárnu nebo displej). Pojem styl zahrnuje vlastnosti písma (název, velikost, barva) celého výstupního dokumentu nebo jeho jednotlivých bloků, pořadí stránkování, uspořádání bloků na stránkách a další parametry.

Značkovací jazyky dokumentůjsou umělé jazyky navržené k popisu struktury dokumentu a vztahů mezi různými objekty struktury. Označení dat se také nazývají metadata.

První značkovací jazyk je jazyk GML .Jeho bezprostředním nástupcem byl jazyk SGML - standardní zobecněný značkovací jazyk, který definuje pravidla pro psaní značkovacích prvků dokumentu.

Požadavky na jazyk pro značkování dokumentů:

  1. Jazyk musí být čitelný pro člověka.
  2. Označené soubory dokumentů musí být textové a zakódované pomocí kódových znaků ASCII
  3. Jazyk může používat odkazy na interní zdroje (ve stejném dokumentu) i externí zdroje (v jiných dokumentech).

V SGML a podobné jazyky používají speciální nástroje pro označování dokumentů:

  • struktura dokumentu;
  • deskriptory nebo prvky a jejich přidružené atributy;
  • entity (entity);
  • komentáře.

Dokumenty SGML mají stromovou strukturu.

Deskriptory v SGML umístěn na začátku (deskriptor otevření) a na konci (deskriptor uzavření) každého z nich prvek (položka).

Atributy jsou jednoduché symbolické konstrukce ( položky ), které se přidávají k prvkům, aby jim umožnily zpřesnit akci deskriptoru.

Obecné značkovací jazyky jako SGML , umožňují použití atributů, ke kterým lze přiřadit až 15 různých typů hodnot, včetně:

  • Odkazy na jakékoli zdroje mimo dokument, které se obvykle označují jako entity ( entity).
  • Jedinečný identifikátor ( ID ) prvek v dokumentu.
  • Ukazatele identifikátoru ( ID ukazatele ), které mají křížové odkazy pro ty prvky, které mají ID uvedené v dokumentu.
  • Značky prvku nebo atributy, které definují značky v obsahu prvku.
  • Údaje o postavách ( znaková data) nebo CDATA , což jsou jakékoli platné znaky, které nelze použít jako hodnoty atributů.

Komentáře umožňují přidat informace, které po zpracování dokumentu nebudou viditelné. Komentáře nemají vliv na rychlost zpracování dokumentu, nejsou považovány ani zpracovány jako součást obsahu SGML -dokument. Jsou jednoduše zahrnuty ve zdrojovém textu.

Pro kontrolu shody dokumentu s označením daného typu se používají speciální programy - analyzátory (analyzátory). Analyzátory jsou buď samostatné programy, nebo jsou součástí programu pro zpracování dokumentů SGML. Aby mohl parser provést validaci dokumentu, vytvoří se speciální dokument tzvdefinice typu dokumentu

jazyk HTML je jazyková aplikace SGML pro použití v Internet s pevnou strukturou, pevnou sadou prvků (deskriptorů) a jejich atributy a také pevnou sadou entit. rozšířený značkovací jazyk XML (Extensible Markup Language). jazyk XML je podmnožinou jazyka SGML , plně kompatibilní s ním.

Jazyk XML poskytuje širokou škálu funkcí, které nejsou dostupné HTML

4 . 3 .2. Verze a rozšíření HTML a XML

První verze Hyper Text Markup Language– HTML (HyperText Markup Language), stejně jako samotnou webovou technologii, vyvinul Tim Berners Lee v roce 1991. HTMLje implementace pravidel jazyka SGML pro typ dokumentu, který byl pojmenován dokumenty HTML. Jazyk definuje pevnou strukturu, pevnou sadu značek a jejich atributů a pevnou sadu entit. Programy pro zpracování dokumentů HTML se nazývají web- prohlížeče . Výsledkem zpracování dokumentu je Web-strana zobrazené na obrazovce displeje.

V roce 1994 Internet Support Group - IETF ( Internet Engineering Task Force) vyvinul specifikaci HTML 2.0, která zahájila široké přijetí jazyka HTML na webu Internet . V témže roce vzniklo konsorcium W3C (World Wide Web Corporation), které sdružuje 165 komerčních a akademických organizací, vývojářů a uživatelů (od svého vzniku až po současnost je v čele této organizace T. B. Lee). Nejnovější verze Specifikace HTML - HTML 4.01 bylo přijato konsorciem v prosinci 1999.

  • Jazyk XML poskytuje širokou škálu funkcí, které v HTML nenajdete.

Poslední verze specifikace jazyka XML, XML 1.1, byla přijata v dubnu 2004.

Na základě jazyka XML vyvinulo W3C další vývoj jazyka HTML – jazyk XHTML (Extended HTML - rozšířené HTML). První verze tohoto jazyka, XHTML 1.0, byla přijata v lednu 2000. Tato verze je ve skutečnosti přeformulováním HTML 4 jako aplikace XML 1.0. Předpokládá se, že další vývoj jazyka HTML bude probíhat v souladu se specifikacemi XHTML.

Nová verze XHTML, XHTML 1.1, byla přijata W3C v květnu 2001. Toto doporučení definuje nový typ dokumentu, modulový XHTML. Každý modul XHTML 1.1 obsahuje jeden nebo více elementů a/nebo atributů jazyka HTML.

Podle specifikace, dokumenty XHTML 1.1 se skládá z následujících skupin modulů XHTML:

Základní moduly jsou moduly, které jsou vyžadovány v jakémkoli typu dokumentu vyhovujícího specifikaci XHTML (tato skupina zahrnuje moduly Struktura , Text , Hypertext a Seznam ).

Modul apletu , obsahující jediný prvek< applet > (tento prvek je zastaralý a je doporučeno místo něj používat prvek< object > ).

Textové rozšiřující moduly, které definují různé doplňkové moduly textových značek (tato skupina zahrnuje moduly Prezentace, Úpravy a Obousměrný text).

Moduly formulářů (tato skupina zahrnuje moduly Základní formuláře a formuláře).

Tabulkové moduly (tato skupina zahrnuje moduly Základní tabulky a tabulky).

Obrazový modul A, která poskytuje základní možnosti vkládání obrázků (tento modul lze také nezávisle použít v některých implementacích pomocí obrázkových map na straně klienta).

Modul Obrazová mapa na straně klienta , který poskytuje prvky pro obrázkové mapy na straně klienta (tento modul vyžaduje, aby byl modul povolen Obraz ).

Objektový modul A, které poskytuje podporu pro zahrnutí obecných objektů.

Modul rámů A, která poskytuje prvky související s rámečky.

URL (relativní adresy URL dokumentu se vypočítávají pomocí tohoto prvku).

Modul identifikace jména , který se používá k identifikaci konkrétních prvků v dokumentech HTML.

Starší modul A, které určuje prvky a atributy, které již nejsou doporučovány v předchozích verzích HTML a XHTML a již nejsou doporučovány.

4. 3.3. Typy HTML a XHTML struktur

Podle specifikace HTML 4.01 pro dokumenty HTML definuje tři struktury , popsané třemi DTD. Vývojáři web -pages musí ve svých dokumentech obsahovat jedno ze tří prohlášení o typu. Rozdíl mezi DTD spočívá v prvcích, které podporují. Oznámení DTD je třeba umístit na úplný začátek dokumentu.

HTML 4.01 Strict DTD (přísná definice) zahrnuje všechny prvky a atributy, které nejsou přepsány ( zastaralé ) a nepoužívá se v zarámovaných dokumentech.

HTML 4.0 Transitional DTD definice (přechodná definice) zahrnuje všechny prvky zahrnuté v přísném DTD , stejně jako zrušené prvky a atributy.

Definice DTD HTML 4.0 Frameset (definice pro rámce) zahrnuje kromě prvků přechodné DTD také rámce.

První řádek dokumentu HTML , definované v souladu se specifikací XHTML

Tento řádek určuje verzi, která se má použít XML a kódování znaků dokumentu. Při kódování znaků v XML je použit dvoubajtový kód Unicode . Jako hodnoty parametrů kódování nejpoužívanější kódování UTF-8 , ve kterém jsou hodnoty prvních 128 znaků reprezentovány v jednobajtovém kódování, znaky nejběžnějších jazyků (včetně ruštiny a ukrajinštiny) jsou reprezentovány dvěma bajty a zbývající znaky jsou reprezentovány třemi bajtů. Zakódováno UTF-16 všechny znaky jsou reprezentovány dvěma bajty (toto kódování se doporučuje pro ruské a ukrajinské dokumenty HTML).

HTML značkovací jazyk

K dnešnímu dni existuje mnoho technologií pro tvorbu webových stránek, bez kterých se webmaster neobejde. Ale základem pro vývoj webových dokumentů je samozřejmě hypertextový značkovací jazyk HTML.

HTML je primárně značkovací jazyk a kód v něm napsaný se spouští na klientském počítači v aplikaci webového prohlížeče. S tím souvisí i jeho relativní jednoduchost a snadnost vývoje.

Proč potřebujete značkovací jazyk?

Když vytvoříte běžný dokument v textovém editoru, můžete dokument snadno naformátovat, například nastavením znaků na kurzívu nebo tučné písmo, přidáním nadpisu odstavce nebo stylu prostého textu a podobně. To, co děláte s dokumentem na obrazovce monitoru, se při tisku na tiskárně přenese na papír ve stejné podobě.

Ať už vyberete možnost z rozbalovacích nabídek nebo zadáte příkaz klávesy, výsledek svého úsilí okamžitě uvidíte na obrazovce. Konkrétní příkazy, které implementují zobrazení dokumentu na obrazovce nebo na papíře, vám však budou skryty.

V případě webových stránek se uživatel nezabývá papírovými, ale elektronickými dokumenty přijatými přes internet. Princip zobrazení dokumentu formátovacími nástroji nadřazené aplikace zde není přijatelný. Aby uživatel mohl efektivně pracovat s mnoha možnými formáty dokumentů, musel by mít na svém počítači příliš mnoho aplikací nebo nejrůznějších převodníků.

Myšlenka vyřešit problém výměny dokumentů mezi různými počítači a aplikacemi přes internet je založena na HyperText Markup Language (HTML). Tento jazyk vznikl před více než 15 lety jako standard formátu dokumentů a byl přijat drtivou většinou uživatelů internetu a hlavně všemi výrobci. software a vybavení pro web. Dokumenty označené podle HTML lze číst na jakémkoli počítači, který má pouze jeden prohlížeč těchto dokumentů – prohlížeč.

Díky značkovacímu jazyku HTML může webový klient zobrazit dokument na obrazovce svého počítače ve formě, v jaké jej vývojář zamýšlel: s určitou velikostí písma a zalomením odstavců, s určitým uspořádáním obrázků, hypertextových odkazů atd. .

Textový dokument napsaný v HTML má velikost v bajtech několikrát menší než velikost podobného dokumentu připraveného v textovém procesoru (například Word).

Berners-Lee (vývojář) založil vyvinutý jazyk na jazyce SGML a metodách práce s hypertextem, z čehož pramení i název jazyka, který vytvořil - HTML. Nový jazyk používal základní konstrukce SGML k popisu dokumentů a hypertextových odkazů.


Hyper-textovýje způsob organizace textu, grafiky a dalších dat, ve kterých jsou datové prvky propojeny. Lze propojit jak prvky jednoho dokumentu, tak prvky různých dokumentů. Hypertextová struktura je srdcem World Wide Web.

Hypertexty jsou elektronické dokumenty. S hypertexty lze pracovat pouze na počítači, v tištěné podobě hypertexty neexistují. Příkladem hypertextového systému je známý systém nápovědy Windows.

Spojení ve struktuře hypertextu se provádějí pomocí Odkazy. Díky odkazům může uživatel z jednoho dokumentu vyvolat jiný dokument, z něj další dokument a tak dále.

V roce 1989 vyvinul Berners-Lee informační systém, připomínající poutine dokumentů propojených odkazy. Dokumenty jsou uloženy na serverech umístěných po celém světě a propojených internetovými kanály. Vyvinul se HTTP protokol - jazyk, ve kterém si mají servery vyměňovat hypertextové dokumenty a napsal první webový server a programy prohlížeče. Oslovil přímo internetovou komunitu a v roce 1991 začali nadšenci vytvářet první webové stránky.

V průběhu let se World Wide Web rychle rozrostl a stal se nejoblíbenější službou na internetu. V současnosti uspokojuje informační potřeby nejširšího spektra uživatelů, včetně milionů webových stránek. Velké stránky hostí tisíce a stovky tisíc dokumentů a celkový počet dokumentů na WWW se každou sekundu zvyšuje, protože na jejich vytvoření pracuje obrovská armáda specialistů a amatérů v různých částech světa.

Celosvětová Síťnebo zkrácené web- je to globální systém šíření hypertextových informací využívající internet jako dopravní kanál.

Ve skutečnosti je World Wide Web hypertextový prostor dokumentů, který nesouvisí s geografií samotných webových stránek. Proto v tomto prostoru fyzická vzdálenost mezi uzly nedává smysl. Stejným způsobem můžete na obrazovce monitoru prohlížet webové stránky, které jsou uloženy jak na disku počítače ve vedlejší místnosti, tak na serveru v jiné zemi.

World Wide Web funguje podle určitých standardů, které vyvíjí a implementuje sdružení výzkumných a průmyslových organizací – konsorcium W3C(zkratka pro World Wide Web Consortium). .

Značkovací jazyk HTML byl založen na jazyku SGML. Nástroje pro označování odstavců, nadpisů, seznamů a dalších prvků dostupných v HTML byly také poskytnuty v SGML. Zásluhou vynálezce HTML je, že do značkovacího jazyka zavedl to, co nebylo SGML – to jsou hypertextové odkazy.

Odeslat svou dobrou práci do znalostní báze je jednoduché. Použijte níže uvedený formulář

Studenti, postgraduální studenti, mladí vědci, kteří využívají znalostní základnu při svém studiu a práci, vám budou velmi vděční.

Podobné dokumenty

    Definice pojmu hypertext. Hlavní části dokumentu SGML. Historie stvoření standardní jazyk Označení dokumentu HTML. Rozdíly mezi syntaxí XHTML a HTML. RSS je rodina formátů XML pro popis zpravodajských kanálů. Použití značkovacího jazyka KML.

    prezentace, přidáno 15.02.2014

    Základy programovacího jazyka webových stránek - HTML. Typy informací, které může webová stránka obsahovat, jsou text, grafika, zvuk, animace a video. Sada nástrojů pro tvorbu webových stránek. Základní HTML editory, které se používají pro web design.

    abstrakt, přidáno 19.01.2011

    obecná charakteristika Hyper Text Markup Language. Struktura dokumentu HTML. Přehled hlavních vlastností HTML. Prvky moderního designu webových stránek. Analýza praktická aplikace HTML (na příkladu tutoriálů).

    semestrální práce, přidáno 24.11.2012

    Základní značky a atributy jazyka HTML. Vytvoření webu, který by měl tvořit několik vzájemně propojených stránek. Zvažte různé hodnoty atributů a značek na stránkách a dalších dokumentech. Obrazovky vytvořených stránek.

    laboratorní práce, přidáno 16.04.2014

    Co je značkování. Značkovací jazyk je soubor konvencí o principech formátování, které se používají ke kódování textových bloků. Možnosti formátů SGML, HTML, XML, historie tvorby, aplikační specifika, kontrola nad umístěním informací.

    abstrakt, přidáno 22.03.2010

    Nový hypertextový značkovací jazyk XHTML. Validace XHTML dokumentů, určení jejich typu. Časté chyby v XHTML značení. Shoda uživatelských agentů. Použití XHTML s jinými jmennými prostory. Rozšíření sémantiky HTML.

    semestrální práce, přidáno 14.07.2009

    Studium rekurzivního sestupného algoritmu a systému budování gramatiky pomocí lexikálního analyzátoru Lex. Psaní interpretačního programu pro značkovací jazyk HTML. Kontrola správnosti vstupní sekvence jako společná funkce programy.

    kontrolní práce, přidáno 25.12.2012