Istoria dezvoltării limbajelor de marcare. Limbaje de marcare a documentelor - care este scopul lor principal este limbajul de marcare a datelor

Limbaje de marcare

Limbajul de marcare(text) în terminologia computerizată - un set de caractere sau secvențe inserate într-un text pentru a transmite informații despre rezultatul sau structura acestuia. Aparține clasei de limbaje informatice. Un document text scris folosind un limbaj de marcare conține nu numai textul în sine (cum ar fi o secvență de cuvinte și semne de punctuație), ci și informații suplimentare despre diferitele sale părți - de exemplu, o indicație de titluri, evidențieri, liste etc. complex În unele cazuri, limbajul de marcare vă permite să inserați elemente interactive și conținutul altor documente într-un document.

Trebuie remarcat faptul că limbajul de marcare nu este Turing complet și de obicei nu este considerat un limbaj de programare, deși, strict vorbind, este.

HTML (din engleză. Limbajul de marcare hipertext- „hipertext markup language”) – dezvoltat de omul de știință britanic Tim Berners-Lee în jurul anilor 1986-1991 în interiorul zidurilor Centrului European de Cercetare Nucleară din Geneva (Elveția). HTML a fost creat ca un limbaj pentru schimbul de documentație științifică și tehnică, potrivit pentru utilizarea de către persoane care nu sunt specialiști în domeniul layout-ului. HTML a abordat cu succes complexitatea SGML prin definirea unui set mic de elemente structurale și semantice - descriptori. Descriptorii sunt adesea denumiți și „etichete”. Cu HTML, puteți crea cu ușurință un document relativ simplu, dar frumos conceput. Pe lângă simplificarea structurii documentului, la HTML a fost adăugat suport pentru hipertext. Capacitățile multimedia au fost adăugate ulterior.

Inițial, HTML a fost conceput și creat ca un mijloc de structurare și formatare a documentelor fără a fi legat de mijloace de randare (afișare). În mod ideal, textul cu marcaj HTML ar fi trebuit reprodus fără distorsiuni stilistice și structurale pe echipamente cu diferite echipamente tehnice (ecran color al unui computer modern, ecran organizator monocrom, ecran de dimensiuni limitate al unui telefon mobil sau dispozitiv și programe pentru redarea vocală a texte). Cu toate acestea, aplicația modernă a HTML este departe de scopul său original. De exemplu, eticheta

, folosit de mai multe ori pentru a formata pagina, are scopul de a crea cele mai comune tabele din documente. De-a lungul anilor, ideea de bază a platformelor de independență a limbajului HTML a fost sacrificată nevoilor moderne de design grafic și multimedia.

XML(ing. eX tensionabileM arkupL limbaj- limbaj de markup extensibil; pronuntat [ ex-em-eml]) este limbajul de marcare recomandat de World Wide Web Consortium (W3C). Specificația XML descrie documentele XML și descrie parțial comportamentul procesoarelor XML (programe care citesc documente XML și oferă acces la conținutul acestora). XML a fost conceput pentru a fi un limbaj cu o sintaxă formală simplă, ușor pentru programe de a crea și manipula documente, în același timp ușor de citit și creat documente de către oameni, cu accent pe concentrarea sa pe Internet. Limbajul se numește extensibil deoarece nu fixează marcajul folosit în documente: dezvoltatorul este liber să creeze markup în conformitate cu nevoile unei anumite zone, fiind limitat doar de regulile sintactice ale limbajului. Combinația dintre sintaxa formală simplă, ușurință umană, extensibilitate și codificare bazată pe Unicode pentru a reprezenta conținutul documentului a condus la utilizarea pe scară largă atât a XML-ului în sine, cât și a unei varietăți de limbaje specializate derivate bazate pe XML într-o mare varietate de software. unelte.

XHTML(ing. EX tensionabileH ypert extM arkupL limbaj- Extensible Hypertext Markup Language) - o familie de limbaje de marcare bazate pe XML pentru pagini web care repetă și extind capacitățile HTML 4. Specificațiile XHTML 1.0 și XHTML 1.1 sunt recomandări ale consorțiului World Wide Web, dar în prezent dezvoltarea sa este oprită cu o recomandare de a folosi HTML. Nu sunt lansate versiuni noi de XHTML.

Principala diferență dintre XHTML și HTML este procesarea documentului. Documentele XHTML sunt procesate de modulul lor (parser) în același mod ca și documentele XML. În timpul acestei procesări, erorile făcute de dezvoltatori nu sunt corectate.

XHTML este conform specificației SGML, deoarece XML este un subset al acesteia. HTML are multe particularități în procesul de procesare și de fapt a încetat să aparțină familiei SGML, care este consacrată în proiectul de specificație HTML 5.

Browserul alege un parser pentru procesarea documentului pe baza antetului de tip conținut primit de la server:

HTML - text / html

XHTML - aplicație / xhtml + xml

· Pentru vizualizarea locală pe client, selecția se bazează pe extensia fișierului.

· În Internet Explorer până la versiunea 8, nu există un parser pentru procesarea documentelor XHTML.

WML(ing. Limbajul de marcare fără fir- „limbaj de marcare fără fir”) - un limbaj de marcare pentru documente pentru utilizare în telefoane mobile și alte dispozitive mobile conform standardului WAP.

Structura sa seamănă cu HTML oarecum simplificat, dar există și diferențe cheie, deoarece WML este axat pe dispozitive care nu au capabilitățile computerelor personale (ecran mic, nu toate dispozitivele pot afișa grafică, dimensiunea mică a memoriei etc.): toate informațiile în WML conține în așa-numitele „punți” (ing. punte). Dec este cel mai mic bloc de date care poate fi transmis de către server. Pachetele conțin „cărți” ( card) (fiecare card este delimitat de etichete și). Un pachet ar trebui să conțină întotdeauna cel puțin o carte, dar pot fi mai multe. În același timp, pe ecranul dispozitivului este afișat un singur card la un moment dat, iar utilizatorul poate comuta între ele făcând clic pe linkuri - acest lucru se face pentru a reduce numărul de solicitări de informații către server; în același timp, dimensiunea paginilor WML nu trebuie să depășească 1-4 kiloocteți.

VML(ing. Limbajul de marcare vectorială- limbaj de marcare vectorială) dezvoltat de Microsoft pentru a descrie grafica vectorială. VML a fost introdus în W3C de către Microsoft, Macromedia și alții în 1998. În același timp, Adobe, Sun și alte câteva companii au trimis documente pentru limbajul PGML. Ambele limbi au devenit ulterior baza pentru SVG.

PGML (Precision Graphics Markup Language, tradus vag în rusă - „limbaj de marcare grafică de precizie”) - limbaj de marcare bazat pe XML folosit pentru a descrie grafica vectorială pe o pagină web (diagrame, elemente individuale de interfață) sub formă de text în format XML, utilizează modelul de imagine similar cu PDF și PostScript. Trimis de W3C unui consorțiu format din Adobe Systems, IBM, Netscape Communications și Sun Microsystems în 1998, dar nu a fost acceptat conform recomandărilor. Aproape în același timp, Microsoft și-a depus proiectul VML spre luare în considerare, iar un an mai târziu a fost dezvoltat un limbaj SVG mai avansat, bazat pe ideea a două tehnologii. SVG a primit o recomandare W3C și a devenit principalul format pentru descrierea graficelor vectoriale pe o pagină web.

SVG(din engleză. S calabilV ectorG rafice- grafică vectorială scalabilă) este un limbaj de marcare pentru grafică vectorială scalabil creat de World Wide Web Consortium (W3C) și inclus într-un subset al limbajului de marcare extensibil XML, conceput pentru a descrie grafica vectorială bidimensională și grafică vectorială/raster mixtă în format XML . Suportă atât grafică interactivă, cât și grafică animată - sau, în alți termeni, declarativă și scriptată. Nu acceptă descrierea obiectelor 3D. Este un standard deschis și este o recomandare a W3C, organizația din spatele standardelor precum HTML și XHTML. SVG se bazează pe limbajele de marcare VML și PGML. Dezvoltat din 1999.

XBRL(ing. eX tensionabileB afaceriR raportareL limbaj, scrisori. Extensible Business Reporting Language este un standard deschis pentru prezentarea electronică a situațiilor financiare. Formatul XBRL se bazează pe XML Extensible Markup Language. XBRL utilizează sintaxa XML, precum și tehnologii legate de XML, cum ar fi spațiul de nume XML, XML Schema, XLink și XPath. Unul dintre scopurile XBRL este prezentarea și schimbul de informații financiare, cum ar fi situațiile financiare ale companiilor. Specificația de limbă XBRL este dezvoltată și publicată de organizația internațională independentă XBRL International, Inc.

Pentru a îmbunătăți percepția vizuală a web-ului, tehnologia CSS a devenit utilizată pe scară largă, ceea ce vă permite să setați stiluri uniforme pentru mai multe pagini web. O altă inovație care merită acordată atenție este sistemul de numire a resurselor URN (ing. Nume uniform al resursei).

Un concept popular pentru dezvoltarea World Wide Web este crearea Web-ului Semantic. Web-ul semantic este un add-on la World Wide Web existent, care este conceput pentru a face informațiile postate în rețea mai ușor de înțeles pentru computere. Web-ul semantic este conceptul de web în care fiecare resursă în limbajul uman ar fi furnizată cu o descriere pe care un computer o poate înțelege. Web-ul semantic oferă acces la informații bine structurate pentru orice aplicație, indiferent de platformă și indiferent de limbaje de programare. Programele vor putea să găsească ele însele resursele necesare, să proceseze informații, să clasifice datele, să identifice conexiuni logice, să tragă concluzii și chiar să ia decizii pe baza acestor concluzii. Dacă este distribuit pe scară largă și implementat corespunzător, Web-ul semantic poate revoluționa Internetul. Pentru a crea o descriere a unei resurse ușor de înțeles de calculator, Web-ul semantic folosește formatul RDF (ing. Cadrul de descriere a resurselor), care se bazează pe sintaxa XML și utilizează URI-uri pentru a desemna resurse. Nou în acest domeniu este RDFS (ing. Schema RDF) și SPARQL (ing. Protocol și limbaj de interogare RDF) un nou limbaj de interogare pentru acces rapid la datele RDF.

limbaje de marcare) este un set de instrucțiuni speciale, numite etichete, concepute pentru a forma o structură în documente și pentru a defini relații între diferitele elemente ale acestei structuri. Cu alte cuvinte, marcajul arată care parte a documentului este un titlu, care este un subtitlu, ce ar trebui considerat numele autorului etc.. Marcarea este împărțită în marcaj stilistic, marcaj structural și semantic.

Markup stilistic

Marcajul stilistic este responsabil pentru aspectul documentului. De exemplu, în HTML, acest tip de marcare include etichete precum (italice), (aldine), (subliniat), (text barat), etc.

Markup structural

Marcajul structural definește structura unui document. În HTML, acest tip de marcare este responsabil, de exemplu, de etichete (paragraf), (titlu),

(secțiunea) etc.

Markup semantic

Marcajul semantic informează despre conținutul datelor. Exemple de acest tip de marcare sunt etichetele (numele documentului), (cod, folosit pentru listele de coduri) (variabil),

(adresa autorului).

Conceptele de bază ale oricărui limbaj de marcare sunt etichetele, elementele și atributele.

Etichete și elemente.

Semnificațiile etichetelor și elementelor sunt adesea confuze.

Etichetele sau, așa cum sunt denumite și descriptori de control, servesc ca instrucțiuni pentru programul care afișează conținutul documentului pe partea clientului despre ce să facă cu conținutul etichetei. Parantezele unghiulare sunt folosite pentru a evidenția eticheta în raport cu conținutul principal al documentului: eticheta începe cu un semn „mai puțin” (<) и завершается знаком "больше" (>), în interiorul căruia sunt plasate denumirea instrucțiunilor și parametrii acestora. De exemplu, în HTML, eticheta indică faptul că textul care îl urmează ar trebui să fie cu caractere cursive.

Un element este etichetele în legătură cu conținutul lor. Următorul construct este un exemplu de element:

Acest text este cu caractere cursive .

Elementul constă dintr-o etichetă de deschidere (în exemplul nostru, aceasta este eticheta ), conținutul etichetei (în exemplu, acesta este textul „Acesta este text, italicized”) și eticheta de final (), deși uneori în HTML, eticheta de închidere poate fi omisă.

Atribute

Pentru a seta orice parametri la definirea unui element care specifică caracteristicile acestui element, se folosesc atribute.

Atributele constau dintr-o pereche „nume” = „valoare”, care poate fi specificată la definirea unui element într-o etichetă de început. Puteți lăsa spații în stânga și în dreapta simbolului egal. Valoarea atributului este specificată ca șir, cuprinsă între ghilimele simple sau duble.

Orice etichetă poate avea un atribut dacă acest atribut este definit.

Când se utilizează un atribut, elementul ia următoarea formă:

<имя_тега атрибут = "значение"> etichetă conținut

Textul este aliniat la centru

O etichetă de deschidere poate conține mai multe atribute, de exemplu:

Dimensiunea și culoarea textului specificate

Istoria dezvoltării limbajelor de marcare.

Conceptul de hipertext a fost introdus de W. Bush în 1945 și, începând cu anii 60, au început să apară primele aplicații care utilizează date hipertext. Cu toate acestea, această tehnologie a primit principala dezvoltare atunci când a existat o nevoie reală de un mecanism pentru combinarea unei varietăți de resurse de informații, oferind capacitatea de a crea, vizualiza text neliniar.

În 1986, ISO a aprobat limbajul de marcare generalizat standardizat. Acest limbaj este destinat creării altor limbaje de marcare, definește setul permis de etichete, atributele acestora și structura internă a documentului. Astfel, este posibil să vă creați propriile etichete legate de conținutul documentului. Acum devine evident că astfel de documente sunt dificil de interpretat fără o definiție a limbajului de marcare stocată într-o definiție a tipului de document (DTD). DTD grupează toate regulile de limbă în standardul SGML. Cu alte cuvinte, DTD descrie relația dintre etichete și regulile de utilizare a acestora. Mai mult, pentru fiecare clasă de documente, este definit propriul set de reguli care descriu gramatica limbajului de marcare corespunzător. Astfel, doar cu ajutorul DTD-ului poți verifica dacă etichetele sunt utilizate corect și de aceea trebuie trimise împreună cu documentul SGML sau incluse în document.

La acea vreme, pe lângă SGML, existau câteva alte limbi similare concurente, dar popularitatea (HTML, care este unul dintre descendenții săi) i-a oferit SGML un avantaj incontestabil față de frații săi.

Folosind SGML, puteți descrie date structurate, puteți organiza informațiile conținute în documente și puteți prezenta aceste informații într-un format standardizat. Dar, datorită complexității sale, SGML a fost folosit în primul rând pentru a descrie sintaxa altor limbi și puține aplicații au tratat direct documentele SGML. SGML este de obicei folosit numai în proiecte mari, de exemplu, pentru a crea un singur sistem de management al documentelor pentru o companie mare.

Limbajul de marcare HTML este mult mai simplu și mai convenabil decât SGML, instrucțiunile sale sunt destinate în primul rând să controleze procesul de afișare a conținutului documentului pe ecran. HTML ca modalitate de a marca documentele tehnice a fost creat de Tim Berners-Lee în 1991 special pentru comunitatea științifică. Inițial a fost doar una dintre aplicațiile SGML.

Deși singurul lucru pe care HTML îl poate face este să clasifice părți ale unui document și să se asigure că este afișat corect într-un browser, acesta este cel mai popular limbaj de marcare. Acest lucru se datorează faptului că HTML este destul de ușor de învățat. Tot ce trebuie să faci este să înveți comenzile HTML. DTD-ul pentru HTML este stocat în browser. În plus, trebuie remarcat faptul că HTML este conceput pentru a funcționa pe o mare varietate de platforme. Dar are o serie de limitări semnificative:

  1. HTML are un set fix de etichete, iar acest set nu poate fi extins sau modificat;
  2. Etichetele HTML arată doar modul în care trebuie prezentate datele, adică aspectul documentului. HTML nu conține informații despre semnificația conținutului conținut în etichete, structura documentului.

Orice document are trei componente:

  • conţinut;
  • structura;
  • stil.

De obicei, conținutul documentului nu este prezentat într-o ordine arbitrară, ci are o anumită structura ... Structura este compoziția și ordinea părților (blocurilor) documentului.

Stil documentul definește forma de ieșire a conținutului său către un anumit dispozitiv (de exemplu, o imprimantă sau un afișaj). Conceptul de stil include caracteristicile fontului (nume, dimensiune, culoare) întregului document de ieșire sau blocurile sale individuale, ordinea de paginare, aranjarea blocurilor pe pagini și alți parametri.

Limbaje de marcare a documentelorsunt limbaje artificiale concepute pentru a descrie structura unui document și relațiile dintre diferitele obiecte de structură. Datele de marcare sunt, de asemenea, numite metadate.

Primul limbaj de marcare este limbajul GML .Moştenitorul lui imediat a fost limbajul SGML - un limbaj de marcare generalizat standard care definește regulile de scriere a elementelor de marcare într-un document.

cerințe pentru limbajul de marcare a documentelor:

  1. Limbajul trebuie să fie ușor de citit de om.
  2. Fișierele documentelor marcate trebuie să fie text și codificate folosind caractere de cod ASCII
  3. Limbajul poate folosi referiri atât la resurse interne (în același document), cât și la resurse externe (în alte documente).

În SGML și limbi similare, sunt utilizate instrumente speciale de marcare a documentelor:

  • structura documentului;
  • descriptori sau elemente și atributele lor însoțitoare;
  • entitati
  • comentarii.

documente SGML au o structură arborescentă.

Descriptori în SGML sunt plasate la începutul (descriptorul de deschidere) și la sfârșitul (descriptorul de închidere) al fiecăruia element (articol).

Atribute Sunt construcții simbolice simple ( articole ), care se adaugă elementelor pentru a le oferi o clarificare a acțiunii descriptorilor.

Limbaje de marcare generice precum SGML , permit utilizarea atributelor cu care pot fi atribuite până la 15 tipuri de valori diferite, inclusiv:

  • Legături către orice resurse din afara documentului, care sunt de obicei denumite entități ( entități).
  • Identificator unic ( ID ) element din document.
  • Indicatori de identificare ( Indicatori ID ) care sunt încrucișate pentru acele elemente care au ID mentionate in document.
  • Simboluri ale elementelor sau atribute care definesc simboluri în conținutul unui element.
  • Date despre caractere ( date caracter) sau CDATA , care sunt orice caracter valid care nu poate acționa ca valori de atribut.

Comentarii (1) vă permit să adăugați informații care nu vor fi vizibile după procesarea documentului. Comentariile nu afectează viteza de procesare a documentului, nu sunt considerate sau procesate ca parte a conținutului SGML -document. Ele sunt pur și simplu incluse în codul sursă.

Pentru a verifica conformitatea documentului cu marcarea unui anumit tip, se folosesc programe speciale - analizoare (paratoare). Parserii sunt fie programe autonome, fie fac parte dintr-un program de procesare a documentelor SGML. Pentru ca analizatorul să verifice documentul, este creat un document special numitdefinirea tipului de document

limbaj HTML este o aplicație lingvistică SGML pentru utilizare în Internet cu o structură fixă, un set fix de elemente (descriptori) și atributele acestora și un set fix de entități. limbaj de marcare extins XML (Extensible Markup Language). Limbajul XML este un subset al limbajului SGML pe deplin compatibil cu acesta.

XML oferă o gamă largă de funcționalități care nu sunt disponibile în HTML

4 . 3 .2. Versiuni și extensii HTML și XML

Prima versiune limbaj de marcare hipertext- HTML (HyperText Markup Language), ca și tehnologia Web în sine, a fost dezvoltat de Tim Berners Lee în 1991. HTMLeste o implementare a regulilor limbajului SGML pentru tipul de document care a fost numit documente HTML. Limbajul definește o structură fixă, un set fix de etichete și atributele acestora și un set fix de entități. Programele de procesare a documentelor HTML se numesc Web- browsere ... Rezultatul procesării documentelor este Web-pagină afișat pe ecranul de afișare.

În 1994, Internet Support Group - IETF ( Grupul operativ de inginerie a internetului) a dezvoltat specificația HTML 2.0, care a început adoptarea pe scară largă a limbajului HTML pe web Internet ... În același an, a fost creat consorțiul W3C (World Wide Web Corporation), care reunește 165 de organizații comerciale și academice, dezvoltatori și utilizatori (din momentul creării și până în prezent, această organizație este condusă de T.B. Lee). Cea mai recentă versiune a specificației HTML, HTML 4.01, a fost adoptată de consorțiu în decembrie 1999.

  • XML oferă o gamă largă de funcționalități care îi lipsesc HTML

Cea mai recentă versiune a specificației limbajului XML, XML 1.1, a fost adoptată în aprilie 2004.

Bazat pe limbajul XML, concernul W3C a dezvoltat o dezvoltare ulterioară a limbajului HTML - XHTML (HTML extins - HTML extins). Prima versiune a acestui limbaj, XHTML 1.0, a fost adoptată în ianuarie 2000. Această versiune este efectiv o reformulare a HTML 4 ca o aplicație XML 1.0. Se presupune că dezvoltarea ulterioară a limbajului HTML va fi realizată în conformitate cu specificațiile XHTML.

O nouă versiune de XHTML, XHTML 1.1, a fost adoptată de W3C în mai 2001. Această recomandare definește un nou tip de document, XHTML bazat pe module. Fiecare modul XHTML 1.1 conține unul sau mai multe elemente și/sau atribute HTML.

Conform caietului de sarcini, documentele XHTML 1.1 constă din următoarele grupuri de module XHTML:

Modulele kernel sunt module care trebuie să fie prezente în orice tip de document conform specificației XHTML (acest grup include module Structură, Text, Hipertext și Listă).

Modul Applet conţinând un singur element< applet > (acest element a fost depreciat și se recomandă utilizarea elementului< object > ).

Module de extensie de text, în care sunt definite diverse module suplimentare de marcare a textului (acest grup include module Prezentare, Editare și Text bidirecțional).

Module de formulare (acest grup include module Forme și formulare de bază).

Module de tabel (acest grup include module Tabele și tabele de bază).

Modul de imagine care oferă capabilități de bază de încorporare a imaginii (acest modul poate fi, de asemenea, utilizat independent în unele implementări de către hărțile de imagine ale clientului).

Modul client - Hartă imagine laterală care furnizează elemente pentru hărțile de imagine pe partea client (pentru ca acest modul să funcționeze, modulul trebuie să fie activat Imagine).

Modul obiect care oferă suport pentru includerea obiectelor de uz general.

Modulul cadre furnizarea de elemente legate de rame.

URL (acest element calculează adresele URL relative ale documentului).

Modul de identificare a numelui folosit pentru a identifica elemente specifice din documentele HTML.

Modul moștenit care definește elemente și atribute care nu mai erau recomandate în versiunile anterioare de HTML și XHTML și nu mai sunt recomandate.

4 . 3 .3. Tipuri de structuri HTML și XHTML

Conform caietului de sarcini HTML 4.01 pentru documente HTML sunt definite trei structuri descrise de trei DTD-uri. Dezvoltatori Web -paginile trebuie să includă unul dintre cele trei tipuri de declarații în documentele lor. Diferența dintre DTD constă în elementele pe care le suportă. Anunţ DTD trebuie plasat chiar la începutul documentului.

HTML 4.01 DTD strict (definiție puternică) include toate elementele și atributele care nu sunt suprascrise ( depreciat ) și nu sunt utilizate în documentele cadru.

Definiția HTML 4.0 Transitional DTD (definiție tranzitorie) include toate elementele incluse în strict DTD precum și elemente și atribute anulate.

Definiția HTML 4.0 Frameset DTD (definiție pentru cadre) include, pe lângă elementele DTD tranzitorii, cadrele.

Prima linie a documentului HTML definit conform caietului de sarcini XHTML

Această linie specifică versiunea de utilizat XML și codificarea caracterelor documentului. La codificarea caracterelor în XML se folosește un cod de doi octeți Unicode ... Ca valori ale parametrilor codificare cele mai frecvent utilizate codificări UTF -8 , în care valorile primelor 128 de caractere sunt reprezentate într-o codificare pe un singur octet, caracterele celor mai comune limbi (inclusiv rusă și ucraineană) - în doi octeți, iar caracterele rămase în trei octeți. În codificare UTF -16 toate caracterele sunt reprezentate de doi octeți (se recomandă utilizarea acestor codificări pentru documentele rusești și ucrainene HTML).

Limbajul de marcare HTML

Până acum, există multe tehnologii pentru crearea de pagini web de care un webmaster nu se poate descurca. Dar baza pentru dezvoltarea documentelor Web este, desigur, limbajul de marcare hipertext HTML.

HTML este în primul rând un limbaj de marcare, iar codul scris în el rulează pe un computer client într-o aplicație de browser Web. Acest lucru este legat de relativa simplitate și ușurință de dezvoltare.

De ce ai nevoie de un limbaj de marcare?

Când creați un document obișnuit într-un program de procesare de text, puteți formata cu ușurință documentul, de exemplu, setați caracterele la cursive sau aldine, setați un paragraf la un titlu sau un stil de text simplu și așa mai departe. Ceea ce faceți cu un document de pe ecranul monitorului este transferat pe hârtie în aceeași formă atunci când este imprimat pe o imprimantă.

Indiferent dacă alegeți o opțiune din meniurile derulante sau dați o comandă de la tastatură, vedeți imediat rezultatul eforturilor dvs. pe ecran. Cu toate acestea, comenzile specifice care implementează afișarea documentului pe ecran sau pe hârtie îți vor fi ascunse.

În cazul paginilor Web, utilizatorul nu are de-a face cu documente pe hârtie, ci cu documente electronice obținute prin Internet. Principiul afișării documentului prin formatarea aplicației părinte este inacceptabil aici. Prea multe aplicații sau tot felul de convertoare pe care un utilizator ar trebui să aibă pe computerul său pentru a lucra eficient cu multe formate posibile de documente.

Ideea de a rezolva problema schimbului de documente între diferite computere și aplicații prin Internet se bazează pe limbajul de marcare hipertext HTML (HyperText Markup Language). Acest limbaj a fost creat acum mai bine de 15 ani ca standard de formatare a documentelor și a fost adoptat de marea majoritate a utilizatorilor de Internet și, cel mai important, de toți producătorii de software și echipamente pentru Web. Documentele marcate conform HTML pot fi citite pe orice computer pe care există un singur program pentru vizualizarea unor astfel de documente - un browser.

Datorită limbajului de marcare HTML, un client Web poate vizualiza un document pe ecranul computerului său în forma în care l-a intenționat dezvoltatorul: cu anumite dimensiuni de font și paragrafe, cu o anumită aranjare a imaginilor, hyperlink-uri și așa mai departe.

Un document text scris în HTML are o dimensiune în octeți de câteva ori mai mică decât dimensiunea unui document similar pregătit într-un procesor de text (de exemplu, Word).

Berners-Lee (dezvoltatorul) a bazat limbajul dezvoltat pe limbajul SGML și tehnicile de lucru cu hipertext, motiv pentru care denumirea limbajului creat de el - HTML. Noul limbaj a folosit constructe de bază SGML pentru a descrie documente și legături hipertext.


Hipertexteste o modalitate de organizare a textului, a graficelor și a altor date în care elementele de date sunt legate. Atât elementele unui document, cât și elementele diferitelor documente pot fi legate. Structura hipertextului se află în centrul World Wide Web.

Hipertextul sunt documente electronice. Puteți lucra cu hipertext numai pe computer; în tipărire, hipertextul nu există. Un exemplu de sistem hipertext este binecunoscutul sistem de ajutor al sistemului de operare Windows.

Conexiuniîntr-o structură hipertext se realizează folosind link-uri. Datorită link-urilor, un utilizator poate apela un alt document dintr-un document, un alt document din acesta etc.

În 1989, Berners-Lee a dezvoltat un sistem informatic care amintește de un document Putin legat prin link-uri. Documentele sunt stocate pe servere care sunt situate în toată lumea și sunt interconectate prin canale de Internet. A dezvoltat protocol HTTP - limba în care serverele ar trebui să facă schimb de documente hipertext, și a scris primul server Web și programe de browser. A vorbit direct cu comunitatea de internet, iar entuziaștii au început să construiască primele site-uri web în 1991.

În următorii ani, World Wide Web s-a dezvoltat rapid și a devenit cel mai popular serviciu de pe Internet. Astăzi răspunde nevoilor de informare ale celei mai largi game de utilizatori, inclusiv milioane de site-uri Web. Site-urile mari găzduiesc mii și sute de mii de documente, iar numărul total de documente de pe WWW crește în fiecare secundă, deoarece o armată uriașă de specialiști și amatori din diferite părți ale lumii lucrează la crearea acestora.

World Wide Websau prescurtat Web - este un sistem global de distribuție a informațiilor hipertext care utilizează Internetul ca canale de transport.

De fapt, World Wide Web este un spațiu de documente hipertext care nu are legătură cu geografia site-urilor Web în sine. Prin urmare, în acest spațiu, distanța fizică dintre noduri este lipsită de sens. Puteți vizualiza în același mod paginile Web pe ecranul monitorului, care sunt stocate atât pe discul computerului din camera alăturată, cât și pe un server situat în altă țară.

World Wide Web funcționează conform anumitor standarde, care sunt dezvoltate și implementate de o asociație de organizații de cercetare și industriale - un consorțiu W3C(Prescurtare pentru World Wide Web Consortium). ...

Limbajul de marcare HTML a fost bazat pe limbajul SGML. Instrumentele de marcare pentru paragrafe, titluri, liste și alte elemente găsite în HTML au fost, de asemenea, prevăzute în SGML. Meritul inventatorului HTML-ului este că a introdus în limbajul de marcare ceva ce SGML nu avea - link-uri hipertext.

Trimiteți-vă munca bună în baza de cunoștințe este simplu. Utilizați formularul de mai jos

Studenții, studenții absolvenți, tinerii oameni de știință care folosesc baza de cunoștințe în studiile și munca lor vă vor fi foarte recunoscători.

Documente similare

    Definiția conceptului de hipertext. Principalele părți ale unui document SGML. Istoricul creării limbajului standard de marcare a documentelor HTML. Diferențele dintre sintaxa XHTML și HTML. RSS este o familie de formate XML pentru descrierea fluxurilor de știri. Aplicarea limbajului de marcare KML.

    prezentare adaugata la 15.02.2014

    Bazele limbajului de programare al paginilor Web - HTML. Tipurile de informații pe care le poate conține o pagină Web sunt text, grafică, sunet, animație și video. Set de instrumente pentru crearea paginilor web. Editore HTML de bază utilizate pentru design web.

    rezumat, adăugat 19.01.2011

    Caracteristici generale ale limbajului de marcare hipertext. Structura documentului HTML. O prezentare generală a principalelor caracteristici ale HTML. Elemente de design modern al paginilor web. Analiza aplicării practice a HTML (pe exemplul programelor de instruire).

    lucrare de termen adăugată la 24.11.2012

    Etichete și atribute de bază ale limbajului HTML. Crearea unui site web, care ar trebui să fie format din mai multe pagini legate. Luați în considerare diferitele semnificații ale atributelor și etichetelor de pe pagini și alte documente. Formele de ecran ale paginilor dezvoltate.

    munca de laborator, adaugat 16.04.2014

    Ce este marcajul. Un limbaj de marcare este un set de convenții de formatare care sunt utilizate pentru a codifica blocuri de text. Posibilitati de formate SGML, HTML, XML, istoric de creatie, specificul aplicatiei, control asupra plasarii informatiilor.

    rezumat, adăugat 22.03.2010

    Noul limbaj de marcare hipertext XHTML. Validarea documentelor XHTML, determinarea tipului acestora. Greșeli frecvente în marcajul XHTML. Conformitatea agenților utilizatori. Utilizarea XHTML cu alte spații de nume. Extinderea semanticii HTML.

    lucrare de termen, adăugată 14.07.2009

    Explorarea algoritmului recursiv de descendență și a sistemului de construire a gramaticii folosind analizatorul lexical Lex. Scrierea unui program de interpret de markup HTML. Verificarea secvenței de intrare pentru corectitudinea intrării ca funcție generală a programului.

    test, adaugat 25.12.2012