Historia rozwoju języków znaczników. Języki znaczników dokumentów – jaki jest ich główny cel Język znaczników danych to

Języki znaczników

Język znaczników(tekst) w terminologii komputerowej - zestaw znaków lub sekwencji wstawionych do tekstu w celu przekazania informacji o jego wyniku lub strukturze. Należy do klasy języków komputerowych. Dokument tekstowy napisany w języku znaczników zawiera nie tylko sam tekst (np. ciąg słów i znaków interpunkcyjnych), ale także Dodatkowe informacje o różnych jego częściach - na przykład wskazanie nagłówków, wyborów, list itp. Więcej trudne przypadki język znaczników umożliwia wstawianie do dokumentu elementów interaktywnych i treści innych dokumentów.

Należy zauważyć, że język znaczników nie jest kompletny w języku Turinga i zwykle nie jest uważany za język programowania, chociaż, ściśle mówiąc, tak jest.

HTML (z angielskiego. Hipertekstowy język znaczników- "język znaczników hipertekstowych") - opracowany przez brytyjskiego naukowca Tima Bernersa-Lee około 1986-1991 w murach Europejskiego Centrum badania jądrowe w Genewie (Szwajcaria). HTML został stworzony jako język wymiany dokumentacji naukowej i technicznej, nadający się do użytku przez osoby nie będące specjalistami w dziedzinie layoutu. HTML z powodzeniem poradził sobie ze złożonością SGML poprzez zdefiniowanie małego zestawu elementów strukturalnych i semantycznych - deskryptorów. Deskryptory są również często określane jako „znaczniki”. Dzięki HTML możesz łatwo stworzyć stosunkowo prosty, ale pięknie zaprojektowany dokument. Oprócz uproszczenia struktury dokumentu, do HTML dodano obsługę hipertekstu. Możliwości multimedialne zostały dodane później.

Początkowo HTML został wymyślony i stworzony jako środek strukturyzowania i formatowania dokumentów bez konieczności renderowania (wyświetlania). W idealnym przypadku tekst ze znacznikami HTML powinien być odtworzony bez zniekształceń stylistycznych i strukturalnych na sprzęcie o różnym wyposażeniu technicznym (kolorowy ekran nowoczesnego komputera, monochromatyczny ekran organizera, ekran telefonu komórkowego lub urządzenia o ograniczonej wielkości, programy do odtwarzania głosu teksty). Jednak współczesne zastosowanie HTML jest dalekie od pierwotnego celu. Na przykład tag

, używany kilkakrotnie do formatowania strony, służy do tworzenia najczęściej używanych tabel w dokumentach. Na przestrzeni lat główna idea platform niezależności językowej HTML została poświęcona nowoczesnym potrzebom projektowania multimediów i grafiki.

XML(pol. mix rozciągliwym arkupL język- rozszerzalny język znaczników; wymawiane [ ex-em-eml]) jest zalecanym językiem znaczników przez konsorcjum World Wide Web Consortium (W3C). Specyfikacja XML opisuje dokumenty XML i częściowo opisuje zachowanie procesorów XML (programów czytających dokumenty XML i zapewniających dostęp do ich zawartości). XML został zaprojektowany jako język o prostej formalnej składni, łatwy do tworzenia i manipulowania przez programy, a jednocześnie łatwy do czytania i tworzenia dokumentów przez ludzi, z naciskiem na Internet. Język nazywany jest rozszerzalnym, ponieważ nie naprawia znaczników używanych w dokumentach: deweloper może tworzyć znaczniki zgodnie z potrzebami konkretnego obszaru, ograniczając się jedynie regułami składniowymi języka. Połączenie prostej formalnej składni, przyjazności dla człowieka, rozszerzalności i kodowania zawartości dokumentu opartego na Unicode doprowadziło do powszechnego stosowania zarówno samego XML, jak i wielu pochodnych. języki specjalistyczne w oparciu o XML w szerokiej gamie narzędzi programowych.

XHTML(pol. mix rozciągliwyh takT wewm arkupL język- Extensible Hypertext Markup Language) – rodzina opartych na XML języków znaczników dla stron internetowych, które powtarzają i rozszerzają możliwości HTML 4. Specyfikacje XHTML 1.0 i XHTML 1.1 są zaleceniami konsorcjum World Wide Web, ale dalej ten moment jego rozwój został zatrzymany z zaleceniem używania HTML. Nie są wydawane żadne nowe wersje XHTML.

Główną różnicą między XHTML a HTML jest przetwarzanie dokumentu. Dokumenty XHTML są przetwarzane przez ich moduł (parser) w taki sam sposób jak dokumenty XML. Podczas tego przetwarzania błędy popełnione przez programistów nie są poprawiane.

XHTML jest zgodny ze specyfikacją SGML, ponieważ XML jest jej podzbiorem. HTML ma wiele cech charakterystycznych w procesie przetwarzania i właściwie przestał należeć do rodziny SGML, która jest zawarta w szkicu specyfikacji HTML 5.

Przeglądarka wybiera parser do przetwarzania dokumentu na podstawie otrzymanego z serwera nagłówka typu content:

HTML - tekst / html

XHTML - aplikacja / xhtml + xml

· W przypadku lokalnego przeglądania na kliencie wybór jest oparty na rozszerzeniu pliku.

· W przeglądarce Internet Explorer do wersji 8 nie ma parsera do przetwarzania dokumentów XHTML.

WML(pol. Bezprzewodowy język znaczników- „wireless markup language”) – język znaczników dokumentów do użytku w telefonach komórkowych i innych urządzeniach mobilnych zgodnie ze standardem WAP.

Struktura przypomina nieco uproszczony HTML, ale istnieją kluczowe różnice, ponieważ WML koncentruje się na urządzeniach, które nie mają możliwości komputerów osobistych (mały ekran, nie wszystkie urządzenia mogą wyświetlać grafikę, mały rozmiar pamięci itp.): wszystkie informacje w WML zawiera tzw. „pokłady” (pol. talia kart). Dec to najmniejszy blok danych, jaki może przesłać serwer. Talie zawierają „karty” ( karta) (każda karta jest oddzielona znacznikami oraz). Jedna talia powinna zawsze zawierać co najmniej jedną kartę, ale może być ich kilka. Jednocześnie na ekranie urządzenia wyświetlana jest tylko jedna karta na raz, a użytkownik może przełączać się między nimi, klikając linki - ma to na celu zmniejszenie liczby żądań informacji do serwera; jednocześnie rozmiar stron WML nie powinien przekraczać 1-4 kilobajtów.

VML(pol. Język znaczników wektorowych- język znaczników wektorowych) opracowany przez firmę Microsoft do opisywania grafiki wektorowej. VML został wprowadzony do W3C w 1998 roku przez Microsoft, Macromedia itp. Mniej więcej w tym samym czasie Adobe, Sun i kilka innych firm dostarczyło dokumenty dla języka PGML. Oba te języki stały się później podstawą SVG.

PGML (Precyzyjny język znaczników graficznych, luźno przetłumaczony na język rosyjski - „precyzyjny język znaczników grafiki”) to oparty na XML język znaczników służący do opisywania grafiki wektorowej na stronie internetowej (diagramy, poszczególne elementy interfejsu) w postaci tekstu w formacie XML, wykorzystuje model obrazowania podobny do formatu PDF i PostScript. Zgłoszony przez W3C do konsorcjum Adobe Systems, IBM, Netscape Communications i Sun Microsystems w 1998, ale nie został zaakceptowany jako rekomendowany. Niemal w tym samym czasie Microsoft zgłosił do rozpatrzenia swój projekt VML, a rok później powstał bardziej zaawansowany język SVG, oparty na pomyśle dwóch technologii. SVG otrzymał rekomendację W3C i stał się głównym formatem opisu grafiki wektorowej na stronie internetowej.

SVG(z angielskiego. S kalkulowanyV ektorg grafika- skalowalna grafika wektorowa) to skalowalny język znaczników grafiki wektorowej stworzony przez World Wide Web Consortium (W3C) i zawarty w podzbiorze rozszerzalnego języka znaczników XML, przeznaczony do opisywania dwuwymiarowej grafiki wektorowej i mieszanej grafiki wektorowej/rastrowej w formacie XML . Obsługuje zarówno nieruchomą, jak i animowaną grafikę interaktywną - lub, innymi słowy, deklaratywną i oskryptowaną. Nie obsługuje opisu obiektów 3D. Jest to otwarty standard i jest rekomendacją W3C, organizacji stojącej za takimi standardami jak HTML i XHTML. SVG jest oparty na językach znaczników VML i PGML. Rozwijany od 1999 roku.

XBRL(pol. mix rozciągliwyb użytecznośćr raportowanieL język, listy. Extensible Business Reporting Language to otwarty standard elektronicznej prezentacji sprawozdań finansowych. Format XBRL jest oparty na XML Extensible Markup Language. XBRL wykorzystuje składnię XML, a także technologie związane z XML, takie jak przestrzeń nazw XML, schemat XML, XLink i XPath. Jednym z celów XBRL jest reprezentowanie i wymiana Informacje finansowe takich jak sprawozdania finansowe firm. Specyfikacja języka XBRL została opracowana i opublikowana przez niezależną organizację międzynarodową XBRL International, Inc.

Aby poprawić wizualną percepcję sieci, szeroko stosuje się technologię CSS, która pozwala na ustawienie jednolitych stylów dla wielu stron internetowych. Kolejną innowacją, na którą warto zwrócić uwagę, jest system nazewnictwa zasobów URN (pol. Jednolita nazwa zasobu).

Popularną koncepcją rozwoju sieci WWW jest tworzenie sieci semantycznej. Sieć semantyczna to dodatek do istniejącej sieci WWW, który ma na celu uczynienie informacji publikowanych w sieci bardziej zrozumiałymi dla komputerów. Sieć semantyczna to koncepcja sieci, w której każdy zasób w ludzkim języku byłby opatrzony opisem zrozumiałym dla komputera. Sieć semantyczna zapewnia dostęp do dobrze ustrukturyzowanych informacji dla dowolnej aplikacji, niezależnie od platformy i języka programowania. Programy będą mogły same znajdować niezbędne zasoby, przetwarzać informacje, klasyfikować dane, identyfikować powiązania logiczne, wyciągać wnioski, a nawet podejmować decyzje na podstawie tych wniosków. Sieć semantyczna, jeśli jest szeroko rozpowszechniona i odpowiednio wdrożona, może zrewolucjonizować Internet. Aby stworzyć zrozumiały dla komputera opis zasobu, Semantic Web używa formatu RDF (eng. Struktura opisu zasobów), który jest oparty na składni XML i używa identyfikatorów URI do oznaczania zasobów. Nowością w tym obszarze jest RDFS (pol. Schemat RDF) i SPARQL (pol. Protokół i język zapytań RDF) nowy język zapytań zapewniający szybki dostęp do danych RDF.

języki znaczników) to zestaw specjalnych instrukcji, zwanych znacznikami, zaprojektowanych w celu utworzenia struktury w dokumentach i zdefiniowania relacji między różnymi elementami tej struktury. Innymi słowy, znacznik pokazuje, która część dokumentu jest nagłówkiem, która jest podtytułem, co należy uznać za nazwisko autora itd. Znacznik dzieli się na znaczniki stylistyczne, strukturalne i semantyczne.

Stylistyczne znaczniki

Za wygląd dokumentu odpowiada stylistyczny znacznik. Na przykład w HTML ten typ znaczników zawiera znaczniki, takie jak (kursywa), (pogrubiona), (podkreślać), (tekst przekreślony) itp.

Znaczniki strukturalne

Znaczniki strukturalne określają strukturę dokumentu. W HTML tego typu znaczniki odpowiadają np. za znaczniki (akapit), (tytuł),

(sekcja) itp.

Znacznik semantyczny

O zawartości danych informuje znacznik semantyczny. Przykładami tego typu znaczników są znaczniki (Nazwa dokumentu), (kod, używany do list kodów) (zmienny),

(adres autora).

Podstawowe koncepcje każdego języka znaczników to znaczniki, elementy i atrybuty.

Tagi i elementy.

Znaczenie tagów i elementów jest często mylone.

Tagi, lub, jak się je nazywa, deskryptory kontrolne, służą jako instrukcje dla programu wyświetlającego zawartość dokumentu po stronie klienta, co zrobić z zawartością tagu. Nawiasy kątowe służą do wyróżnienia znacznika w stosunku do głównej treści dokumentu: znacznik zaczyna się od znaku „mniej” (<) и завершается знаком "больше" (>), wewnątrz której umieszczona jest nazwa instrukcji oraz ich parametry. Na przykład w HTML tag wskazuje, że tekst następujący po nim powinien być pisany kursywą.

Elementem są tagi w połączeniu z ich zawartością. Poniższa konstrukcja jest przykładem elementu:

Ten tekst jest kursywą .

Element składa się ze znacznika otwierającego (w naszym przykładzie jest to znacznik ), zawartość tagu (w przykładzie jest to tekst „To jest tekst, kursywa”) oraz tag końcowy (), chociaż czasami w HTML zamykający tag można pominąć.

Atrybuty

W celu ustawienia dowolnych parametrów podczas definiowania elementu, które określają charakterystykę tego elementu, używane są atrybuty.

Atrybuty składają się z pary "nazwa" = "wartość", którą można określić podczas definiowania elementu w znaczniku początkowym. Możesz zostawić spacje po lewej i prawej stronie symbolu równości. Wartość atrybutu jest podawana jako ciąg znaków, ujęta w pojedyncze lub podwójne cudzysłowy.

Każdy znacznik może mieć atrybut, jeśli ten atrybut jest zdefiniowany.

Gdy używany jest atrybut, element przyjmuje następującą postać:

<имя_тега атрибут = "значение"> zawartość tagu

Tekst jest wyrównany do środka

Jeden tag otwierający może zawierać kilka atrybutów, na przykład:

Określony rozmiar i kolor tekstu

Historia rozwoju języków znaczników.

Pojęcie hipertekstu zostało wprowadzone przez W. Busha w 1945 roku, a od lat 60. zaczęły pojawiać się pierwsze aplikacje wykorzystujące dane hipertekstowe. Jednak główny rozwój ta technologia otrzymany, gdy zaistniała realna potrzeba mechanizmu łączenia różnych zasobów informacyjnych, dającego możliwość tworzenia, przeglądania tekstu nieliniowego.

W 1986 roku ISO zatwierdziło Standardized Generalized Markup Language. Język ten jest przeznaczony do tworzenia innych języków znaczników, definiuje dozwolony zestaw znaczników, ich atrybutów oraz Struktura wewnętrzna dokument. Dzięki temu możliwe jest tworzenie własnych tagów związanych z treścią dokumentu. Obecnie staje się jasne, że takie dokumenty są trudne do interpretacji bez definicji języka znaczników przechowywanej w definicji typu dokumentu (DTD). DTD grupuje wszystkie reguły językowe w standardzie SGML. Innymi słowy, DTD opisuje relacje między tagami i zasady ich używania. Co więcej, dla każdej klasy dokumentów zdefiniowany jest własny zestaw reguł opisujących gramatykę odpowiedniego języka znaczników. Tak więc tylko za pomocą DTD można zweryfikować, czy tagi są używane poprawnie i dlatego muszą być przesłane z dokumentem SGML lub zawarte w dokumencie.

W tamtym czasie, oprócz SGML-a, istniało kilka innych, konkurencyjnych, podobnych języków, ale popularność (HTML, który jest jednym z jego potomków) dała SGML niezaprzeczalną przewagę nad swoimi braćmi.

Używając SGML możesz opisać uporządkowane dane, uporządkować informacje zawarte w dokumentach i przedstawić te informacje w jakimś standardowym formacie. Jednak ze względu na swoją złożoność, SGML był używany głównie do opisu składni innych języków, a niewiele aplikacji zajmowało się bezpośrednio dokumentami SGML. SGML jest zwykle używany tylko w dużych projektach, na przykład do stworzenia jednego systemu zarządzania dokumentami dla dużej firmy.

Język znaczników HTML jest znacznie prostszy i wygodniejszy niż SGML, jego instrukcje służą przede wszystkim kontrolowaniu procesu wyświetlania treści dokumentu na ekranie. HTML jako sposób oznaczania dokumentów technicznych został stworzony przez Tima Bernersa-Lee w 1991 roku specjalnie dla społeczności naukowej. Pierwotnie była to tylko jedna z aplikacji SGML.

Chociaż jedyną rzeczą, jaką może zrobić HTML, jest sklasyfikowanie części dokumentu i upewnienie się, że jest on poprawnie wyświetlany w przeglądarce, jest to najpopularniejszy język znaczników. Dzieje się tak, ponieważ HTML jest dość łatwy do nauczenia. Wszystko, co musisz zrobić, to nauczyć się poleceń HTML. DTD dla HTML jest przechowywany w przeglądarce. Ponadto należy zauważyć, że HTML został zaprojektowany do pracy na wielu różnych platformach. Ma jednak szereg istotnych ograniczeń:

  1. HTML ma ustalony zestaw tagów, którego nie można rozszerzać ani zmieniać;
  2. Tagi HTML pokazują jedynie, jak powinny być prezentowane dane, czyli wygląd dokumentu. HTML nie przenosi informacji o znaczeniu treści zawartych w tagach, strukturze dokumentu.

Każdy dokument składa się z trzech elementów:

  • zawartość;
  • Struktura;
  • styl.

Zazwyczaj treść dokumentu nie jest przedstawiona w dowolnej kolejności, ale ma pewną Struktura ... Struktura to kompozycja i kolejność części (bloków) dokumentu.

Styl dokument określa formę wyprowadzania jego treści do konkretnego urządzenia (np. drukarki lub wyświetlacza). Pojęcie stylu obejmuje charakterystykę czcionki (nazwa, rozmiar, kolor) całego dokumentu wyjściowego lub jego poszczególnych bloków, kolejność paginacji, rozmieszczenie bloków na stronach i inne parametry.

Języki znaczników dokumentówto sztuczne języki przeznaczone do opisu struktury dokumentu i relacji między różnymi obiektami struktury. Dane znaczników są również nazywane metadane.

Pierwszym językiem znaczników jest Język GML .Jego bezpośrednim spadkobiercą był Język SGML - standardowy uogólniony język znaczników, który definiuje zasady zapisywania elementów znaczników w dokumencie.

wymagania dotyczące języka znaczników dokumentów:

  1. Język musi być czytelny dla człowieka.
  2. Oznaczone pliki dokumentów muszą być tekstowe i zakodowane przy użyciu znaków kodu ASCII
  3. Język może wykorzystywać odniesienia zarówno do zasobów wewnętrznych (w tym samym dokumencie), jak i zasobów zewnętrznych (w innych dokumentach).

W języku SGML i podobnych językach, używane są specjalne narzędzia do oznaczania dokumentów:

  • struktura dokumentu;
  • deskryptory lub elementy i towarzyszące im atrybuty;
  • podmioty
  • uwagi.

Dokumenty SGML mają strukturę drzewa.

Deskryptory w SGML są umieszczone na początku (deskryptor początkowy) i na końcu (deskryptor zamykający) każdego element (pozycja).

Atrybuty Czy proste konstrukcje symboliczne ( przedmiotów ), które są dodawane do elementów w celu wyjaśnienia działania deskryptorów.

Ogólne języki znaczników, takie jak SGML , pozwalają na użycie atrybutów, za pomocą których można przypisać do 15 różnych typów wartości, w tym:

  • Linki do wszelkich zasobów poza dokumentem, które zwykle określa się mianem encji ( podmiotów).
  • Unikalny identyfikator ( ID ) w dokumencie.
  • Wskaźniki identyfikacyjne ( Wskaźniki ID ), które są odsyłacze dla tych elementów, które mają ID wymienione w dokumencie.
  • Symbole elementów lub atrybuty, które definiują symbole w treści elementu.
  • Dane znakowe ( dane znakowe) lub CDATA , które są dowolnymi poprawnymi znakami, które nie mogą działać jako wartości atrybutów.

Komentarze (1) umożliwiają dodanie informacji, które nie będą widoczne po przetworzeniu dokumentu. Komentarze nie wpływają na szybkość przetwarzania dokumentu, nie są uwzględniane ani przetwarzane w ramach treści SGML -dokument. Są one po prostu zawarte w kodzie źródłowym.

Aby sprawdzić zgodność dokumentu ze znacznikami danego typu, stosuje się specjalne programy - analizatory (parsery). Parsery są albo samodzielnymi programami, albo częścią programu do przetwarzania dokumentów SGML. Aby parser mógł sprawdzić dokument, tworzony jest specjalny dokument o nazwiedefinicja typu dokumentu

język HTML to aplikacja językowa SGML używane w Internet ze stałą strukturą, ustalonym zbiorem elementów (deskryptorów) i ich atrybutów oraz ustalonym zbiorem encji. rozszerzony język znaczników XML (rozszerzalny język znaczników). język XML jest podzbiorem języka SGML w pełni z nim kompatybilny.

XML zapewnia szeroki zakres funkcji, które nie są dostępne w HTML

4 . 3 .2. Wersje i rozszerzenia HTML oraz XML

Pierwsza wersja hipertekstowy język znaczników- HTML (HyperText Markup Language), podobnie jak sama technologia internetowa, został opracowany przez Tima Bernersa Lee w 1991 roku. HTMLjest implementacją reguł języka SGML dla typu dokumentu, który został nazwany dokumenty HTML. Język definiuje stałą strukturę, ustalony zestaw tagów i ich atrybutów oraz ustalony zestaw encji. Programy do przetwarzania dokumentów HTML nazywają się Web-przeglądarki ... Wynikiem przetwarzania dokumentów jest Web-strona wyświetlane na ekranie wyświetlacza.

W 1994 roku Grupa Wsparcia Internetu - IETF ( Grupa zadaniowa ds. inżynierii internetowej) opracował specyfikację HTML 2.0, która zapoczątkowała powszechne przyjęcie języka HTML w sieci Internet ... W tym samym roku powstało konsorcjum W3C (World Wide Web Corporation), zrzeszające 165 organizacji komercyjnych i akademickich, programistów i użytkowników (od momentu powstania do dnia dzisiejszego na czele tej organizacji stoi T.B. Lee). Ostatnia wersja specyfikacja HTML - HTML 4.01 została przyjęta przez konsorcjum w grudniu 1999 roku.

  • XML zapewnia szeroki zakres funkcji, których brakuje w HTML

Najnowsza wersja specyfikacji języka XML, XML 1.1, została przyjęta w kwietniu 2004 roku.

W oparciu o język XML koncern W3C opracował dalszy rozwój języka HTML - XHTML (Rozszerzony HTML - rozszerzony HTML). Pierwsza wersja tego języka, XHTML 1.0, została przyjęta w styczniu 2000 roku. Ta wersja jest w rzeczywistości przeformułowaniem HTML 4 jako aplikacji XML 1.0. Zakłada się, że dalszy rozwój języka HTML będzie prowadzony zgodnie ze specyfikacją XHTML.

Nowa wersja XHTML, XHTML 1.1, została przyjęta przez W3C w maju 2001. To zalecenie definiuje nowy typ dokumentu, oparty na modułach XHTML. Każdy moduł XHTML 1.1 zawiera jeden lub więcej elementów i/lub atrybutów HTML.

Zgodnie ze specyfikacją dokumenty XHTML 1.1 składa się z następujących grup modułów XHTML:

Moduły jądra to moduły, które muszą być obecne w każdym typie dokumentu zgodnym ze specyfikacją XHTML (ta grupa obejmuje moduły Struktura, tekst, hipertekst i lista).

Moduł apletu zawierające jeden element< applet > (ten element jest przestarzały i zaleca się jego używanie)< object > ).

Moduły rozszerzeń tekstu, w których zdefiniowane są różne dodatkowe moduły znaczników tekstu (grupa ta obejmuje moduły) Prezentacja, Edycja i Tekst dwukierunkowy).

Moduły formularzy (ta grupa obejmuje moduły) Podstawowe formularze i formularze).

Moduły tabel (w tej grupie znajdują się moduły) Podstawowe tabele i tabele).

Moduł obrazu który zapewnia podstawowe możliwości osadzania obrazu (ten moduł może być również niezależnie używany w niektórych implementacjach przez mapy obrazów klienta).

Moduł klienta - boczna mapa obrazu dostarcza elementy do map obrazów po stronie klienta (aby ten moduł działał, moduł musi być włączony) Obraz).

Moduł obiektowy który zapewnia obsługę włączania obiektów ogólnego przeznaczenia.

Moduł ramek dostarczanie elementów związanych z ramkami.

URL (ten element oblicza względne adresy URL dokumentu).

Moduł identyfikacji nazw używane do identyfikacji określonych elementów w dokumentach HTML.

Starszy moduł który definiuje elementy i atrybuty, które nie były już zalecane w poprzednich wersjach HTML i XHTML i nie są już zalecane.

4 . 3.3. Rodzaje struktur HTML i XHTML

Zgodnie ze specyfikacją HTML 4.01 dla dokumentów Zdefiniowano trzy struktury HTML opisane przez trzy DTD. Deweloperzy Sieć -pages muszą zawierać w swoich dokumentach jeden z trzech rodzajów oświadczeń. Różnica między DTD polega na elementach, które obsługują. Zapowiedź DTD należy umieścić na samym początku dokumentu.

HTML 4.01 Ścisłe DTD (mocna definicja) obejmuje wszystkie elementy i atrybuty, które nie są zastępowane ( przestarzałe ) i nie są używane w dokumentach ramowych.

Definicja przejściowego DTD HTML 4.0 (definicja przejściowa) obejmuje wszystkie elementy zawarte w strict DTD a także anulowane elementy i atrybuty.

Definicja zestawu ramek HTML 4.0 DTD (definicja ramek) zawiera, oprócz przejściowych elementów DTD, ramki.

Pierwsza linia dokumentu HTML zdefiniowany zgodnie ze specyfikacją XHTML

Ten wiersz określa wersję do użycia XML oraz kodowanie znaków dokumentu. Podczas kodowania znaków w XML używany jest kod dwubajtowy Unicode ... Jako wartości parametrów kodowanie najczęściej używane kodowania UTF -8 , w którym wartości pierwszych 128 znaków są reprezentowane w kodowaniu jednobajtowym, znaki najpopularniejszych języków (w tym rosyjski i ukraiński) - w dwóch bajtach, a pozostałe znaki w trzech bajtach. W kodowaniu UTF-16 wszystkie znaki są reprezentowane przez dwa bajty (zalecane jest używanie tego kodowania w dokumentach rosyjskich i ukraińskich) HTML).

Język znaczników HTML

Obecnie istnieje wiele technologii tworzenia stron internetowych, bez których webmaster nie może się obejść. Ale podstawą tworzenia dokumentów internetowych jest oczywiście hipertekstowy język znaczników HTML.

HTML to przede wszystkim język znaczników, a napisany w nim kod działa na komputerze klienckim w aplikacji przeglądarki internetowej. Wiąże się to z jego względną prostotą i łatwością rozbudowy.

Dlaczego potrzebujesz języka znaczników?

Kiedy tworzysz zwykły dokument w edytorze tekstu, możesz łatwo sformatować dokument, na przykład ustawić znaki na kursywę lub pogrubienie, ustawić akapit na nagłówek lub zwykły tekst i tak dalej. To, co robisz z dokumentem na ekranie monitora, jest przenoszone na papier w tej samej formie, gdy jest drukowane na drukarce.

Niezależnie od tego, czy wybierzesz opcję z menu rozwijanych, czy wydasz polecenie z klawiatury, natychmiast zobaczysz wynik swoich wysiłków na ekranie. Jednak konkretne polecenia, które implementują wyświetlanie dokumentu na ekranie lub na papierze, będą przed tobą ukryte.

W przypadku stron WWW użytkownik nie ma do czynienia z dokumentami papierowymi, ale z dokumentami elektronicznymi uzyskanymi przez Internet. Niedopuszczalna jest tu zasada wyświetlania dokumentu za pomocą formatowania aplikacji nadrzędnej. Zbyt wiele aplikacji lub wszelkiego rodzaju konwertery, które użytkownik musiałby mieć na swoim komputerze, aby efektywnie pracować z wieloma możliwymi formatami dokumentów.

Pomysł na rozwiązanie problemu wymiany dokumentów pomiędzy różnymi komputerami i aplikacjami przez Internet opiera się na hipertekstowym języku znaczników HTML (HyperText Markup Language). Język ten powstał ponad 15 lat temu jako standard formatowania dokumentów i został przyjęty przez zdecydowaną większość internautów, a co najważniejsze, przez wszystkich producentów. oprogramowanie i sprzęt do sieci. Dokumenty oznaczone według HTML można czytać na dowolnym komputerze, na którym jest tylko jeden program do przeglądania takich dokumentów - przeglądarka.

Dzięki językowi znaczników HTML klient sieci Web może wyświetlać dokument na ekranie swojego komputera w formie, w jakiej chciał tego programista: z określonymi rozmiarami czcionek i akapitami, z określonym układem obrazów, hiperłączy i tak dalej.

Dokument tekstowy napisany w HTML ma rozmiar w bajtach kilka razy mniejszy niż rozmiar podobnego dokumentu przygotowanego w edytorze tekstu (np. Word).

Berners-Lee (deweloper) oparł opracowany język o język SGML i techniki pracy z hipertekstem, stąd nazwa języka, który stworzył - HTML. Nowy język używał podstawowych konstrukcji SGML do opisywania dokumentów i łączy hipertekstowych.


Hipertekstto sposób organizowania tekstu, grafiki i innych danych, z którymi powiązane są elementy danych. Mogą być ze sobą powiązane zarówno elementy jednego dokumentu, jak i elementy różnych dokumentów. Struktura hipertekstowa jest sercem sieci WWW.

Hipertekst reprezentuje dokumenty elektroniczne... Z hipertekstem można pracować tylko na komputerze; w druku hipertekst nie istnieje. Przykładem systemu hipertekstowego jest dobrze znany system pomocy systemu operacyjnego Windows.

Znajomości w strukturze hipertekstowej realizowane są za pomocą spinki do mankietów. Dzięki linkom użytkownik może wywołać inny dokument z jednego dokumentu, inny dokument z niego itp.

W 1989 roku firma Berners-Lee rozwinęła się System informacyjny przypomina dokument Putina, do którego prowadzą linki. Dokumenty są przechowywane na serwerach zlokalizowanych na całym świecie i są połączone kanałami internetowymi. On opracował Protokół HTTP — język, w którym serwery mają wymieniać dokumenty hipertekstowe i napisał pierwszy serwer WWW i programy przeglądarki. Przemawiał bezpośrednio do społeczności internetowej, a entuzjaści zaczęli budować pierwsze strony internetowe w 1991 roku.

W kolejnych latach sieć World Wide Web rozwijała się bardzo szybko i stała się najpopularniejszą usługą w Internecie. Dziś zaspokaja potrzeby informacyjne najszerszego grona użytkowników, w tym milionów witryn internetowych. Duże serwisy przechowują tysiące i setki tysięcy dokumentów, a łączna liczba dokumentów w sieci WWW rośnie z każdą sekundą, gdyż nad ich tworzeniem pracuje ogromna armia specjalistów i amatorów w różnych częściach świata.

Sieć światowalub w skrócie Sieć — to globalny system dystrybucji informacji hipertekstowych wykorzystujący Internet jako kanały transportowe.

W rzeczywistości sieć WWW to hipertekstowa przestrzeń dokumentów, która nie jest związana z geografią samych witryn internetowych. Dlatego w tej przestrzeni fizyczna odległość między węzłami jest bez znaczenia. W ten sam sposób można przeglądać strony internetowe na ekranie monitora, które są przechowywane zarówno na dysku komputera w sąsiednim pokoju, jak i na serwerze znajdującym się w innym kraju.

Sieć World Wide Web działa według określonych standardów, które są opracowywane i wdrażane przez stowarzyszenie organizacji naukowych i przemysłowych – konsorcjum W3C(skrót od World Wide Web Consortium). ...

Język znaczników HTML został oparty na języku SGML. Narzędzia znaczników dla akapitów, nagłówków, list i innych elementów znalezionych w HTML zostały również przewidziane w SGML. Zaletą wynalazcy HTML jest to, że wprowadził do języka znaczników coś, czego nie miał SGML - linki hipertekstowe.

Wysyłanie dobrej pracy do bazy wiedzy jest proste. Skorzystaj z poniższego formularza

Studenci, doktoranci, młodzi naukowcy korzystający z bazy wiedzy w swoich studiach i pracy będą Ci bardzo wdzięczni.

Podobne dokumenty

    Definicja pojęcia hipertekstu. Główne części dokumentu SGML. Historia stworzenia standardowy język dokumenty HTML znaczników. Różnice między składnią XHTML a HTML. RSS to rodzina formatów XML do opisywania kanałów informacyjnych. Zastosowanie języka znaczników KML.

    prezentacja dodana 15.02.2014

    Podstawy języka programowania stron internetowych - HTML. Rodzaje informacji, które może zawierać strona internetowa, to tekst, grafika, dźwięk, animacja i wideo. Zestaw narzędzi do tworzenia stron internetowych. Podstawowe edytory HTML używane do projektowania stron internetowych.

    streszczenie, dodane 19.01.2011

    ogólna charakterystyka Hipertekstowy język znaczników. Struktura dokumentu HTML. Przegląd głównych funkcji HTML. Elementy nowoczesnego projektowania stron internetowych. Analiza praktyczne zastosowanie HTML (na przykładzie tutoriali).

    praca semestralna dodana 24.11.2012

    Podstawowe znaczniki i atrybuty języka HTML. Stworzenie strony internetowej, która powinna składać się z kilku powiązanych stron. Rozważ różne znaczenia atrybutów i znaczników na stronach i innych dokumentach. Formularze ekranowe opracowanych stron.

    praca laboratoryjna, dodano 16.04.2014

    Czym jest znacznik. Język znaczników to zestaw konwencji formatowania używanych do kodowania bloków tekstu. Możliwości formatów SGML, HTML, XML, historia powstania, specyfika aplikacji, kontrola nad rozmieszczeniem informacji.

    streszczenie, dodane 22.03.2010

    Nowy hipertekstowy język znaczników XHTML. Walidacja dokumentów XHTML, określanie ich typu. Typowe błędy w znacznikach XHTML. Zgodność agentów użytkownika. Używanie XHTML z innymi przestrzeniami nazw. Rozszerzenie semantyki HTML.

    praca semestralna, dodana 14.07.2009

    Poznawanie algorytmu opadania rekurencyjnego i systemu budowania gramatyki za pomocą analizatora leksykalnego Lex. Pisanie programu interpretującego znaczniki HTML. Sprawdzanie sekwencji wejściowej pod kątem poprawności danych wejściowych jako wspólna funkcja programy.

    test, dodano 25.12.2012