Вижте какво е „Markup Language“ в други речници. Езици за маркиране на документи, език за маркиране Каква е ролята на езика за маркиране

Понякога може да чуете за „програмиране“ на уеб страница, но форматирането на текст в прозореца на браузъра всъщност не е програмиране. Както подсказват имената на форматиращите езици, те се отнасят до езици за маркиране. С други думи, те се състоят от различни символи, вмъкнати в тялото на документа, за да посочат как трябва да изглежда файлът, когато се отпечатва или показва, или да определят логическата му структура (например абзаци и списъци с надписи). Ако не използвате език за маркиране, показаните данни са суров текст, без форматиране на символи или абзаци.
Езиците за маркиране дефинират външния вид на документ с помощта на кодове, наречени дескриптори или тагове, които са под формата на: ... Първият дескриптор показва началната точка за форматиране, а вторият (с наклонена черта напред) показва края на кода. Ако пропуснете втория дескриптор, кодирането, посочено от първия дескриптор, се прилага в края на документа.

Забележка:
Езикът за маркиране може да се приложи към неструктуриран текст или ръчно, с текстов редактор (като Notepad), или с графичен инструмент, който добавя код, когато визуално подреждате текста по ваш вкус.
За начинаещите е по-лесно да работят с графични инструменти, които не са толкова точни като текстовите редактори.

Език за маркиране на хипертекст (HTML)

HTML (HyperText Markup Language) е основата на кодирането и основата на повечето уеб страници. HTML ви позволява да публикувате текст и графики, съдържание на електронни таблици и дори да създавате отчети от бази данни за интерактивно четене. Той е чудесен за организиране и форматиране на статична информация от всякакъв тип, тъй като ви позволява да:

● задайте размера и шрифта на текста;
● форматирайте текста с удебелен шрифт, курсив или подчертаване;
● задаване на връзки към други страници;
● вмъкване на изображения;
● създаване на заглавия на страници;
● създаване на таблици;
● вграждане на метаданните, необходими за работата на търсачките.

Забележка:
Метаданните се отнасят до скрити данни, които не се показват на уеб страница, но могат да бъдат открити чрез търсене на двигател, което ще ви позволи да стигнете до даден сайт.

Използват се три вида HTML дескриптори.

● За форматиране на текст или отделни знаци.
● За форматиране на абзаци или други големи текстови блокове.
● Невидими дескриптори, които предоставят друга функционалност, например метаданни, за извършване на търсения.

Основното предимство на HTML пред другите езици за маркиране е неговата огромна гъвкавост. Текущата версия на HTML се поддържа от почти всеки браузър (разбира се модерен и графичен). Това не винаги е вярно за динамични HTML (DHML), XML, Java и ActiveX. Ако искате вашите уеб сайтове да бъдат достъпни за всички видове браузъри, препоръчваме да използвате HTML.

Динамичен HTML (DHML)

Динамичен HTML (Dynamic HTML - DHML) е по-гъвкав от HTML.
Вместо да излагате статична уеб страница на обществеността, можете да използвате DHTML и да създадете уеб страница, която потребителят може да персонализира, без да нарушава външния вид на оригиналния документ. Например, страница, изобразена с DHTML, може да съдържа различни елементи, които потребителят може да премества из страницата, за да пренареди съдържанието си (по свой вкус). Когато обаче опресните (опресните) изображенията на страницата, промените изчезват и тя се връща в първоначалния си вид.
DHTML поддържа следните функции, които не са налични в HTML.

● Динамични стилове.
● Прецизно позициониране.
● Обвързване на данни.
● Динамично съдържание.

Не разбираш ли какво е това? Не се притеснявайте - по-долу са обяснения.

Прилагане на стилове към уеб документи. Динамичните стилове се основават на принципите на каскадни таблици със стилове (CSS), когато се прилагат към страницата като цяло, вместо ръчно форматиране на отделни части на страницата.
Ако сте работили със съвременни текстови процесори, може да сте запознати със таблици със стилове, които ви позволяват автоматично да форматирате текстови блокове по един или друг начин, в зависимост от стила, който им давате. Форматирането означава промяна на цвета на текста, шрифта, разположението, видимостта - като цяло почти всичко, което е свързано със свойствата на текста. CSS (и DHTML) прави същото, само че се отнася за изобразяване на уеб страници, а не текст.
Динамичните стилове, реализирани с DHTML, предоставят функции, които не се срещат в текстовите процесори. Например, когато създавате връзки, можете да маркирате текста, така че цветът му да се промени автоматично, когато задържите курсора на мишката върху него с показалеца на мишката или да се покаже, когато задържите курсора на мишката върху определена област на екрана.
Единственият недостатък на тези стилове е, че трябва да включите таблици със стилове в повечето документи. Това отнема много време, особено за онези, които нямат опит със таблици със стилове или конвертират документи.

Поставяне на текста на правилното място. Друго чудесно нещо при DHML е способността му да определи точното разположение на елемент на страница. Хоризонталните (x), вертикалните (y) и дори обемните (z) координати се използват за посочване на позицията на обект. (Позиционирането на обект в 3D координатна система позволява на обектите да се „припокриват“.) Прецизното позициониране позволява на текста да се позиционира около изображение, както и да се преместват обекти в прозореца на браузъра.

Забележка:
HTML без CSS не осигурява точно поставяне на обекти. В този случай разположението на елементите се определя от браузъра.

Вмъкване на данни в страницата. За да се осигури достъп на потребителите до някаква вътрешна информация (back-end информация), например съхранявана в база данни, нормалните HTML страници трябва да бъдат свързани към сървъра, на който се намират оригиналните данни, и е необходимо да поиска разрешение за манипулиране тези данни. DHTML ви позволява да свързвате данни към определена страница, позволявайки ви да работите с обвързани (или по-точно, обвързани) данни, без да нарушавате оригиналните данни и дори без да взаимодействате със сървъра, който ги съхранява. За целта в страницата се въвеждат източници на данни (те могат да бъдат сортирани и филтрирани по същия начин като съдържанието на всяка база данни). Това не само намалява натоварването на сървъра, но също така позволява на потребителите да преглеждат и манипулират данни, без да им дава достъп до самия източник на данните.

Създаване на динамично съдържание. Таблиците със стилове позволяват на уеб издателя лесно да променя външния вид на страница или набор от страници.
Динамичното съдържание позволява на уеб потребителя да променя външния вид на страницата чрез изпълнение на скрипт, за да:

● вмъкване или скриване на елементи на страницата;
● промяна на текста;
● промяна на структурата на текста;
● преместване на данни от вътрешни източници (back-end източници) и показване при поискване от потребителя.

За разлика от HTML, който ви позволява да променяте съдържанието на дадена страница само преди да бъде заредена в браузъра на потребителя, DHTML може да възприема промени по всяко време.
Динамичното съдържание предоставя възможност за осигуряване на високо ниво на интерактивност, когато се използва заедно със скриптове, които позволяват на потребителите да определят кои елементи да гледат.

Съвет:
В раздела „Организиране на срещи“ (по-горе) има уеб базирана карта на сградата, показваща местоположението на определен офис и портрет на служителя, който потребителят се опитва да намери. Тази карта е създадена с помощта на инструменти за маркиране на DHTML за създаване на динамично съдържание.

Разширяем език за маркиране (XML)

Разширимият език за маркиране (XML) не замества HTML (поне рядко на уеб страници), но го поддържа, позволявайки по-голяма гъвкавост в уеб страниците.
Идеята е, че когато форматирате страница с HTML, можете да промените външния вид на текста с дескриптори, които го форматират с удебелен шрифт, курсив, подчертаване, абзаци и т.н. Самите дескриптори обаче практически нямат нищо общо със съдържанието на текста, а само с неговото форматиране. XML има дескриптори, които определят външния вид на текста. Можете да ги използвате, за да укажете какъв е текстът (имена, адреси, имена на продукти и т.н.).
Защо е необходимо това? На първо място, тези метаданни позволяват на търсачките да намират предварително дефинирани елементи. Ако търсите в уебсайта на вашата корпорация (създаден с помощта на HTML) за думата „име“, като разглеждате всички имена, които тя съдържа, се връщат всички екземпляри на думата „име“, но не и самите имена. Ако обаче е използвано XML кодиране при създаването на възела, резултатът ще бъде всеки текст, който има дескриптора "име". Второ, предоставените от дескриптора части от текст могат да бъдат полезни, ако трябва да приложите носител (като цвят или език) само към части от уеб документ. Да предположим например, че интерактивен документ е кратка история на испански с превод на английски. След това, вместо да превключвате документа от испанска поддръжка на английска, можете да дефинирате тези части от историята с дескриптори и прилагайте правилата на испанския език само към тези части и оставете преводите на английски.
Като такъв, XML улеснява много разработването на уеб страница, особено ако някои части от нея трябва да бъдат създадени като изолирани елементи.

Мога ли да намаля тока, извлечен от батерията на компютъра?
Радиопредавателят преобразува електрическата енергия в радиосигнали, така че батерията в лаптоп с инсталиран безжичен адаптер ще се изтощи много по-бързо от ...

Взаимодействие на приложения с мрежи
В някои случаи приложенията се изпълняват по различен начин на мрежови компютри, отколкото на самостоятелни компютри. Някои приложения работят в мрежата по същия начин, както на самостоятелен компютър, докато други, напротив, изискват ...

Термини, започващи с буквата V
Виртуалните машини са виртуални машини. Софтуер, който симулира работата на физическо устройство. В Windows 98 се използва за "измама" на програма в ...

(Стандартен генерализиран език за маркиране), представен в стандарта ISO 8879. Този език е приет като основен език за техническа документация, включително интерактивни електронни технически ръководства за продукти, създадени в технологиите CALS.

SGML определя структурата на документите като последователност от обекти с данни. Обектите за данни, представляващи части от документ, могат да се съхраняват в различни файлове. Стандартът SGML установява такива набори от символи и правила за представяне на информация, които позволяват на различните системи правилно да разпознават и идентифицират тази информация. Посочените набори са описани в отделна част от документа, наречена Document Type Decfinition (DTD), която се предава заедно с основния SGML документ. DTD определя съответствието между символите и техните кодове, максималните дължини на използваните идентификатори, начина на представяне на разделителите за маркери, други възможни конвенции, DTD синтаксис и вида и версията на документа. Следователно SGML може да се нарече метаезик за семейство специфични езици за маркиране. По-специално, XML и HTML езиците за маркиране могат да се считат за подмножества на SGML.

Информационният лист SGML включва:

  • основен файл с техническо ръководство, маркиран с SGML тагове;
  • описание на обекти, ако документът принадлежи към група, в която се използват същите обекти и се предполага тяхната известност;
  • речник за обяснение на SGML тагове;

SGML обаче е трудно да се научи и използва. Следователно, за широкото използване на маркирането в документи, представени в WWW-технологии, през 1991 г., базиран на SGML, е разработен опростен HTML (HyperText Markup Language), а през 1996 г. XML (eXtensible Markup Language), който става, в комбинация с HTML е основният език за представяне на документи в различни приложения.

Езикът HTML е разработен с цел широко използване на маркирането в документи, представени в технологиите на WWW.

HTML описанието е ASCII текст и поредица от команди (контролни кодове), включени в него, наричани още дескриптори или тагове. Този текст се нарича HTML документ или HTML страница или когато е публикуван на уеб сървър, уеб страница. Етикетите се поставят на правилните места в изходния текст, те определят шрифтове, тире, външен вид на графики, връзки и т.н. Когато се използват WWW-редактори, вмъкването на команди се извършва чрез просто натискане на съответните клавиши.

XML, подобно на HTML, се счита за подмножество на SGML. Понастоящем XML твърди, че е основният език за представяне на документи в информационните технологии; може да се разглежда като метаезик, който служи като основа за създаване на частни езици за маркиране в различни приложения. В същото време XML е по-удобен от SGML, което се осигурява чрез премахване на някои незначителни функции на SGML в XML. XML описанията са по-лесни за четене, адаптирани за използване в съвременните браузъри, като същевременно запазват основните възможности на SGML.

За конкретни приложения има варианти на XML, наречени XML речници или XML приложения. Например, XML приложение OSD (Open Software Description) е разработено за описание на текстове със специфични математически символи. CALS се интересува от опцията за обмен на данни Product Definition eXchange (PDX). Известни речници за химия (CML - Chemical Markup Language), биология (BSML - Bioinformatic Sequence Markup Language) и др.

Издадохме нова книга „Съдържателен маркетинг в социалните медии: Как да вляза в главите на абонатите и да се влюбя във вашата марка“.

HTML е език за маркиране на хипертекст.

Езикът се използва за организиране на уеб страници. Нека направим аналогия. Купувате си вестник. Той съдържа няколко статии. Всяка статия има заглавие, има снимки. И текстът се пише в няколко колони. Това е структурата на страницата на вестника.

На сайта всичко се случва по същия начин. За да направите правилната структура на статията - съдържание - трябва да използвате език за маркиране на текст.

За какво е HTML

HTML се използва, за да каже на браузъра как да показва страницата на екрана.

Езикът е повсеместен. Това е универсален инструмент за стилизиране на съдържание на страница. Използването му е възможно във всеки браузър. Ако пишете код на език за програмиране, трябва да знаете някои особености, оператори, типове данни и т.н.

HTML се състои от набор от тагове - команди и атрибути - свойства. Те са лесни за запомняне и винаги могат да се намерят справочни материали.

Какво е HTML код

Кодът е команди към браузъра как да се покаже страницата. Има структура, която винаги трябва да се следва. Например на страницата има само едно заглавие H1, основната информация се поставя в раздел и т.н.

В езика има три инструмента.

Има два вида тагове - сдвоени и единични.

  • - сдвоен таг, отваряне и затваряне. Те действат върху текста, поставен между тях.
  • Единичен таг, той действа върху текста след него до следващия таг.

Структурата на HTML кода на страницата

Казахме, че структурата на всеки html документ винаги е една и съща. След това изброяваме необходимите елементи.

  1. !- показва, че в документа се използва HTML.
  2. ...- целият код на страницата е поставен в този етикет. Всичко, което не е поставено в него, не се разпознава от браузъра и не се показва.
  3. ...- сдвоен маркер, той съдържа техническа информация, например за кодирането на документа.
    1. ...е заглавието на страницата, тя се поставя в секцията за глава. Всяка страница трябва да има свое уникално заглавие.
    2. - това е сервизна информация. Той свързва отделни стилове към страницата - css и др. Не се показва на потребителя.
  4. ...- тялото на страницата. Цялата основна информация се съдържа в този етикет.
    1. ...- хипервръзки.
    2. - Изображения.
    3. ...- миниатюра.
    4. ...- курсив.

Вътре в тялото може да има неограничен брой елементи.

Например, така изглежда част от кода на страницата в една от публикациите ни в блога.

Колкото по-често използвате маркери, толкова по-бързо те се запомнят. Винаги можете да намерите справка с всички тагове, атрибути и техните стойности.

Всеки документ има три компонента:

· Структура;

Съдържанието е информацията, която се показва в документа. Съдържанието на документ на хартия може да бъде чисто текстово и да съдържа изображения. Ако документът е представен в електронен вид, той може да съдържа мултимедийни данни, както и връзки към други документи. Въпреки че съдържанието на различните документи е различно, те могат да бъдат класифицирани по вид, например книга или билет за влак.

Стилът на документа определя как се показва съдържанието му на конкретно устройство (например принтер или дисплей). Концепцията за стил включва характеристиките на шрифта (име, размер, цвят) на целия изходен документ или отделните му блокове, реда на разбиване на страници, подреждането на блоковете на страниците и други параметри. Един и същ документ може да бъде изведен в различни стилове както на различни носители, така и на един и същи носител.

Езиците за маркиране на документи са изкуствени езици, предназначени да опишат структурата на документ и връзките между различни структурни обекти. Данните за маркиране се наричат ​​още метаданни.

Първият език за маркиране е Генерализираният език за маркиране (GML), разработен от служители на IBM още през 60-те години на миналия век. Непосредственият му наследник беше Стандартният генерализиран език за маркиране (SGML), който определя правилата за писане на елементи за маркиране в документ. Документ, който отговаря на правилата на езика, се нарича SGML документ.

SGML е дефиниран в стандарта ISO 8879, който определя следните основни изисквания за език за маркиране на документи:

· Езикът трябва да се чете от човека.

· Маркираните файлове с документи трябва да бъдат текстови и кодирани с помощта на символи ASCII (Американски стандартен код за обмен на информация). Съдържанието на документа обаче не трябва да бъде кодирано в ASCII или текст.

SGML и подобни езици използват специални инструменти за маркиране на документи:

· Елементи и придружаващи атрибути;

Субекти;

· Коментари.

Структурната единица на SGML документ е елемент. В текста за маркиране всеки елемент трябва да бъде подчертан по определен начин. Акцентирането се извършва чрез вмъкване на начален таг (от английската дума tag - таг) в началото на елемента (начален таг) и краен таг (краен таг) в края на елемента. Началният и крайният етикет имат едно и също име. За да се разграничат етикетите от нормалния текст, те трябва да започват с начален таг и да завършват със знак за край на таг. Освен това в крайния таг е посочен знак - знакът на крайния таг. В SGML като такива тагове могат да се използват всякакви знаци, но най-често символът "<" (левая угловая скобка), в качестве признака окончания тега используется символ ">"(лява ъглова скоба) и" / "(наклонена черта) като краен етикет. Елементите в SGML документ могат да съдържат други елементи, което води до графично представяне на SGML документ като йерархична (дървовидна) структура.


Пример 4.3.1. Документ SGML, дефиниращ списък на студентите с резултатите от тяхната изпитна сесия, може да бъде посочен, както следва:

Списък на студентските оценки в сесията

Иванов Иван Иванович

TS-61

A

Б.

Б.

Б.

Петров Петър Петрович

TS-62

° С

° С

д

° С

В този документ първият елемент е елементът на студентския списък. Този елемент съдържа един заглавен елемент (заглавие) и няколко студентски елемента (данни за ученика). На свой ред всеки елемент на студент съдържа един елемент с пълно име (фамилно име, собствено име и бащино име на ученика), един елемент на номер на група (номер на група) и един елемент на списък с марки (списък на оценките на студента в сесията) . И накрая, елементът от списъка с марки съдържа няколко елемента за маркиране (маркиране).

Графично представяне на този списък на фиг. 1 има дървесна структура:

Фиг. 4.3.1. Начертана структура на документите SGML

Атрибутите могат да се използват за прецизиране на SGML елементи. Атрибутите се записват в началния таг на елемент, както следва:

attribute-name = "attribute-value".

Елементът може да има множество атрибути. Атрибутите са разделени един от друг и името на елемента с поне едно интервал.

Пример 4.3.2. За елементи на оценка в пример 4.3.1 можете да зададете атрибут предмет, чиято стойност е името на дисциплината, за която е положен изпитът. Тогава за първия ученик елементите ще приемат следната форма:

A

Б.

Б.

Б.

Езици като SGML използват обекти за работа с групи данни. Обект са всякакви именувани данни, както текстови, така и нетекстови. При преглед на документа името на обекта се заменя със стойността му. Така например, името на текстовия обект kpi ще бъде заменено със стойността му: Киевски политехнически институт, а нетекстовият обект image1 ще бъде заменен с изображение на име image1.

Терминът "маркиране" произлиза от традиционната практика за маркиране на ръкописи преди публикуване (т.е. добавяне на символни команди в полетата и между редовете в хартиен ръкопис).

В продължение на много векове това се правеше от издатели (редактори и коректори), които отбелязаха кой шрифт, стил и размер трябва да бъдат набрани фрагменти от текст и след това предадоха ръкописа на наборниците, които ръчно въведоха текста, като взеха предвид знаците за маркиране.

Маркиращ езике набор от специални инструкции, наречени тагове, които изпълняват следните функции:

      задаване на функции за обработка на избрани елементи;

      избор на логически елементи на този документ.

Задаване на функции за обработка на избрани елементи

В текстовите процесори има вградени команди за включване / изключване на шрифтове и други, подобни на командите за контрол на разположението на информацията на екрана или при печат. Този подход се нарича командаили процесуална надценка.

Примери за процедурна надценка

Избор на логически елементи на документа

Служи за формиране в документи на всякаква структура и дефиниция на връзките между различни елементи от тази структура, без да се посочва методът на обработка. Тази маркировка се нарича описателен.

Чрез промяна на набора от процедури, за да съответства на описателното маркиране, можете да промените външния вид на същия документ.

Описателна маркировка

Основното предимство на описателното маркиране е неговата гъвкавост, тъй като парчетата текст са маркирани като „какви са“ (а не „как трябва да се показват“).

В бъдеще може да се напише софтуер за обработка на тези фрагменти по начин, който дори не е бил предвиден от разработчиците на езици. Например, хипервръзките HTML, първоначално предназначени за потребители да навигират през набор от връзки в мрежата, по-късно започнаха да се използват от механизмите за търсене и индексиране в мрежата, за оценка на популярността на ресурсите и т.н.

Примери за маркиращи езици

Езиците за маркиране се използват навсякъде, където се изисква извеждане на богат текст:

    в печатница (SGML, TeX, PostScript, PDF),

    потребителски интерфейси на компютри (MicrosoftWord, OpenOffice, troff),

    World Wide Web (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

Структура на маркера на езика за маркиране

Развитието на описателни идеи за маркиране доведе до определянето на маркирането като официален език.

Езиковите маркери (контролни дескриптори) се кодират по определен начин (разпределени спрямо основното съдържание на документа) и служат като инструкции за програмата, която показва съдържанието на документа от страна на клиента.

Много съвременни езици са използвали символите за тези команди (езикови тагове)< и >, вътре в който са поставени имената на инструкциите и техните параметри (HTML и XML). В SGML можете да зададете други знаци, които да затворят маркера (например фигурни скоби). Освен това има различни системи от подмножества, които се използват, с по-малко функции, например в уеб форуми и дъски за съобщения се използва езикът за маркиране BBCode, чиито маркери са разграничени с квадратни скоби :.

Моделът на тагове описва документ като колекция от контейнери, всеки от които започва и завършва с тагове. В повечето случаи маркерите се използват по двойки. Двойката се състои от начален и краен етикет.

Отварящ синтаксис на маркера:<имя_тега [атрибуты]>

Името на затварящия маркер се различава от името на отварящия маркер само по това, че е предшествано от наклонена черта напред:

Атрибутите определят допълнителни характеристики на елемент. Атрибутите на етикетите се записват в следния формат: name [= "value"]. За някои атрибути може да не е посочена стойност. Крайният таг няма атрибути.

Всеки сдвоен маркер започва с начален маркер и завършва, когато се срещне съответстващ краен маркер.

Двойка отварящи и затварящи тагове се нарича контейнер, а частта от текста между тях се нарича елемент.

Заглавие от ниво 1

Заглавие от ниво 2

В зависимост от използвания език за маркиране, допълнително е възможно да се използват единичен таг и празен елемент. Името на маркера определя типа на елемента.

Синтаксис на единичен маркер:<имя_тега [атрибуты] />

В някои маркиращи езици имената на маркери са предварително дефинирани (HTML). Други не са строго регламентирани, т.е. потребителите могат да въвеждат и използват нови маркери (XML). Например етикетът „персона“ може да дефинира типа на този XML елемент, като фамилно име, собствено име и бащино име. Иванов Иван Иванович

В SGML елементите могат да се припокриват, т.е. в SGML е възможна следната последователност от маркери:

В XML елементите имат строга синтактична структура, тоест те са строго вложени и винаги затворени:

Също така в SGML, HTML те не трябва да са частни:

В почти всички езици за маркиране на документи стойността на атрибута се интерпретира като текст. Стойността на атрибута обикновено се затваря в кавички.

Забележка:

Документ, написан с помощта на език за маркиране, съдържа не само самия текст (като поредица от думи и пунктуационни знаци), но и допълнителна информация за различните му части - например указание на заглавия, акценти, списъци и т.н.

Тези. документът не е нищо повече от обикновен ASCII файл с добавени контролни кодове (тагове).