Belgilash tillarining rivojlanish tarixi. Hujjatlarni belgilash tillari - ularning asosiy maqsadi ma'lumotlarni belgilash tili nima

Belgilash tillari

Belgilash tili(matn) kompyuter terminologiyasida matnga kiritiladigan belgilar yoki ketma-ketliklar toʻplami, uning chiqishi yoki tuzilishi haqida maʼlumot beradi. U kompyuter tillari sinfiga kiradi. Belgilash tilidan foydalangan holda yozilgan matn hujjatida nafaqat matnning o'zi (so'zlar va tinish belgilari ketma-ketligi sifatida), balki Qo'shimcha ma'lumot uning turli bo'limlari haqida - masalan, sarlavhalar, diqqatga sazovor joylar, ro'yxatlar va boshqalar ko'rsatkichi. Yana ko'p qiyin holatlar Belgilash tili boshqa hujjatlardagi interaktiv elementlar va tarkibni hujjatga kiritish imkonini beradi.

Shuni ta'kidlash kerakki, belgilash tili Turing to'liq emas va odatda dasturlash tili deb hisoblanmaydi, garchi u qat'iy aytganda.

HTML (ingliz tilidan. Gipermatn belgilash tili-- "Gipermatnni belgilash tili") - ingliz olimi Tim Berners-Li tomonidan 1986-1991 yillarda Yevropa markazi devorlarida ishlab chiqilgan. yadroviy tadqiqotlar Jenevada (Shveytsariya). HTML ilmiy va texnik hujjatlarni almashish uchun til sifatida yaratilgan bo'lib, uni joylashtirish sohasida mutaxassis bo'lmagan odamlar foydalanishi mumkin. HTML deskriptorlar deb ataladigan kichik strukturaviy va semantik elementlar to'plamini belgilash orqali SGML ning murakkabligini muvaffaqiyatli hal qildi. Deskriptorlar ko'pincha "teglar" deb ham ataladi. HTML yordamida nisbatan sodda, ammo chiroyli tarzda yaratilgan hujjatni osongina yaratishingiz mumkin. Hujjat strukturasini soddalashtirishdan tashqari, HTML ga gipermatnni qo‘llab-quvvatlash qo‘shildi. Multimedia funksiyalari keyinroq qo'shildi.

Dastlab, HTML tili hujjatlarni qayta ishlab chiqarish (ko'rsatish) vositalariga bog'lanmagan holda tizimlashtirish va formatlash vositasi sifatida yaratilgan va yaratilgan. Ideal holda, HTML belgisi bilan matn turli xil texnik jihozlar (zamonaviy kompyuterning rangli ekrani, organayzerning monoxrom ekrani, mobil telefon yoki qurilmaning cheklangan o'lchamli ekrani va ovozni qayta tiklash dasturlari) bo'lgan uskunalarda stilistik va strukturaviy buzilishlarsiz takrorlanishi kerak. matnlar). Biroq, HTMLning zamonaviy qo'llanilishi asl maqsadidan juda uzoqdir. Masalan, teg

, sahifani formatlash uchun bir necha marta ishlatiladi, hujjatlarda eng keng tarqalgan jadvallarni yaratish uchun mo'ljallangan. Vaqt o'tishi bilan platformaning HTML mustaqilligi haqidagi asosiy g'oyasi multimedia va grafik dizayn uchun zamonaviy ehtiyojlar foydasiga qurbon bo'ldi.

XML(inglizcha) eX cho'ziluvchanM arkupL burchak-- kengaytiriladigan belgilash tili; talaffuz qilingan [ ex-em-eml]) World Wide Web Consortium (W3C) tomonidan tavsiya etilgan belgilash tilidir. XML spetsifikatsiyasi XML hujjatlarini tavsiflaydi va XML protsessorlarining xatti-harakatlarini qisman tavsiflaydi (XML hujjatlarini o'qiydigan va ularning mazmuniga kirishni ta'minlaydigan dasturlar). XML oddiy, rasmiy sintaksisga ega bo'lgan til bo'lib ishlab chiqilgan bo'lib, u dasturlarga hujjatlarni yaratish va qayta ishlashni osonlashtiradi, shu bilan birga odamlar uchun hujjatlarni o'qish va yaratish uchun qulay bo'lib, veb-foydalanishga urg'u beradi. Til kengaytiriladigan deb ataladi, chunki u hujjatlarda qo'llaniladigan belgilarni tuzatmaydi: ishlab chiquvchi faqat tilning sintaksisi qoidalari bilan cheklanib, ma'lum bir sohaning ehtiyojlariga ko'ra belgilashni yaratishi mumkin. Hujjatlar mazmunini ifodalash uchun oddiy rasmiy sintaksis, insonga qulaylik, kengaytiriluvchanlik va Unicode kodlashlariga tayanish kombinatsiyasi XML ning o'zidan ham, ko'plab hosilalardan ham keng foydalanishga olib keldi. maxsus tillar turli xil dasturiy vositalarda XML asosida.

XHTML(inglizcha) Ex cho'ziluvchanH ypert extM arkupL burchak-- kengaytiriladigan gipermatn belgilash tili) -- HTML 4 imkoniyatlarini takrorlaydigan va kengaytiruvchi XML-ga asoslangan veb-sahifani belgilash tillari oilasi. XHTML 1.0 va XHTML 1.1 spetsifikatsiyalari World Wide Web Consortium tavsiyalaridir, ammo, bu daqiqa HTML dan foydalanish tavsiyasi bilan uning rivojlanishi to'xtatildi. XHTML ning yangi versiyalari chiqarilmaydi.

XHTML va HTML o'rtasidagi asosiy farq hujjatga ishlov berishdir. XHTML hujjatlari XML hujjatlariga o'xshab, ularning moduli (parser) tomonidan qayta ishlanadi. Ushbu qayta ishlash jarayonida ishlab chiquvchilar tomonidan yo'l qo'yilgan xatolar tuzatilmaydi.

XHTML SGML spetsifikatsiyasiga mos keladi, chunki XML uning quyi to'plamidir. HTML qayta ishlash jarayonida ko'plab xususiyatlarga ega va aslida HTML 5 spetsifikatsiyasi loyihasida mustahkamlangan SGML oilasiga tegishli bo'lishni to'xtatdi.

Brauzer hujjatni qayta ishlash uchun serverdan olingan kontent turi sarlavhasi asosida tahlil qiluvchini tanlaydi:

HTML - matn/html

XHTML - ilova/xhtml+xml

· Mijozda mahalliy ko'rish uchun tanlov fayl kengaytmasiga asoslanadi.

· Internet Explorer 8-versiyasigacha XHTML hujjatlarini qayta ishlash uchun parser mavjud emas.

WML(inglizcha) Simsiz belgilash tili-- "simsiz belgilash tili") -- WAP standartiga muvofiq mobil telefonlar va boshqa mobil qurilmalarda foydalanish uchun hujjatlarni belgilash tili.

Tuzilishi biroz soddalashtirilgan HTML-ga o'xshaydi, ammo asosiy farqlar mavjud, chunki WML shaxsiy kompyuterlarning imkoniyatlariga ega bo'lmagan qurilmalarga qaratilgan (kichik ekran, hamma qurilmalar grafiklarni ko'rsata olmaydi, kichik xotira hajmi va boshqalar): barcha ma'lumotlar WML "pastki" deb ataladigan narsada mavjud (ing. pastki). Dekabr - server tomonidan uzatilishi mumkin bo'lgan eng kichik ma'lumotlar birligi. To'plamlarda "kartalar" mavjud ( karta) (har bir xarita teglar bilan cheklangan va). Bitta palubada har doim kamida bitta karta bo'lishi kerak, lekin bir nechta bo'lishi mumkin. Shu bilan birga, qurilma ekranida bir vaqtning o'zida faqat bitta karta ko'rsatiladi va foydalanuvchi havolalarni bosish orqali ular o'rtasida almashishi mumkin - bu serverga ma'lumot so'rovlari sonini kamaytirish uchun amalga oshiriladi; shu bilan birga, WML sahifalarining hajmi 1-4 kilobaytdan oshmasligi kerak.

VML(inglizcha) Vektor belgilash tili-- vektor belgilash tili) vektor grafikasini tasvirlash uchun Microsoft tomonidan ishlab chiqilgan. VML W3C ga 1998 yilda Microsoft, Macromedia va boshqalar tomonidan taqdim etilgan.Taxminan bir vaqtning o'zida Adobe, Sun va boshqa bir qancha kompaniyalar ko'rib chiqish uchun PGML hujjatlarini taqdim etishgan. Keyinchalik bu ikkala til ham SVG uchun asos bo'ldi.

PGML (Precision Graphics Markup Language, rus tiliga erkin tarjima qilingan - "aniq grafik belgilash tili") - XML ​​formatidagi matn ko'rinishidagi veb-sahifadagi vektor grafiklarini (diagrammalar, individual interfeys elementlari) tasvirlash uchun ishlatiladigan XML-ga asoslangan belgilash tili, tasvirni qurish modelidan foydalanadi. , PDF va PostScript ga o'xshash. U 1998 yilda Adobe Systems, IBM, Netscape Communications va Sun Microsystems kompaniyalari tomonidan W3C konsorsiumiga taqdim etilgan, biroq tavsiya qilinganidek qabul qilinmagan. Deyarli bir vaqtning o'zida Microsoft o'zining VML loyihasini ko'rib chiqish uchun taqdim etdi, bir yil o'tgach, ikkita texnologiya g'oyasi asosida yanada rivojlangan SVG tili ishlab chiqildi. SVG W3C tavsiyasini oldi va veb-sahifadagi vektor grafikasini tavsiflash uchun asosiy formatga aylandi.

SVG(ingliz tilidan. S hisoblash mumkinV ektorG rafika-- masshtabli vektor grafikasi) -- World Wide Web Consortium (W3C) tomonidan yaratilgan va XML kengaytiriladigan belgilash tilining quyi to'plamiga kiritilgan kengaytiriladigan vektorli grafik belgilash tili ikki o'lchovli vektor va aralash vektor/bitmapni tasvirlash uchun mo'ljallangan. XML formatidagi grafikalar. Harakatsiz va jonlantirilgan interfaol grafiklarni yoki boshqacha aytganda, deklarativ va skriptlarni qo'llab-quvvatlaydi. Uch o'lchamli ob'ektlarning tavsifini qo'llab-quvvatlamaydi. Bu HTML va XHTML kabi standartlar ortida turgan W3C tashkiloti tomonidan tavsiya etilgan ochiq standartdir. SVG VML va PGML belgilash tillariga asoslangan. 1999 yildan beri ishlab chiqilgan.

XBRL(inglizcha) eX cho'ziluvchanB biznesR eport qilishL burchak, yoqilgan. Extensible Business Reporting Language elektron moliyaviy hisobot uchun ochiq standartdir. XBRL formati kengaytiriladigan belgilash tili XML ga asoslangan. XBRL XML sintaksisidan, shuningdek, XML nom maydoni, XML sxemasi, XLink va XPath kabi XML bilan bog'liq texnologiyalardan foydalanadi. XBRL-ning maqsadlaridan biri bu vakillik qilish va almashishdir moliyaviy ma'lumotlar kompaniyalarning moliyaviy hisobotlari kabi. XBRL tili spetsifikatsiyasi mustaqil xalqaro tashkilot XBRL International, Inc. tomonidan ishlab chiqilgan va nashr etilgan.

Internetni vizual idrok etishni yaxshilash uchun CSS texnologiyasi keng qo'llanila boshlandi, bu sizga ko'plab veb-sahifalar uchun yagona dizayn uslublarini o'rnatish imkonini beradi. Yana bir e'tiborga loyiq yangilik - URN manbalarini nomlash tizimi. Yagona manba nomi).

World Wide Web uchun mashhur rivojlanish kontseptsiyasi Semantik Internetni yaratishdir. Semantic Web - mavjud World Wide Web qo'shimchasi bo'lib, u tarmoqda joylashtirilgan ma'lumotlarni kompyuterlar uchun yanada tushunarli qilish uchun mo'ljallangan. Semantik Internet - bu tarmoq tushunchasi bo'lib, unda inson tilidagi har bir resurs kompyuter tushunadigan tavsif bilan ta'minlangan. Semantik veb platformadan qat'i nazar va dasturlash tillaridan qat'i nazar, har qanday dastur uchun aniq tuzilgan ma'lumotlarga kirishni ta'minlaydi. Dasturlar zarur resurslarni o'zlari topishlari, ma'lumotlarni qayta ishlashlari, ma'lumotlarni tasniflashlari, mantiqiy munosabatlarni aniqlashlari, xulosalar chiqarishlari va hatto bu xulosalar asosida qarorlar qabul qilishlari mumkin bo'ladi. Agar keng miqyosda qabul qilinsa va yaxshi amalga oshirilsa, Semantik Internet Internetda inqilob qilish imkoniyatiga ega. Resursning kompyuterga mos tavsifini yaratish uchun Semantic Web RDF formatidan foydalanadi (Eng. Resurs tavsifi asosi), bu XML sintaksisiga asoslangan va resurslarni aniqlash uchun URI'lardan foydalanadi. Bu sohada yangilik RDFS (ing. RDF sxemasi) va SPARQL (ing. Protokol va RDF so'rovlar tili) RDF ma'lumotlariga tezkor kirish uchun yangi so'rovlar tili.

belgilash tillari) - bu hujjatlarda strukturani shakllantirish va ushbu tuzilmaning turli elementlari o'rtasidagi munosabatlarni aniqlash uchun mo'ljallangan teglar deb ataladigan maxsus ko'rsatmalar to'plami. Boshqacha aytganda, belgilash hujjatning qaysi qismi sarlavha, qaysi kichik sarlavha ekanligini, muallifning nomini nima deb hisoblash kerakligini va hokazolarni ko'rsatadi. Belgilash uslubiy belgilash, tarkibiy belgi va semantik belgilarga bo'linadi.

Stilistik belgilash

Stilistik belgilar hujjatning ko'rinishi uchun javobgardir. Misol uchun, HTMLda bu turdagi belgilashlar kabi teglarni o'z ichiga oladi (kursiv), (qalin), (tagini chizish) (chizilgan matn) va boshqalar.

Strukturaviy belgi

Strukturaviy belgi hujjatning tuzilishini belgilaydi. HTMLda ushbu turdagi belgilash uchun, masalan, teglar (paragraf), (sarlavha),

(bo'lim) va boshqalar.

Semantik belgilash

Semantik belgilash ma'lumotlarning mazmuni haqida ma'lumot beradi. Teglar bu turdagi belgilarga misol bo'la oladi. (hujjat nomi), (kod, kodlar ro'yxati uchun ishlatiladi), (o'zgaruvchan),

(muallifning manzili).

Har qanday belgilash tilining asosiy tushunchalari teglar, elementlar va atributlardir.

Teglar va elementlar.

Teglar va elementlarning ma'nolari ko'pincha chalkashib ketadi.

Teglar yoki boshqaruv teglari, ular ham deyiladi, teg mazmuni bilan ishlash uchun mijoz tomonidan ko'rsatuvchi dastur uchun ko'rsatmalar bo'lib xizmat qiladi. Hujjatning asosiy mazmuniga nisbatan tegni ajratib ko'rsatish uchun burchakli qavslar qo'llaniladi: teg kichikroq belgisi bilan boshlanadi (<) и завершается знаком "больше" (>), uning ichida ko'rsatmalar nomi va ularning parametrlari joylashtirilgan. Masalan, HTMLda teg quyidagi matn kursiv bilan yozilishi kerakligini bildiradi.

Element - bu teglar, ularning mazmuni. Quyidagi konstruktsiya elementga misoldir:

Ushbu matn kursiv bilan yozilgan .

Element ochilish tegidan iborat (bizning misolimizda bu teg ), tegning mazmuni (misolda "Bu kursivdagi matn" matni) va yopish tegi(), ba'zan HTML-da, yopilish tegini o'tkazib yuborish mumkin.

Atributlar

Atributlar elementni belgilashda ushbu elementning xususiyatlarini ko'rsatadigan har qanday parametrlarni belgilash uchun ishlatiladi.

Atributlar "nom" = "qiymat" juftligidan iborat bo'lib, ular boshlang'ich tegdagi elementni belgilashda belgilanishi mumkin. Tenglik belgisining chap va o'ng tomonida bo'sh joy qoldirishingiz mumkin. Atribut qiymati bitta yoki ikkita tirnoq ichiga olingan qator sifatida ko'rsatilgan.

Har qanday teg, agar bu atribut aniqlangan bo'lsa, atributga ega bo'lishi mumkin.

Atribut ishlatilganda element quyidagi shaklni oladi:

<имя_тега атрибут = "значение"> kontentni belgilang

Matn markazga tekislangan

Bitta ochilish tegi bir nechta atributlarni o'z ichiga olishi mumkin, masalan:

Matn o'lchami va rangi ko'rsatilgan

Belgilash tillarining rivojlanish tarixi.

Gipermatn tushunchasi 1945-yilda V.Bush tomonidan kiritilgan boʻlib, 60-yillardan boshlab gipermatnli maʼlumotlardan foydalanadigan birinchi ilovalar paydo boʻla boshladi. Biroq, asosiy rivojlanish bu texnologiya chiziqli bo'lmagan matnni yaratish, ko'rish qobiliyatini ta'minlaydigan turli xil axborot resurslarini birlashtirish mexanizmiga haqiqiy ehtiyoj mavjud bo'lganda olingan.

1986 yilda ISO standartlashtirilgan umumlashtirilgan belgilash tilini tasdiqladi. Ushbu til boshqa belgilash tillarini yaratish uchun mo'ljallangan, u ruxsat etilgan teglar to'plamini, ularning atributlarini va ichki tuzilishi hujjat. Shunday qilib, hujjat mazmuni bilan bog'liq o'zingizning teglaringizni yaratishingiz mumkin. Hujjat turini aniqlashda (DTD) saqlanadigan belgilash tili ta'rifisiz bunday hujjatlarni talqin qilish qiyinligi endi ayon bo'lmoqda. DTD barcha til qoidalarini SGML standartida guruhlagan. Boshqacha qilib aytganda, DTD teglar va ularni qo'llash qoidalari o'rtasidagi munosabatlarni tavsiflaydi. Bundan tashqari, hujjatlarning har bir sinfi uchun tegishli belgilash tilining grammatikasini tavsiflovchi o'ziga xos qoidalar to'plami aniqlanadi. Shunday qilib, faqat DTD yordamida teglarning to'g'ri ishlatilishini tekshirish mumkin va shuning uchun uni SGML hujjati bilan birga yuborish yoki hujjatga kiritish kerak.

O'sha paytda, SGML-dan tashqari, bir-biri bilan raqobatlashadigan boshqa shunga o'xshash tillar ham mavjud edi, ammo mashhurlik (HTML, uning avlodlaridan biri) SGML-ga o'z hamkasblariga nisbatan shubhasiz ustunlik berdi.

SGML-dan foydalanib, siz tuzilgan ma'lumotlarni tavsiflashingiz, hujjatlardagi ma'lumotlarni tartibga solishingiz va ushbu ma'lumotlarni qandaydir standartlashtirilgan formatda taqdim etishingiz mumkin. Ammo uning murakkabligi tufayli SGML asosan boshqa tillarning sintaksisini tavsiflash uchun ishlatilgan va bir nechta ilovalar to'g'ridan-to'g'ri SGML hujjatlari bilan ishlagan. SGML odatda faqat yirik loyihalarda, masalan, yirik kompaniya uchun yagona hujjat boshqaruv tizimini yaratishda qo'llaniladi.

HTML belgilash tili SGML ga qaraganda ancha sodda va qulayroq, uning ko'rsatmalari birinchi navbatda hujjat mazmunini ekranda ko'rsatish jarayonini boshqarish uchun mo'ljallangan. HTML texnik hujjatlarni belgilash usuli sifatida 1991 yilda Tim Berners-Li tomonidan ilmiy hamjamiyat uchun maxsus yaratilgan. Dastlab, bu SGML ilovalaridan biri edi.

HTML qila oladigan yagona narsa hujjat qismlarini tasniflash va uning brauzerda to'g'ri ko'rsatilishini ta'minlash bo'lishiga qaramay, bu eng mashhur belgilash tilidir. Buning sababi, HTMLni o'rganish juda oson. Buning uchun HTML buyruqlarini o‘rganish kifoya. HTML uchun DTD brauzerda saqlanadi. Bundan tashqari, HTML turli platformalarda ishlashga mo'ljallanganligini ham ta'kidlash lozim. Ammo u bir qator muhim cheklovlarga ega:

  1. HTMLda belgilangan teglar to'plami mavjud va bu to'plamni kengaytirish yoki o'zgartirish mumkin emas;
  2. HTML tili teglari faqat ma'lumotlar qanday taqdim etilishi kerakligini, ya'ni hujjatning ko'rinishini ko'rsatadi. HTML teglar tarkibidagi tarkibning ma'nosi, hujjatning tuzilishi haqida ma'lumot bermaydi.

Har qanday hujjat uchta komponentdan iborat:

  • mazmuni;
  • tuzilishi;
  • uslub.

Odatda hujjatning mazmuni o'zboshimchalik bilan taqdim etilmaydi, lekin ma'lum bir narsaga ega tuzilishi . Struktura - bu hujjatning qismlari (bloklari) tarkibi va ketma-ketligi.

Uslub Hujjat uning mazmuni ma'lum bir qurilmaga (masalan, printer yoki displeyga) chiqariladigan shaklni belgilaydi. Uslub tushunchasi butun chiqish hujjati yoki uning alohida bloklari shrifti (nomi, hajmi, rangi) xususiyatlarini, sahifalash tartibini, sahifalardagi bloklarning joylashishini va boshqa parametrlarni o'z ichiga oladi.

Hujjatlarni belgilash tillariHujjat tuzilishini va strukturaning turli ob'ektlari o'rtasidagi munosabatlarni tasvirlash uchun mo'ljallangan sun'iy tillar. Belgilash ma'lumotlari ham deyiladi metadata.

Birinchi belgilash tili GML tili .Uning bevosita vorisi edi SGML tili - hujjatni belgilash elementlarini yozish qoidalarini belgilaydigan standart umumlashtirilgan belgilash tili.

Hujjatni belgilash tiliga qo'yiladigan talablar:

  1. Til inson o'qiy oladigan bo'lishi kerak.
  2. Belgilangan hujjat fayllari matnli bo'lishi va kod belgilaridan foydalangan holda kodlangan bo'lishi kerak ASCII
  3. Til ichki manbalarga (bir xil hujjatda) va tashqi manbalarga (boshqa hujjatlarda) havolalardan foydalanishi mumkin.

SGMLda va shunga o'xshash tillar maxsus hujjatlarni belgilash vositalaridan foydalanadi:

  • hujjat tuzilishi;
  • tavsiflovchilar yoki elementlar va ular bilan bog'liq atributlar;
  • sub'ektlar (sub'ektlar);
  • Izohlar.

SGML hujjatlari daraxt tuzilishiga ega.

SGMLdagi deskriptorlar har birining boshida (ochuvchi tavsiflovchi) va oxirida (yopilish deskriptori) joylashtiriladi element (element).

Atributlar oddiy ramziy konstruktsiyalar ( buyumlar ) elementlarga qo'shiladi, bu ularga tavsiflovchi harakatini yaxshilash imkonini beradi.

Umumiy belgilash tillari kabi SGML , 15 tagacha turli xil qiymatlar bilan bog'lanishi mumkin bo'lgan atributlardan foydalanishga ruxsat bering, shu jumladan:

  • Hujjatdan tashqari, odatda sub'ektlar deb ataladigan har qanday manbalarga havolalar ( ob'ektlar).
  • Noyob identifikator ( ID ) hujjatdagi element.
  • Identifikator ko'rsatkichlari ( ID ko'rsatkichlari ) ega bo'lgan elementlar uchun o'zaro mos yozuvlar mavjud ID hujjatda qayd etilgan.
  • Element tarkibidagi teglarni belgilaydigan element teglari yoki atributlari.
  • Belgilar maʼlumotlari ( belgilar ma'lumotlari ) yoki CDATA , atribut qiymatlari sifatida ishlatib bo'lmaydigan har qanday yaroqli belgilar.

Izohlar hujjatni qayta ishlashdan keyin ko'rinmaydigan ma'lumotlarni qo'shish imkonini beradi. Sharhlar hujjatlarni qayta ishlash tezligiga ta'sir qilmaydi, kontentning bir qismi sifatida ko'rib chiqilmaydi yoki qayta ishlanmaydi SGML -hujjat. Ular oddiygina manba matniga kiritilgan.

Hujjatning ma'lum turdagi belgilarga muvofiqligini tekshirish uchun maxsus dasturlar qo'llaniladi - analizatorlar (tahlil qiluvchilar). Tahlil qiluvchilar mustaqil dasturlar yoki SGML hujjatlarini qayta ishlash dasturining bir qismidir. Tahlil qiluvchi hujjatni tekshirishni amalga oshirishi uchun maxsus hujjat yaratiladihujjat turini aniqlash

HTML tili til ilovasi hisoblanadi SGML foydalanish uchun Internet qat'iy tuzilmaga ega, qat'iy elementlar to'plami (deskriptorlar) va ularning atributlari, shuningdek, qat'iy ob'ektlar to'plami. kengaytirilgan belgilash tili XML (kengaytiriladigan belgilash tili). XML tili tilning kichik to‘plamidir SGML , unga to'liq mos keladi.

XML tili mavjud bo'lmagan keng imkoniyatlarni taqdim etadi HTML

4 . 3 .2. HTML versiyalari va kengaytmalari va XML

Birinchi versiya gipermatnni belgilash tili- HTML (HyperText Markup Language), veb-texnologiyaning o'zi kabi, Tim Berners Li tomonidan 1991 yilda ishlab chiqilgan. HTMLnom berilgan hujjat turi uchun SGML tili qoidalarini amalga oshirishdir hujjatlar HTML. Til qat'iy tuzilmani, belgilangan teglar to'plamini va ularning atributlarini va qat'iy ob'ektlar to'plamini belgilaydi. HTML hujjatlarini qayta ishlash dasturlari Web deb ataladi-brauzerlar . Hujjatlarni qayta ishlash natijasi Web-sahifa displey ekranida aks etadi.

1994 yilda Internetni qo'llab-quvvatlash guruhi - IETF ( Internet muhandisligi ishchi guruhi) HTML 2.0 spetsifikatsiyasini ishlab chiqdi, bu esa HTML tilini Internetda keng qo'llashni boshladi Internet . Xuddi shu yili W3C (World Wide Web Corporation) konsorsiumi tuzildi, u 165 ta tijorat va akademik tashkilotlar, ishlab chiquvchilar va foydalanuvchilarni birlashtirdi (uning tashkil etilganidan to hozirgi kungacha ushbu tashkilotga T. B. Li rahbarlik qiladi). oxirgi versiya HTML spetsifikatsiyasi - HTML 4.01 konsorsium tomonidan 1999 yil dekabr oyida qabul qilingan.

  • XML tili HTMLda uchramaydigan keng imkoniyatlarni taqdim etadi.

XML tili spetsifikatsiyasining oxirgi versiyasi XML 1.1 2004 yil aprel oyida qabul qilingan.

XML tiliga asoslanib, W3C tilning keyingi rivojlanishini ishlab chiqdi HTML - XHTML tili (kengaytirilgan HTML - kengaytirilgan HTML). Ushbu tilning birinchi versiyasi XHTML 1.0 2000-yil yanvar oyida qabul qilingan. Bu versiya aslida HTML 4 ning XML 1.0 ilovasi sifatida qayta tuzilgani. Taxminlarga ko'ra, HTML tilini yanada rivojlantirish XHTML spetsifikatsiyalariga muvofiq amalga oshiriladi.

XHTML ning yangi versiyasi XHTML 1.1 W3C tomonidan 2001 yil may oyida qabul qilingan. Ushbu tavsiya yangi hujjat turini, modulga asoslangan XHTML ni belgilaydi. Har bir XHTML 1.1 moduli bir yoki bir nechta HTML tili elementi va/yoki atributlarini o‘z ichiga oladi.

Spetsifikatsiyaga ko'ra, hujjatlar XHTML 1.1 modullar quyidagi guruhlardan iborat XHTML:

Asosiy modullar XHTML spetsifikatsiyasiga mos keladigan har qanday turdagi hujjatlarda talab qilinadigan modullardir (bu guruh modullarni o'z ichiga oladi. Struktura, matn, gipermatn va ro'yxat).

Applet moduli , bitta elementni o'z ichiga oladi< applet > (bu element eskirgan va uning o'rniga elementdan foydalanish tavsiya etiladi< object > ).

Har xil qo'shimcha matn belgilash modullarini belgilaydigan matn kengaytirish modullari (bu guruh modullarni o'z ichiga oladi Taqdimot, tahrirlash va ikki tomonlama matn).

Shakl modullari (bu guruh modullarni o'z ichiga oladi Asosiy shakllar va shakllar).

Jadval modullari (bu guruh modullarni o'z ichiga oladi Asosiy jadvallar va jadvallar).

Rasm moduli Tasvirni joylashtirishning asosiy imkoniyatlarini ta'minlaydigan A (bu modul mijoz tomonidagi tasvir xaritalari tomonidan ba'zi ilovalarda mustaqil ravishda ham qo'llanilishi mumkin).

Mijoz tomonidagi Image Map moduli , bu mijoz tomonidagi tasvir xaritalari uchun elementlarni taqdim etadi (bu modul modulni kiritishni talab qiladi Rasm).

Ob'ekt moduli Umumiy maqsadli ob'ektlarni qo'shish uchun yordam beradi.

Ramkalar moduli Kadrlar bilan bog'liq elementlarni ta'minlovchi A.

URL (hujjatning nisbiy URL manzillari ushbu element yordamida hisoblanadi).

Ismni aniqlash moduli , HTML hujjatlaridagi muayyan elementlarni aniqlash uchun ishlatiladi.

Eski modul HTML va XHTML ning oldingi versiyalarida tavsiya etilmaydigan va endi tavsiya etilmaydigan elementlar va atributlarni belgilaydi.

to'rtta. 3.3. HTML va XHTML tuzilmalarining turlari

Spetsifikatsiyaga muvofiq HTML Hujjatlar uchun 4.01 HTML uchta tuzilmani belgilaydi , uchta DTD tomonidan tasvirlangan. Dasturchilar veb -sahifalar o'z hujjatlarida uchta turdagi deklaratsiyalardan birini o'z ichiga olishi kerak. DTDlar orasidagi farq ular qo'llab-quvvatlaydigan elementlarda yotadi. E'lon DTD hujjatning eng boshida joylashtirilishi kerak.

HTML 4.01 qat'iy DTD (qat'iy ta'rif) bekor qilinmagan barcha elementlar va atributlarni o'z ichiga oladi ( eskirgan ) va ramkali hujjatlarda ishlatilmaydi.

HTML 4.0 o'tish davri DTD ta'rifi (o'tish davri ta'rifi) qat'iy kiritilgan barcha elementlarni o'z ichiga oladi DTD , shuningdek, tanlanmagan elementlar va atributlar.

HTML 4.0 Frameset DTD ta'rifi (ramkalar uchun ta'rif) o'tish davri DTD elementlaridan tashqari, ramkalarni o'z ichiga oladi.

Hujjatning birinchi qatori HTML , spetsifikatsiyaga muvofiq belgilangan XHTML

Bu satr foydalanish uchun versiyani belgilaydi XML va hujjatning belgilarni kodlash. Belgilarni kodlashda XML ikki baytli kod ishlatiladi Unicode . Parametr qiymatlari sifatida kodlash eng ko'p ishlatiladigan kodlashlar UTF-8 , unda birinchi 128 ta belgining qiymatlari bir baytli kodlashda, eng keng tarqalgan tillarning belgilari (rus va ukrain tillarini o'z ichiga olgan holda) ikki bayt bilan, qolgan belgilar esa uchta bayt bilan ifodalanadi. bayt. Kodlangan UTF-16 barcha belgilar ikki bayt bilan ifodalanadi (bu kodlash rus va ukrain hujjatlari uchun tavsiya etiladi HTML).

HTML belgilash tili

Bugungi kunga kelib Web-sahifalar yaratishning ko'plab texnologiyalari mavjud bo'lib, ularsiz Web-master qila olmaydi. Lekin Web-hujjatlarni ishlab chiqish uchun asos, albatta, HTML gipermatnni belgilash tilidir.

HTML birinchi navbatda belgilash tili bo'lib, unda yozilgan kod mijozning kompyuterida veb-brauzer ilovasida bajariladi. Bu uning nisbatan soddaligi va rivojlanish qulayligi bilan bog'liq.

Nima uchun sizga belgilash tili kerak?

Matn protsessor dasturida oddiy hujjat yaratganingizda, hujjatni osongina formatlashingiz mumkin, masalan, belgilarni kursiv yoki qalin qilib belgilash, paragrafga sarlavha yoki oddiy matn uslubini berish va hokazo. Monitor ekranidagi hujjat bilan nima qilsangiz, printerda chop etilganda xuddi shu shaklda qog'ozga o'tkaziladi.

Ochiladigan menyulardan opsiyani tanlaysizmi yoki asosiy buyruqni berasizmi, darhol ekranda harakatlaringiz natijasini ko'rasiz. Biroq, hujjatni ekranda yoki qog'ozda ko'rsatishni amalga oshiradigan maxsus buyruqlar sizdan yashirin bo'ladi.

Web-sahifalarda foydalanuvchi qog'oz bilan emas, balki Internet orqali olingan elektron hujjatlar bilan shug'ullanadi. Hujjatni asosiy dasturning formatlash vositalari bilan ko'rsatish printsipi bu erda qabul qilinishi mumkin emas. Ko'pgina mumkin bo'lgan hujjat formatlari bilan samarali ishlash uchun foydalanuvchi kompyuterida juda ko'p ilovalar yoki barcha turdagi konvertorlarga ega bo'lishi kerak edi.

Turli xil kompyuterlar va ilovalar o'rtasida Internet orqali hujjatlar almashish muammosini hal qilish g'oyasi HyperText Markup Language (HTML) ga asoslangan. Ushbu til 15 yildan ko'proq vaqt oldin hujjat formati standarti sifatida yaratilgan va Internet foydalanuvchilarining katta qismi, eng muhimi, barcha ishlab chiqaruvchilar tomonidan qabul qilingan. dasturiy ta'minot va Internet uchun uskunalar. HTML bo'yicha belgilangan hujjatlarni bunday hujjatlar uchun faqat bitta ko'ruvchiga ega bo'lgan har qanday kompyuterda o'qish mumkin - brauzer.

HTML belgilash tili tufayli veb-mijoz o'z kompyuteri ekranida hujjatni ishlab chiquvchi mo'ljallangan shaklda ko'rishi mumkin: ma'lum shrift o'lchamlari va paragraflar tanaffuslari, rasmlarning ma'lum tartibi, giperhavolalar va boshqalar bilan. .

HTML-da yozilgan matnli hujjat matn protsessorida (masalan, Word) tayyorlangan shunga o'xshash hujjat hajmidan bir necha marta kichik baytlardagi o'lchamga ega.

Berners-Li (ishlab chiqaruvchi) ishlab chiqilgan tilni SGML tiliga va gipermatn bilan ishlash usullariga asosladi, bu esa u yaratgan tilning HTML deb nomlanishiga sababdir. Yangi til hujjatlar va gipermatnli havolalarni tasvirlash uchun asosiy SGML konstruksiyalaridan foydalangan.


Gipermatnma'lumotlar elementlari bir-biriga bog'langan matn, grafik va boshqa ma'lumotlarni tartibga solish usulidir. Bitta hujjatning ikkala elementi ham, turli hujjatlarning elementlari ham bog'lanishi mumkin. Gipermatn tuzilmasi Butunjahon Internet tarmog'ining markazida joylashgan.

Gipermatnlar elektron hujjatlar. Gipermatnlar bilan faqat kompyuterda ishlash mumkin, bosma shaklda gipermatnlar mavjud emas. Gipermatnli tizimga misol sifatida taniqli Windows yordam tizimini keltirish mumkin.

Ulanishlar gipermatn strukturasida yordamida amalga oshiriladi havolalar. Bog'lanishlar tufayli foydalanuvchi bitta hujjatdan boshqa hujjatni, undan keyingi hujjatni va hokazolarni chaqirishi mumkin.

1989 yilda Berners-Li rivojlandi axborot tizimi, havolalar bilan bog'langan hujjatlarning poutini eslatadi. Hujjatlar butun dunyo bo'ylab joylashgan va Internet kanallari orqali o'zaro bog'langan serverlarda saqlanadi. U rivojlandi HTTP protokoli - serverlar gipermatnli hujjatlarni almashish uchun mo'ljallangan til, va birinchi Web server va brauzer dasturlarini yozgan. U Internet hamjamiyatiga bevosita murojaat qildi va 1991 yilda ishqibozlar birinchi veb-saytlarni yaratishga kirishdilar.

Yillar davomida World Wide Web Internetdagi eng mashhur xizmatga aylandi. Hozirgi vaqtda u eng keng foydalanuvchilarning, jumladan, millionlab veb-saytlarning axborotga bo'lgan ehtiyojlarini qondiradi. Katta saytlar minglab va yuz minglab hujjatlarni o'z ichiga oladi va WWWdagi hujjatlarning umumiy soni har soniyada ortib bormoqda, chunki ularni yaratish ustida dunyoning turli burchaklarida mutaxassislar va havaskorlarning katta armiyasi ishlamoqda.

Internetyoki qisqartirilgan veb- bu Internetdan transport kanali sifatida foydalanadigan global gipermatnli axborotni tarqatish tizimi.

Aslida, World Wide Web - bu veb-saytlarning geografiyasi bilan bog'liq bo'lmagan hujjatlarning gipermatnli maydoni. Shuning uchun, bu bo'shliqda tugunlar orasidagi jismoniy masofa mantiqiy emas. Monitor ekranida ham qo'shni xonadagi kompyuter diskida, ham boshqa davlatda joylashgan serverda saqlanadigan veb-sahifalarni xuddi shunday ko'rishingiz mumkin.

Butunjahon Internet tadqiqot va sanoat tashkilotlari assotsiatsiyasi - konsortsium tomonidan ishlab chiqilgan va joriy etilgan ma'lum standartlarga muvofiq ishlaydi. W3C(World Wide Web Consortium so'zining qisqartmasi). .

HTML belgilash tili SGML tiliga asoslangan edi. Paragraflar, sarlavhalar, ro'yxatlar va HTMLda mavjud bo'lgan boshqa elementlar uchun belgilash vositalari ham SGML da taqdim etilgan. HTML ixtirochisining xizmati shundaki, u belgilash tiliga SGML bo'lmagan narsani kiritgan - bular gipermatnli havolalar.

Yaxshi ishingizni bilimlar bazasiga yuborish oddiy. Quyidagi shakldan foydalaning

Bilimlar bazasidan o‘z o‘qish va faoliyatida foydalanayotgan talabalar, aspirantlar, yosh olimlar sizdan juda minnatdor bo‘ladi.

Shunga o'xshash hujjatlar

    Gipermatn tushunchasiga ta'rif. SGML hujjatining asosiy qismlari. Yaratilish tarixi standart til HTML hujjat belgisi. XHTML sintaksisi va HTML o'rtasidagi farqlar. RSS - bu yangiliklar tasmalarini tavsiflash uchun XML formatlari oilasi. KML belgilash tilidan foydalanish.

    taqdimot, 2014-02-15 qo'shilgan

    Web-sahifalarni dasturlash tili asoslari - HTML. Veb-sahifa o'z ichiga olishi mumkin bo'lgan ma'lumotlar turlari: matn, grafik, ovoz, animatsiya va video. Web-sahifalar yaratish uchun asboblar to'plami. Veb-dizayn uchun ishlatiladigan asosiy HTML muharrirlari.

    referat, 19.01.2011 qo'shilgan

    umumiy xususiyatlar Gipermatnni belgilash tili. HTML hujjatning tuzilishi. HTML ning asosiy xususiyatlari haqida umumiy ma'lumot. Zamonaviy web-sahifa dizayni elementlari. Tahlil amaliy qo'llash HTML (qo'llanmalar misolida).

    muddatli ish, 24.11.2012 qo'shilgan

    HTML tilining asosiy teglari va atributlari. Bir nechta o'zaro bog'langan sahifalar bo'lishi kerak bo'lgan veb-sayt yaratish. Sahifalar va boshqa hujjatlardagi turli atribut va teg qiymatlarini ko'rib chiqing. Ishlab chiqilgan sahifalarning ekran shakllari.

    laboratoriya ishi, qo'shilgan 04/16/2014

    Belgilash nima. Belgilash tili - bu matn bloklarini kodlash uchun ishlatiladigan formatlash tamoyillari to'g'risidagi konventsiyalar to'plami. SGML, HTML, XML formatlarining imkoniyatlari, yaratilish tarixi, ilovalarning o'ziga xos xususiyatlari, axborotni joylashtirishni nazorat qilish.

    referat, 2010-03-22 qo'shilgan

    Yangi gipermatn belgilash tili XHTML. XHTML hujjatlarini tekshirish, ularning turini aniqlash. XHTML belgilashda keng tarqalgan xatolar. Foydalanuvchi agentlarining muvofiqligi. XHTML dan boshqa nom maydonlari bilan foydalanish. HTML semantikasini kengaytirish.

    kurs qog'ozi, 2009 yil 14 iyulda qo'shilgan

    Lex leksik analizatori yordamida rekursiv tushish algoritmi va grammatika qurish tizimini o'rganish. HTML belgilash tili uchun tarjimon dasturini yozish. Sifatida kiritishning to'g'riligi uchun kirish ketma-ketligini tekshirish umumiy funktsiya dasturlari.

    nazorat ishi, 25.12.2012 qo'shilgan