標記語言
標記語言,也稱置標語言,是一種將文本(Text)以及文本相關的其他信息結合起來,展現(xiàn)出關于文檔結構和數(shù)據處理細節(jié)的電腦文字編碼。與文本相關的其他信息(包括例如文本的結構和表示信息等)與原來的文本結合在一起,但是使用標記(markup)進行標識。
標記語言簡介[ ]
標記語言,也稱置標語言,是一種將文本(Text)以及文本相關的其他信息結合起來,展現(xiàn)出關于文檔結構和數(shù)據處理細節(jié)的電腦文字編碼。與文本相關的其他信息(包括例如文本的結構和表示信息等)與原來的文本結合在一起,但是使用標記(markup)進行標識。當今廣泛使用的置標語言是超文本置標語言(HyperText Markup Language,HTML)和可擴展置標語言 (eXtensible Markup Language,XML)。置標語言廣泛應用于網頁和網絡應用程序。標記最早用于出版業(yè),是作者、編輯以及出版商之間用于描述出版作品的排版格式所使用的。
標記語言分類[ ]
- 標識性的置標語言
標識性的置標語言 (Presentational markup)是在編碼過程中,標記文檔的結構信息。例如,在文本文件中, 文件的標題可能需要用特定的格式表示(居中,放大等),這樣我們就需要標記文件的標題。字處理以及桌面出版產品有時候能夠自動推斷出這類的結構信息,但是絕大多數(shù)的,像Wiki這樣的純文本編輯器還不能解決這個問題。
- 過程性標識
過程性置標語言(Procedural markup) 一般都專門于文字的表達,但通常對于文本編輯者可見,并且能夠被軟件依其出現(xiàn)順序依次解讀 。 為了格式化一個標題,在標題文本之前,會緊接著插入一系列的格式標識符,以指示計算機轉換到居中的顯示模式,同時加大及加粗字體。在標題文本之后,會緊接綴上格式中止標識; 對于更高級的系統(tǒng)宏命令或這堆棧模式會讓這一過程的實現(xiàn)方式更加豐富 。大多是情況下, 過程性置標能力包含有一個Turing-complete編程語言。 過程性置標語言的范例有:nroff, troff, TeX, Lout 以及 PostScript. 過程性置標語言被廣泛應用在專業(yè)出版領域, 專業(yè)的出版商會根據要求使用不同的指標語言已達到出版要求.
- 描述性標識
歷史
“置標(markup)”這個詞來源自傳統(tǒng)出版業(yè)的“標記”一個手稿,也就是在原稿的邊緣加注一些符號來指示打印上的要求。 長久以來,這個工作都是由專門的人("markup men" )以及校對人來進行,對原稿標志出使用什么樣的字體,字型以及字號,然后再將原稿交給其他人進行手工的排版工作。
GenCode
TeX
主條目:TeX TeX是一個由美國電腦教授高德納(Donald E. Knuth)編寫的功能強大的排版軟件。它在學術界十分流行,特別是數(shù)學、物理學和計算機科學界。TeX被普遍認為是一個很好的排版工具,特別是在處理復雜的數(shù)學公式時。利用諸如是LaTeX等終端軟件,TeX就能夠排版出精美的文本。
SGML SGML是一種專門的置標語言,被用作編寫《牛津英語詞典》的電子版本。由于SGML的復雜,導致難以普及。
HTML
主條目:HTML 超文件標示語言(英文:HyperText Markup Language,簡稱為HTML)是為網頁創(chuàng)建和其它可在網頁瀏覽器中看到的信息設計的一種標記語言。
XML
主條目:XML 可擴展標記語言(Extensible Markup Language,簡稱XML),又稱可擴展置標語言,是一種標記語言。置標指電腦所能理解的信息符號,通過此種標記,電腦之間可以處理包含各種信息的文章等。
XHTML
主條目:XHTML 可延伸超文件標示語言(eXtensible HyperText Markup Language,XHTML),是一種標記語言,表現(xiàn)方式與超文本標記語言(HTML)類似,不過語法上更加嚴格。
其他基于XML的應用.
還有其他一些基于XML的應用,比如RDF, XForms, DocBook, SOAP以及Web Ontology Language (OWL)。具體可以參見XML標記語言列表.
特征
其他應用
XAML(Extensible Application Markup Language),基于XML語言,在微軟WPF(Windows Presentation Foundation)中使用。
標記語言歷史[ ]
標記語言(markup language),用一系列約定好的標記來對電子文檔進行標記,以實現(xiàn)對電子文檔的語義、結構、及格式的定義。這些標記必須很容易的和內容區(qū)分,并且易于識別。標記語言的發(fā)展如下:
GML(1969)
|
SGML(1985)
|
XML(1998) 、、、、、、、HTML(1993)
|——————|——|———|——|
MathML、WML、SVG、CML、XHTML
為了促進數(shù)據交換和操作,在20世紀60年代,通過IBM格公司研究人員的杰出工作,得出了重要的結論:要提高系統(tǒng)的移植性,必須采用一種通用的文檔格式,這種文檔的格式必須遵守特定的規(guī)則。這也就是創(chuàng)建GML (Generalized Markup Language,通用標記語言)的指導原則,從人們所產生的將文件結構化為標準的格式的動機出發(fā),IBM創(chuàng)建了GML。
在標記語言的概念達成共識的基礎上,IBM公司的研究人員Charles Goldfarb帶領的開發(fā)團隊完善著GML,將其稱為SGML(Standard Generalized Markup Language,標記通用標記語言),SGML成為了IBM內部格式化和維護合法化文件的手段。后來被拓展和修改,作為一種全面的信息標準以適應工業(yè)范圍的廣泛應用,1986年,SGML被國際標準化組織(ISO)所采納。
他的功能非常強大,但是非常復雜,需要許多昂貴的軟件配合運行,因此在很長一段時間內沒有被推廣。
1989年,歐洲粒子物理實驗室(CERT)的研究員Tim Berners-Lee和Anders Berglund共同創(chuàng)建了一種基于標記的語言HTML,他可看做SGML的簡單應用,開始時僅僅提供一種對靜態(tài)文本的信息顯示的方法,后來越來越多的標簽產生,兩大瀏覽器廠商微軟和網景格式,甚至創(chuàng)建了自己的產品的兼容標簽,使HTML變得臃腫不堪,兼容性不好。
1996年人們開始致力于描述一個新的標記語言,它是一種在WEB中應用SGML的靈活性和強大功能的方法,W3C(World Wide Web Consortium,全球萬維網聯(lián)盟--領導萬維網,制定其公共的協(xié)議,促進萬維網的發(fā)展并確保其互操作性的國際組織)專門成立了專家小組以從事這項工作。1998.2,w3c批準了XML1.0規(guī)范。XML(eXtensible Markup Language,可擴展的標記語言),具備SGML的核心特性,但簡潔,他的內容甚至不到SGML的十分之一。
其他應用[ ]
XAML(Extensible Application Markup Language),基于XML語言,在微軟WPF(Windows Presentation Foundation)中使用。