HTMLの仕様書はW3Cより勧告されHTML4.01で最終だそうです。
その後はXMLが公式な仕様書となるだろう。HTMLの次期仕様書がXML
のようであるが、
実は誤解といえる。HTMLはそのままと考えたほうが正解である。 HTMLの上位規定SGMLがあったのをご存知だろうか。ISO(International Organization for Standardization)によって制定された、文書の意味構造を記述するための言語、Standard Generalized Markup Language。この規格の一部として HTMLが策定され、インターネットで広く利用されて来た。というより、 この言語がコンピュータネットワークの能力を引き出したといったほうが 正解なのだろう。 SGMLはワープロが開発され文書が電子化された時代、互換性を持たせるため 1986年に策定されている。仕様が複雑過ぎて専門家でないと扱えないといった 事情により普及しなかった。SGMLの簡略版としてインターネット言語、 HTMLは制定された。先に統一規格書があるなかで生まれ育った HTMLはSGMLの第一子とも言える。 HTMLの特徴は、次のような点だろう。
|
WordやExcelといった文書はもとより、測量データーもXML。となれば、
たまの休日、Webサイト作りといったものではな。速習XMLがビジネス
マンの必須科目となる。 測量データーが国土地理院からダウンロウドして手に入る。 これがXML。IEの6を使っているのだが、測量データーがIEで眺められる。 TABで綺麗にインデントされ表示される。マイクロソフトはIE5よりXML対応していたと知ってびっくり。ソースをじっくり眺めると、確かに「構造化文書」である雰囲気が 伝わってくる。HTMLにもルールはあった。文章を書く位置は決まっていた。 表のルールもあった。
|
「メタ言語」とは、それを基にして別の言語を作成できる機能を提供する言語。
つまりは、憲法(constitution)ということか。民法は憲法の精神を侵しては
いけない。そういうこと。
<TITLE>100円</TITLE> これはHTML。 <表題>100円</表題> これはHTMLではない。XMLではある。 <単価>100円</単価> 憲法XMLは、このように100円を修飾するためにタグを使う。100円をマークアップしているという。 <TITLE>100円</TITLE> HTMLの表題は100円とマークアップしている。 HTMLはXML憲法下のWeb文書法だから、タグを文章表記記号として 利用している。れっきとしたXMLである。しかしコンピューターと テキストの間で、実に巧妙にマークアップタグは利用されたものだ。ブラウザ はこのタグを読んで画面に文字を表示しているのだ。 だが、XMLはタグをもっと一般的に、内容を説明するものと だけ規定している。<名前>のセットでタグと呼ぶ。内容と開始タグ、終了タグのセットで「要素」としている。 |
<TABLE>と</TABLE>のように、この組み合わせでタグを使う。これが憲法になった。これしか駄目。 ということで、開始タグはあるが終了タグのないHTMLの<BR>は憲法違反で消滅するそうだ。 XMLでは大文字と小文字が区別される。これからは大文字と小文字を区別しよう。 XMLの構造
XML宣言
XML仕様のバージョンが1.0、文字エンコーディングがUTF-8またはUTF-16、スタンドアロン文書宣言がnoをすべて満たしている場合、XML宣言自体の省略が可能。 要素
XML文書内で名前として使ってはいけないケース。
HTMLで空白を挿入したいときに使う「 」はXML 1.0仕様ではサポートされていません。 以上がXMLのルール。これを満たせばwell-Formed XML(整形式XML)とされる。 XML 1.0仕様はファイルの命名規則を特に規定していません。拡張子は何にしても構いません。通例は.xml。 |
要素や属性の名前、出現順などの細則をスキーマと呼ぶ。そのスキーマを定義する言語として、XML 1.0は「DTD」(Document Type Definition)を規定している。 DTDの記述位置 XML宣言と要素本体の間に記述する。 内部で指定
外部で指定
DTDの記述方法 要素型宣言 <!ELEMENT 要素名 DTD内容>
属性リスト宣言 <!ATTLIST 要素名 属性名 属性の型 デフォルト値> 指定できる属性の型
指定できるデフォルト値
実体宣言 <!ENTITY 実体名 "実体">
DTDに従って記述されているXML文書を「valid XML」と呼ぶ。 XMLは憲法。民法はDTDを加えた「valid XML」と理解しよう。 |