マークダウンとマークアップ

マークアップ文書(markup document)とは、文書を構成する文章や文字列(および図や表)に対して、その論理的構成を明示し、どんな文書要素であるかを(その範囲を含めて)マーク(指定)したテキストファイルである。 文書記述用に広く利用されているマークアップ方式に HTML/CSSとLaTeXがある。

マークアップ文書はテキストファイルであり、その文書作成にはテキストエディタを使う。 HTML/CSS/Javascript用に特化したオープンソーステキストエディタとしてAdobeが提供するBracketsやGitHubが提供するAtomが有名だ。

また、ワードプロセッサのような操作感でHTMLファイルを作成することができるオーサリングソフトウエアもある。 オーサリングソフトウエアを利用した場合、その結果ファイルは必ずしも分かりやすい(可読な)文書がもたらすわけではなく、レイアウトのためのつじつまを合わせるような独自拡張したコードが入り交じり、W3Cが推奨するHTMLにはならない場合が少なくない(レイアウトのためには別途CSSファイルによってレイアウトを設計すべきというのが今日の要請だ)。 読者を獲得し理解される文書作成のためには、最低限のマークアップの知識(考え方)は必要だろう。

マークダウン

今日では、僅かな知識で文書を記述できる計量級のマークアップ方式であるマークダウンWiki Markdown)を使うのが手軽で実用性が高いようだ。

マークダウン記法を大まかに理解した場合には、チートシート(cheat sheet)を随時参照するとよい。

マークダウンテキストを書くには、マークダウン専用エディタが心地よい。

マークダウンファイルをプレビューしてくれるWebサービスを利用するとマークダウン文書という意味と必要性がよく理解できるはずだ。

LaTeXとHTML

LaTeX
PDFファイルとして整形結果を書き出すLaTeXを含むTeXファミリは出版事業で広く世界中で使われている。 そのTeXシステムは無料でさまざまなOS用に配布されている。 LaTeXではマークアップ文書はLaTeXの記述方式にしたがって書かれる必要がある。
HTML
一方、Webブラウザはある約束に従ってマークアップされたテキストを解釈・整形表示する高度な機能を持っている。 Webブラウザが読み込んで解釈・整形表示できるマークアップ文書が HTML(Hyper Text Markup Language)である。

マークアップの例

マークアップ文書の意味や様子は次のようなHTML的にマークした例で説明することができる。 以下のマークアップされたパンフレット用の文書では、テキスト中にタグ(tag)で挟むことで文書要素をマーク(mark)してその論理的構造を 明確化している。 たとえば、開始タグ 「<タイトル部>」 は終了タグ 「</タイトル部>」 とペアになって使われていることに注意されたい。

<パンフレット> 
<タイトル部>
    <見出し>ゼミ対抗テニス大会のお知らせ</見出し>
    <日付>4月15日</日付>
    <著者>今昔部事務室</著者>
</タイトル部>
<本文>
<段落>
今昔部恒例のゼミ対抗テニス大会を下記の要領で開催いたします
</段落>
<箇条書>
    <項目>日時</項目>
    <説明>5月5日
          午前10時から試合開始,午後4時より表彰式
          なお,午後6時より「さるかに庵」にて慰労会も予定
          しております。
          ふるってご参加ください。</説明>
    <項目>場所</項目>
    <説明>大学テニスコート
          雨天の場合には,さるかに合戦記念体育館に変更します。</説明>
    <項目>受付場所</項目>
    <説明>今昔部事務室
          申込み用紙に記入して提出してください。</説明>
    <項目>申込期限</項目>
    <説明>4月26日</説明>
</箇条書>
<段落>
昨年は浦島ゼミが接戦の末に花咲ゼミを押さえて優勝しました。
以来、多くのゼミがテニスコートで打倒浦島ゼミを掲げて練習に励んできたようです。
今年は果たしてどのゼミに栄冠が輝くでしょうか。
多くのみなさんの参加を期待しております。
</段落>
</本文>
</パンフレット>

このようにして作成しておけば、テキスト文書は機械可読(machine readable)となる。 タグの意味を解釈してさまざまな処理を行うことのできるシステムにこのファイルを入力することによって、出力イメージが作成されるというのがマークアップ方式の考え方である。 マークするタグの利用体系はプログラム言語のようにある種の文法規則に従っているので、言語体系という意味でマークアップの仕方をマークアップ言語(Markup Language)ということがある。

ワードプロセッサとの関係

ワードプロセッサを利用すると、このように明示的にマークアップを行わずに文字列の大きさを変えたり、文書レイアウトを指定することができる。 レイアウト指示や選択文字列に加えた変更をソフトウエアが解釈し、指定した書式にしたがって印刷イメージをディスプレイに表示してくれる(WYSIWYG=What You See Is What You Get)。 ワードプロセッサで作成したファイルには、文字情報以外のタグで囲まれたような書式情報が埋め込まれているが、それらの付加情報はディスプレイには表示されず、またエディタで直接編集することもできない。

文字情報とレイアウトの分離でも説明するように、文書情報として作成するファイルとして文字列情報とそのレイアウト情報を混在させてしまうことは、必ずしも得策ではない。 同じ文字情報からなる文書であっても、異なる書式で印刷したい場合、たとえな企業間など異なる組織で取り交わす文書を印刷するときなど、それぞれの組織で定めたレイアウト方式で印刷したいことがある。 レイアウトを変えたいときに、毎回新たに同じ文字情報からなる文書を作成するのはいかにも無駄である。

このような場合に備えて、ワードプロセッサでの文書作成においても、文字情報とレイアウトをできるだけ分離して文書を作成するように心がけるとよい。 この目的のためにワードプロセッサでは文書スタイルという考えを取り入れている。

演習1

マークアップ言語である HTMLとその拡張版であるXMLについて、どのような目的で利用されているかを調べて報告しなさい。

演習2

上のテニス大会のお知らせのビラ内容を、テキストエディタで、文字列の配置だけ(活字の大きさなどは変えることができない)で効果的であるように作成して(ファイル名 tennis.txt)、印刷してみなさい。 まだ、ワードプロセッサを使って(ファイル名 tennis.docx)、訴求力のあるビラとして作成し、印刷しなさい。 LaTeX文書として作成するのはどうすれば良いかを調べなさい。