TeX/Encoding

ギリシア語エンコーディング

一般的に使用されているワードプロセッサでのギリシア語のエンコーディング方式と LaTeX(Babel)でのエンコーディング方式の対応表です。この表にない組み合わせをお知らせください。

エンコーディングについての一般的な話は

をご覧ください。

ISO-8859-7

ギリシア語のエンコーディングは、Unicode で制定される前に ISO の規格がありましたが、こちらは現代ギリシア語用なので古典ギリシア語では使えません。

概要

古典ギリシア語のエンコーディング方式は UTF-8 を除いて一定しておらず、極端な場合には、使うフォントごとに決まっていると考えた方がよいようです。論文集を制作するときなどはそれを統一しなければなりませんので、古典ギリシア語のエンコーディングの変換について以下で考察します。なお、「西洋古典学研究室論文集制作システム」の一環ですので、「このシステムで使う LaTeX のエンコーディング」(後で定義します)以外のエンコーディングから「このシステムで使う LaTeX のエンコーディング」への変換を中心に考えます。

アクセント記号(等)

さて、古典ギリシア語ではアクセント記号と気息記号、イオタサブスクリプト、分離記号など、様々な記号が使われます。古典学者から見ればそれぞれの記号の意味はまったく違いますが、コンピュータから見れば同じです。むしろ分けてしまうと複雑になりますので、以下では「アクセント記号と気息記号、イオタサブスクリプト、分離記号」をまとめて「アクセント記号等」と呼びます。

なお、複数のアクセント記号等が重なるときは、単に複数の記号を並べる方式が多いですが、複数のアクセント記号をまとめて一つの記号で表す場合もあるので注意が必要です。また、単に複数の記号を並べる方式でも、その並べ方に制限がある場合もあるので気をつける必要があります。

複合型

一番網羅的なのは、アクセント記号等のついた文字ごとに別のコードを振ることです。こうすれば、一つのコードと一つの文字(この場合、「字型」や「グリフ」といった方が適切でしょう)が一意に対応します。ここでは、このようなエンコーディングの方式を下の「記号付加型」に対して「複合型」と名付けることにします。ただしこの場合、コードの数が多くなりすぎます。母音に関しては20種類以上の文字を用意しなければならない場合があります。

また、この型の場合、字型ごとに一つのコードが定まるので便利ですが、「未定義の文字は救済不可能」という根本的な問題があります。たとえば「無気息記号のついたΥ」や、「曲アクセントのついたο」は teubner.sty や UTF-8 では定義されていません。さらに古典ギリシア語の中でも、時代によって違う文字が用いられていたりします。

この型の例は以下の通りです。

teubner.sty は Babel(cbgreek)と一緒に使うものですので、Babel(cbgreek)の記法を併用すれば「未定義の文字は救済不可能」という問題に対処できます。

「記号付加型」

ギリシア語のアルファベットはだいたいローマ字と対応していますので、UTF 以前のエンコーディングでは、ローマ字と記号(ASCII 文字)を組み合わせることによって古典ギリシア語のエンコーディングを実現している場合が多いようです。例えばαなら、ローマ字の a と対応させます。αにアクセント記号等がつく場合には、そこに記号を付加します。ここでは、このエンコーディングの方式を「記号付加型」と名付けることにします。記号をローマ字の前に置く型を「前置型」、後ろに置く型を「後置型」と名付けます。

記号はそれぞれで異なりますので、一つ一つ調べていく必要があります。ローマ字転記(transcription)方式もやはり一つ一つ調べていく必要がありますが、転記の基準はおおむね

のどちらか、あるいはそれの組み合わせとなっていますので、全てに注意して調べる必要はありません。これについては「アルファベット」の節で詳しく調べることにします。

前置型

アクセント記号等をつける文字の前に置きます。ただしイオタサブスクリプトに関しては後に置きます。この型の例は以下の通りです。

後置型

アクセント記号等をつける文字の後に置きます。この型の例は以下の通りです。

アルファベット

「記号付加型」の場合、アルファベットの対応を調べる必要があります。既に述べたように一部の文字に限ってエンコーディングの違いが生じますので、注意すべき文字の背景の色を変えてあります。

方式αβγδεζηθικλμνξοπρσ(語尾以外)σ(語尾)τυφχψω
Babel (cbgreek)abgdezhjiklmnxoprs, cs, ctufqyw
teubner.sty
UTF-8

記号

記号はそれぞれのエンコーディングで様々です。

エリジョンの記号とアポストロフィの記号が異なることがあるので注意する必要があります。

前置型

後置型

エンコーディングの調べ方

ワープロ上でギリシア語フォントを選択して通常通り入力し、それをテキストエディタに張り付けて ASCII 文字とするのが簡単です。

やみくもに入力してもエンコーディングの規則はわかりませんので、一定の文字について調べるようにします。このページの下に見本(grencsample.pdf)を添付しておきました。見本にしたがって入力します。

参考


添付ファイル: filegrencsample.pdf 680件 [詳細]

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2019-03-30 (土) 04:06:21