TypeSetting/MakingOfProceedings
TypeSetting/MakingOfProceedings
西洋古典学の論文集を LaTeX で制作することを考える.投稿者は Microsoft Word 文書(.doc)などのワープロ文書で投稿することが多いと仮定する.ワープロ文書から LaTeX に変換(編集)する際にいくつかの問題があるので,それをどのように解決していけばよいかを以下で考察する.
これによってすべてが自動化されるわけではないので,ごく狭い範囲でしか使えないわけではないが,少なくともこの方法では次のものを自動的に変換するのは難しい.
以下では主に欧米系人文科学,特に西洋古典学の論文を想定する.
Word 文書から LaTeX 形式に変換するソフトウェアはいくつか存在するが,Microsoft Office を必要としたり,有償だったりするので,「フリーの」ソフトウェアでも可能な方法を考える.
.tex はテキスト形式であり,テキスト形式であれば Perl や sed などを使って高度な処理が可能になるので,ワープロ文書から何らかのテキスト形式に変換できればよい.また,
方がよいと考えられる.(少なくとも)上の2つを満たすものの1つにHTML形式がある.
したがって,ワープロ文書 -> HTML -> LaTeX のように変換することを以下で考える.もちろん完全に変換を自動化することはできないので,手作業で修正する必要がある.この手順を以下では「編集」と呼ぶ.
たとえば,Microsoft Word 文書の全体を選択してコピーし,「メモ帳」に貼り付けてテキスト形式で保存してもよいが,そうするとテキスト以外の部分の情報が失われてしまう.HTML形式を間に挟めば
が何らかの形でマークアップされるのが普通なので,それを探し出して LaTeX のコマンドに置き換えればよい.
次のようなものも何らかの形でマークアップされるとよいが,その方法については検討中.
ほかにはRTF(Rich Text Format)を用いることが考えられる.RTFはマークアップを用いたテキスト形式であり,LaTeX への変換も本来は容易であるはずである.ただし次の問題がある.
1は RTFコンバータ などを使うことで,Shift JIS などの文字コードに戻すことができる.RTFコンバータを使えば2のようなマークも除去してくれる.LaTeX 形式に変換しておきたいマークはRTFコンバータを通す前に変換しておけばよさそうだ.
ワープロ文書自体に含まれる,あるいは「ワープロ文書 -> HTML -> LaTeX」の変換(編集)の際に生じる問題点には以下のような問題がある.
それぞれの解決法と注意は以下の通りである.
よく使われているフォントに対しては変換スクリプトを作成する方法もあるが,おそらく費用対効果の点で問題があるので,投稿規定で Unicode 対応のフォントを使うように執筆者に要請した方がよい.
次のような問題がある.
解決法は以下の通りである.