TypeSetting/MakingOfProceedings

はじめに(論文集制作)

西洋古典学の論文集を LaTeX で制作することを考える.投稿者は Microsoft Word 文書(.doc)などのワープロ文書で投稿することが多いと仮定する.ワープロ文書から LaTeX に変換(編集)する際にいくつかの問題があるので,それをどのように解決していけばよいかを以下で考察する.

この文書の有効範囲

これによってすべてが自動化されるわけではないので,ごく狭い範囲でしか使えないわけではないが,少なくともこの方法では次のものを自動的に変換するのは難しい.

  1. 数式
  2. グラフィック
  3. 図表

以下では主に欧米系人文科学,特に西洋古典学の論文を想定する.

変換の流れ

Word 文書から LaTeX 形式に変換するソフトウェアはいくつか存在するが,Microsoft Office を必要としたり,有償だったりするので,「フリーの」ソフトウェアでも可能な方法を考える.

.tex はテキスト形式であり,テキスト形式であれば Perl や sed などを使って高度な処理が可能になるので,ワープロ文書から何らかのテキスト形式に変換できればよい.また,

  1. ワープロ文書のマークアップ部分を保存できる
  2. 汎用的である(その変換が多くのワープロソフトで実装されている)

方がよいと考えられる.(少なくとも)上の2つを満たすものの1つにHTML形式がある.

したがって,ワープロ文書 -> HTML -> LaTeX のように変換することを以下で考える.もちろん完全に変換を自動化することはできないので,手作業で修正する必要がある.この手順を以下では「編集」と呼ぶ.

HTML形式を使うことの利点

たとえば,Microsoft Word 文書の全体を選択してコピーし,「メモ帳」に貼り付けてテキスト形式で保存してもよいが,そうするとテキスト以外の部分の情報が失われてしまう.HTML形式を間に挟めば

  1. 注の入る箇所
  2. イタリック
  3. 太字
  4. 下線

が何らかの形でマークアップされるのが普通なので,それを探し出して LaTeX のコマンドに置き換えればよい.

次のようなものも何らかの形でマークアップされるとよいが,その方法については検討中.

  1. 圏点

HTML形式以外を用いる

ほかにはRTF(Rich Text Format)を用いることが考えられる.RTFはマークアップを用いたテキスト形式であり,LaTeX への変換も本来は容易であるはずである.ただし次の問題がある.

  1. 日本語は Shift JIS を ASCII に変換したものが使われる.
  2. ワープロソフトで生成したRTFファイルには種々の「余分な」マークが含まれる.

1は RTFコンバータ などを使うことで,Shift JIS などの文字コードに戻すことができる.RTFコンバータを使えば2のようなマークも除去してくれる.LaTeX 形式に変換しておきたいマークはRTFコンバータを通す前に変換しておけばよさそうだ.

変換・編集時の問題点とその解決

ワープロ文書自体に含まれる,あるいは「ワープロ文書 -> HTML -> LaTeX」の変換(編集)の際に生じる問題点には以下のような問題がある.

  1. 段落分けは \n で行われている.LaTeX では \n\n である.
  2. 「半角」であるべきところが「全角」になっている.特に数字の場合がそうである.
  3. LaTeX ではギリシア語の部分を何らかの方法でマークアップする必要がある.マークアップを手作業で行うのはかなりの手間である.
  4. アクセント付きのローマ文字は,普通は Unicode で入力されるので問題ないはずだが,そうでないものがあり,また特殊文字を使用している可能性もある.

それぞれの解決法と注意は以下の通りである.

  1. <p> を \n\n で置き換える(段落分けの自動化).場合によっては \n\n が余分に挿入される箇所が発生するが,これを修正するのは(段落分けを手動で行うのと比べて)容易である.<br> は LaTeX では必要ない場合が多いが,\bigskip などの意味で使われることがある.一旦 \bigskip などに変換し,あとで必要ない箇所を削除する.
  2. 「全角」->「半角」の変換は Perl で行う.
  3. Perl の \p{Greek} などの記法を用いると特定の言語(文字)の部分をマークアップできる.
  4. これはあまり起こらない現象だと考えられるので,いくつかの箇所を選び出して確認し,あとは著者校正で修正してもらう.

解決が難しい問題

  1. (特にギリシア語の部分において)Unicode 対応でないフォントを用いている場合.

よく使われているフォントに対しては変換スクリプトを作成する方法もあるが,おそらく費用対効果の点で問題があるので,投稿規定で Unicode 対応のフォントを使うように執筆者に要請した方がよい.

執筆者とのやりとりに関係する問題

次のような問題がある.

  1. 原稿の記述方法がまちまちである.
  2. 提出すべきものが提出されていない.
  3. 著者校正の結果を反映するのが面倒である.

解決法は以下の通りである.

  1. 簡単な投稿規定を作り,それを守ってもらう.
  2. 論文送付用紙を作る(フォーム付きPDFが便利).
  3. 著者校正の結果を直接PDFに書き込んでもらう.

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2016-04-17 (日) 00:09:02