#author("2017-07-07T06:38:32+00:00","","")
#author("2017-07-07T06:41:34+00:00","","")
[[TypeSetting/MakingOfProceedings]]

*Word -> LaTeXの変換(論文集制作) [#jfe778e2]

方針は[[はじめに>TypeSetting/MakingOfProceedings/Intro]]で説明した通りである.「フリーな」ソフトウェアを使うことを前提としているので,ここではLibreOfficeなどを用いる方法を採用する.LibreOfficeが扱えないワープロ文書の場合は執筆者側でHTML形式に変換してもらう([[投稿規定>TypeSetting/MakingOfProceedings/Regulations]]参照).

**0, Wordファイルの編集 [#ed7b4ec2]

+ルビ(マクロで置換)
--http://hermione.s41.xrea.com/pukiwiki/pukiwiki.php?OOobbs2%2F193&word=ルビ
--http://oooug.jp/faq/index.php?faq%2F4%2F1791

**1, .doc -> .html [#q5a8dc03]

+LibreOfficeの設定を行っておく.
--[ツール]—[オプション]をクリックする.
--「読み込み/保存」の「HTML互換性」を選択する.
--「文字集合」を「Unicode (UTF-8)」に変更する.
+.doc ファイルを開き,[ファイル]—[別名で保存]で「ファイルの種類」を「HTMLドキュメント」にして保存する.

1を行わないとギリシア文字の部分が α などの実体参照に変換されてしまう.

**2, HTMLタグの削除 [#w369bf25]

このあとはPerlとテキストエディタで作業していく.

+改行コードの変換(CR, LF -> LF).
+改行を半角スペースに変換.
+タブなどの空白文字を半角スペースに変換.
+2つ以上連続する半角スペースを1つに変換.
+LaTeXのマクロに変換する必要のあるタグを一旦別の記号に変換.
--&
--<SUP></SUP></A>(脚注記号.脚注記号にはアンカーがつくことを利用する)
--<SUP></SUP>(普通の上付文字)
--<I></I>
--<B></B>
--<EM></EM>
--<BR>(\bigskipに相当するところがあるかもしれないので,念のため***bigskip***などに変換しておく)
+</P>を改行2つに変換.
+すべてのHTMLタグを削除.
+5の記号を変換.
--連続しているところは1つにまとめる.
--LaTeXのマクロに変換.
+行頭・行末の半角スペースを削除.
+空行を削除.
+段落分けをLaTeX用に変換.和欧混植時に便利な「電子メール式だが行末と段落末を一致させる」方式を採用する.

以上の例.

-[[変換スクリプトの例>TypeSetting/MakingOfProceedings/DocToLaTeX/script]]

**3, 脚注の挿入 [#cec36cd5]

+2でできたファイル(text.txt)の前半には本文が,後半には脚注があるので,脚注の部分だけをエディタで抜き出して別のファイルに保存する.
+脚注ファイル(notes.txt)には1脚注1行の形式(ただし空行可)にし,行頭には「脚注番号+半角スペース」があるものとする.
+notes.txtから空行と行頭の「脚注番号+半角スペース」を削除する.
+text.txtの脚注が入る部分は,たとえば脚注31なら「FootNote==31==」とマークされている.notes.txtをPerlの配列で1行ずつ読み込み,FootNote==31==などを\footnote{ああああ.} などに置き換えていく.
+脚注が挿入されたファイルはarticle.txtなどとする.

**4, いろいろな変換(1) [#of2fa4f6]

+全角英数字 -> 半角.
+半角カタカナ -> 全角.
+LaTeX の特殊文字に \ を付加.
+その他のLaTeXの特殊文字を処理.
+cf. などを cf.\ に.
+M. L. などを M.~L. に.
+数字の前後の - を -- に変換(二分ダーシでない箇所を後で手作業で探してハイフンに戻し,最後にエディタ上で !!-- を -- に一括変換する).
+行頭・行末の半角スペースを削除.
+} の前の半角スペースを外に出す.
+省略記号の . が\textitの外に出ている場合中に入れる.

**5, 和文文字の変換 [#n19ab47d]

+和文文字中の半角文字.
+和文中の () を全角に変換.
+などなど.

**6, ギリシア文字の変換 [#h6d22509]

+ギリシア語単語を\GreekTextで囲む.
+\GreekTextが半角スペースなどを挟んで隣り合っていれば結合.
+\GreekTextの前後に - があれば中に入れる.
+\GreekTextの後に ' があれば中に入れる.
+ギリシア文字の後の ' を '' に変換.

あとで必要に応じて\GreekText{xxx}を\foreignlanguage{greek}{xxx}などに置き換える.

**7, いろいろな変換(2) [#c31cec47]

+p.~1 などの処理.

**8, 最終調整 [#wbae9a15]

一括変換できないものをエディタ上で確認しながら一つずつ修正していく.

+二分ダーシ.
-- - となっているもののうち,ハイフンに変換すべきところは変換する.
-- -- をすべて二分ダーシに変換する.
+\bigskip
--***bigskip*** となっているもののうち,\bigskipが必要ないものは削除する.
--***bigskip*** をすべて\bigskipに変換する.
+フル・ストップの後に \ を入れるべきところ,\@ を入れるべきところ.
--特に古典作家名と作品名.
+「\footnote{xxx.}和文文字」の場合「\footnote{xxx.} 和文文字」とする.
+かっこ類に全角を使うか,半角を使うか.「( ) ()」のすべてを検索(またはハイライト)して周りの状況や対応を調べていく.
+他の記号類についても全角/半角の使い分けが適切かどうか,調べる.
+文献表中はフル・ストップの扱いが他と異なるので注意する(普通は \ は必要ない).
+他の全体的な体裁.

**9, HTMLのタグ [#u78aba84]

|~構造|~MS Word 2016|~LibreOffice|
|~表題|<p class=MsoTitle>||
|~副題|<p class=MsoSubtitle>||
|~見出し1|<h1>|<h1>|
|~見出し2|<h2>|<h2>|
|~見出し3|<h3>|<h3>|
|~引用文1|<blockquote>||
|~引用文2|<pre>||
|~引用||<blockquote>|
|~整形済みテキスト||<pre class="cjk">|

**10, ギリシア語 [#m2fd6e56]

+ギリシア語の疑問符 ; にはASCII文字の ; を用いる方がよいとUnicodeの規定には書かれているようだが,英文中にギリシア語を埋め込む場合などを考えるとギリシア語用の疑問符を使うようにした方がよい.ただしmacOSでもWindowsでも古典ギリシア語キーボードを用いるとASCII文字の ; が入力されるようである.
+inputencにutf8xを用いる場合とutf8を用いる場合があるが,現在ではutf8を用いた方がよい.この場合,単語レベルで引用するなら\foreignlanguage{greek}{xxx}などは必要ない.ただしteubnerパッケージを利用した記法やアポストロフィを含む単語・文章の場合は\foreignlanguage{greek}{xxx}などが必要である.たとえば2単語以上(=間に空白を含む)の場合は\foreignlanguage{greek}{xxx}で囲むなどの方法が考えられる.
+アポストロフィの後に空白を挿入しない著者も多いので注意する.δ'ἀγαθός -> δ'ἀγαθός.

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS