#author("2017-06-08T16:26:19+00:00","default:admin","admin") [[TypeSetting/MakingOfProceedings]] *Word -> LaTeX の変換(論文集制作) [#jfe778e2] 方針は [[はじめに>TypeSetting/MakingOfProceedings/Intro]] で説明した通りである.「フリーな」ソフトウェアを使うことを前提としているので,ここでは OpenOffice.org を用いる方法を採用する.OpenOffice.org が扱えないワープロ文書の場合は執筆者側で HTML 形式に変換してもらうことを検討した方がよい([[投稿規定>TypeSetting/MakingOfProceedings/Regulations]] 参照). **0, Wordファイルの編集 [#ed7b4ec2] +ルビ(マクロで置換) --http://hermione.s41.xrea.com/pukiwiki/pukiwiki.php?OOobbs2%2F193&word=ルビ --http://oooug.jp/faq/index.php?faq%2F4%2F1791 **1, .doc -> .html [#q5a8dc03] +OpenOffice.org の設定を行っておく. --[ツール]—[オプション]をクリックする. --「読み込み/保存」の「HTML 互換性」を選択する. --「文字集合」を「Unicode (UTF-8)」に変更する. +.doc ファイルを開き,[ファイル]—[別名で保存]で「ファイルの種類」を「HTML ドキュメント」にして保存する. 1を行わないとギリシア文字の部分が α などの実体参照に変換されてしまう. **2, HTML タグの削除 [#w369bf25] このあとは Perl とテキストエディタで作業していく. +改行コードの変換(CR, LF -> LF). +改行を半角スペースに変換. +タブなどの空白文字を半角スペースに変換. +2つ以上連続する半角スペースを1つに変換. +LaTeX 記法に変換する必要のあるタグを一旦別の記号に変換. --& --<SUP></SUP></A>(脚注記号.脚注記号にはアンカーがつくことを利用する) --<SUP></SUP>(普通の上付文字) --<I></I> --''</B> --<EM></EM> --<BR>(\bigskip に相当するところがあるかもしれないので,念のため *bigskip***** などに変換しておく) +</P> を改行2つに変換. +すべての HTML タグを削除. +5の記号を変換. --連続しているところは1つにまとめる. --LaTeX 記法に変換. +行頭・行末の半角スペースを削除. +空行を削除. +段落分けを LaTeX 用に変換.和欧混植時に便利な「電子メール式だが行末と段落末を一致させる」方式を採用する. 以上の例. -[[変換スクリプトの例>TypeSetting/MakingOfProceedings/DocToLaTeX/script]] **3, 脚注の挿入 [#cec36cd5] +2でできたファイル(text.txt)の前半には本文が,後半には脚注があるので,脚注の部分だけをエディタで抜き出して別のファイルに保存する. +脚注ファイル(notes.txt)には1脚注1行の形式(ただし空行可)にし,行頭には「脚注番号+半角スペース」があるものとする. +notes.txt から空行と行頭の「脚注番号+半角スペース」を削除する. +text.txt の脚注が入る部分は,たとえば脚注31なら「FootNote=31=」とマークされている.notes.txt を Perl の配列で1行ずつ読み込み,FootNote=31= などを \footnote{ああああ.} などに置き換えていく. +脚注が挿入されたファイルは article.txt などとする. **4, いろいろな変換(1) [#of2fa4f6] +全角英数字 -> 半角. +半角カタカナ -> 全角. +LaTeX の特殊文字に \ を付加. +その他の LaTeX の特殊文字を処理. +cf. などを cf.\ に. +M. L. などを M.~L. に. +数字の前後の - を **– に変換(二分ダーシでない箇所を後で手作業で探してハイフンに戻し,最後にエディタ上で ***!– を – に一括変換する). +行頭・行末の半角スペースを削除. +} の前の半角スペースを外に出す. +省略記号の . が \textit の外に出ている場合中に入れる. **5, 和文文字の変換 [#n19ab47d] +和文文字中の半角文字. +和文中の () を全角に変換. +などなど. **6, ギリシア文字の変換 [#h6d22509] +ギリシア語単語を \GreekText で囲む. +\GreekText が半角スペースなどを挟んで隣り合っていれば結合. +\GreekText の前後に - があれば中に入れる. +\GreekText の後に ' があれば中に入れる. +ギリシア文字の後の ' を ''' に変換. あとで必要に応じて \GreekText{xxx} を \foreignlanguage{greek}{xxx} などに置き換える. **7, いろいろな変換(2) [#c31cec47] +p.~1 などの処理. **8, 最終調整 [#wbae9a15] 一括変換できないものをエディタ上で確認しながら一つずつ修正していく. +二分ダーシ. --**– となっているもののうち,ハイフンに変換すべきところは変換する. --**– をすべて二分ダーシに変換する. +\bigskip --*bigskip***** となっているもののうち,\bigskip が必要ないものは削除する. --*bigskip***** をすべて \bigskip に変換する. +フル・ストップの後に \ を入れるべきところ,\@ を入れるべきところ. --特に古典作家名と作品名. +「\footnote{xxx.}和文文字」の場合「\footnote{xxx.} 和文文字」とする. +かっこ類に全角を使うか,半角を使うか.「( ) ()」のすべてを検索(またはハイライト)して周りの状況や対応を調べていく. +他の記号類についても全角/半角の使い分けが適切かどうか,調べる. +文献表中はフル・ストップの扱いが他と異なるので注意する(普通は \ は必要ない). +他の全体的な体裁. **9, HTMLのタグ [#u78aba84] |~構造|~MS Word 2016|~LibreOffice| |~表題|<p class=MsoTitle>|| |~副題|<p class=MsoSubtitle>|| |~見出し1|<h1>|<h1>| |~見出し2|<h2>|<h2>| |~見出し3|<h3>|<h3>| |~引用文|<blockquote>|<blockquote>|