2013年12月16日

青空文庫テキストをInDesignタグ変換でユニコードで処理する

 青空文庫テキストの置換は、最初は通常の検索置換と複数一括置換と組み合わせで行っていたが、正規表現での改行は「\n」で可能だったので、ワークフローを作り直した。改行の削除は見出し文字の前後と、段落の冒頭の空白スペースの削除で使うので、それらは「\n」の正規表現検索に変更した。見出しは改行と見出し文字列を検索して、同じ文字列を改行のみを削除して置換する。それで全体の置換ステップは8回になった。

 続きはこちらからご覧下さい
posted by jink0222 at 17:05 | Comment(0) | TrackBack(0) | InDesignタグで青空文庫 | このブログの読者になる | 更新情報をチェックする
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。