ツールメニュー

Wordファイルからテキストを抽出

MS Wordで作成したXMLファイル*1からテキストを抽出します。
本機能では、xmlファイルからテキストを順に抽出し、改行で区切って出力します。出力されたテキストの改行を保持して編集を行えば、次のWordファイルにテキストを書き戻すxmlファイルに編集内容を反映することができます。

この機能は、WordファイルをXinやテキストエディタで編集することを目指して作成しました。テキストはWordファイルにおける「paragraph」単位で抽出されます。「paragraph」と「paragraph」の間は改行で区切られて出力されますので、この改行の体裁さえ保っていれば、テキストを編集した後にテキストを書き戻し、Wordファイルに変更を反映することができます。抽出したテキストに一括置換をかけた上でWordに書き戻したり、GhostとVacuumを使って編集した後に書き戻すといった応用が考えられます。

Wordファイルにテキストを書き戻す

「Wordファイルからテキストを抽出」し、そのテキストを編集した後、もう一度XMLファイルに書き戻します。上述したように、抽出テキストの改行体裁さえ保持していれば、対応する位置にテキストを書き戻すことができます。ただし、本機能で書き戻すことができるのはテキストのみであり、フォントなどの書式情報は一切変更しません。そのため、たとえば簡体字中国語のファイルからテキストを抽出し、日本語に翻訳した上で書き戻した場合は、処理後にフォントを変更するなど書式を整える必要があります。

  1. 書き戻し処理対象のテキストが現在のタブに表示されていることを確認します。
  2. 「ツール」メニューの「Wordファイルにテキストを書き戻す」を実行します。
  3. ファイル選択ダイアログが表示されますので、元のWordファイル(XML形式)を選択します。
  4. 選択が完了すると書き戻し処理が実行され、新しいタブにXMLが出力されます。
  5. 拡張子を「.xml」とし、名前を付けて保存します。

保存したXMLファイルをWordで開くと、書式などはそのままに内容が書き換えられていることが確認できます。

Word-XMLファイルからのテキストの抽出と書き戻しは開発途上の機能です。不具合が残っている可能性がありますのでご注意下さい。

コメント行の非表示と再表示

行頭に「#」が付いた行を非表示にしたり、再表示したりすることができます。画面上で見えなくしているだけですので、コピーや切り取りなどの編集操作をすると、表示されていないテキストもコピーされます。あくまで閲覧するための機能とお考えください。
Ghost処理を行ったテキストから原文部分または訳文部分を削除したい場合は、Vacuumの「訳文を削除する」か「原文を削除する」を実行してください。

Yahoo校正

Yahoo!デベロッパーネットワークの校正支援を利用し、現在編集している日本語テキストの校正支援を行います。
校正支援
ツールメニューの「Yahoo校正」から「校正実行」を行うと、現在表示されているテキストを対象に校正が行われます。誤字や不快語など修正する方が好ましいと判断されたテキストが強調表示され、強調表示されている部分をダブルクリックすると、校正用サイドバーに校正対象の文字列、修正候補、指摘の内容が表示されます。

  • 「修正」ボタンを押すと、「対象語句」が「修正候補」に置換されます。テキスト中の「対象語句」すべてを修正する場合は「全修正」を実行してください。
  • 「前の指摘」、「次の指摘」をクリックすると、「対象語句」の前の指摘個所や次の指摘個所にジャンプします。
  • 「検索」は、現在の「対象語句」を検索します。
  • 「解除」をクリックすると指摘の強調表示が解除されます。
制限事項(既知のバグ)

指摘表示が連続していると、指摘の内容を上手く確認できません。

見出しの表示


指定した文字列で始まる行を抽出し、一覧表示します。一覧をクリックすると該当する行へジャンプすることができます。行の先頭部分のパターンは正規表現を使って指定することもできます(要オプション選択)。上の図では「第|(」を見出し文字として指定していますので「第」か「(」で始まる行が一覧表示されます。見出しに共通する記号、たとえば■などを用いていれば、それを指定することで目次のように使うことができるので便利です。
また、行番号部分をダブルクリックしてマークしている場合、オプションの「マークした行を表示する」を利用することで、マークした行を一覧表示することもできます。

2008/06/30:デフォルトでは正規表現を利用しない単純な検索を利用するかたちに変更しました。正規表現を利用する場合は、パターン入力欄下方のオプションを選択して下さい。また、入力したパターンではなく、マークした行を一覧表示するオプションも用意しました。

文字数のカウント

編集中のファイルの文字数を数えます。
ファイル名、行数、合計文字数が表示されるほか、カーソル行までの文字数、カーソル行以降の文字数、原文(行頭に「#」が付いている行)の文字数と訳文の文字数、空白文字(タブ、スペースなど)の数がサイドバーに表示されます。

ソート

表示されているテキスト(選択されている場合はその部分のみ)を行単位で並び替えます。オプションとして昇順、降順、重複削除*2、逆転を選択することができます。並び順はUnicodeに基づき、「逆転」は並び順を単純に逆転します。

対訳DBとユーザー辞書

対訳DBのファイルの復元データのインポートを行うことができます。詳細についてはこちらをご覧下さい。
ユーザー辞書は新規作成切り替え編集を行うことができます。詳細についてはこちらをご覧下さい。

オプション

表示
  • フォント名:システムにインストールされているフォントのほか、Tkで定義されている「Times」と「Helvetica」を選択することができます。作者のおすすめは「Times」です*3
  • フォントサイズ:6〜24まで選択することができます。
  • 行間:1〜20まで選択することができます。
  • 折り返し方式:
    • 文字単位:日本語や中国語などスペースで単語間を区切らない言語は、文字単位で折り返すこの設定を選択してください。
    • 単語単位:英語などスペースで単語間を区切る言語は、この設定を選択すると単語単位で行の折り返しを行います。
    • 折り返さない:この設定を選択すると折り返しを行いません。
  • 折り返し位置を指定:
    • 画面右端で折り返し:文字数ではなく、画面の右端で行を折り返します。
    • 指定文字数で折り返し:折り返し位置を文字数で指定します。文字数は半角文字数単位ですので、80文字を指定した場合、テキストは全角40文字のあたりで折り返されます。なお、この文字数はあくまで目安であり、指定した文字数の場所で正確に折り返すわけではありません。
ファイル
  • デフォルトの文字コードと改行方式:
    システムのデフォルトの文字コードと改行方式を選択します。
  • 自動保存:
    自動保存する時間の間隔を設定します。1〜10分の間で選択することができます。0にすると自動保存が無効になります。
  • テーマの設定
    カラーテーマを切り替えます。コンボボックスにインストールフォルダの「color」フォルダに入っているカラーテーマが一覧表示されます。カラーテーマを選択して「OK」を押すとカラーテーマを切り替えることができ、同じタブ下部の「色の設定」で表示色の設定を行うことができるようになります。
    • コンボボックスの右側にある「新規作成」ボタンを押すと、新しいカラーテーマを作成するため、まず、カラーテーマ名の入力が促されます。適当なテーマ名(たとえばTest)を入力すると、デフォルトの設定データが読み込まれ、「color」フォルダに新しいテーマファイルが作成されます。下部の「色の設定」で各部分の色を設定し、「OK」または「適用」を押すとデータが保存されます。
    • インストール時のカラーテーマは「blue.dat」です。全体に真っ黒の「black.dat」とシンプルな「simple.dat」も同梱されています。
  • 色の設定:
    メイン画面の文字色など設定部分を選択し、各部分の色を設定します。
    • 設定項目:色を設定する項目を選択します。選択すると右側の「色名」に現在の色の設定値が表示されます。
    • 色名:選択した設定項目に対応する色を入力します。RGB値の16進数表記かTkのcolor name*4が利用できます。直接入力する場合は設定値を入力してリターンキーを押すと設定値を反映することができます。[...]ボタンを押して表示されるダイアログから設定することもできます。
強調表示
  • 強調表示ファイルの設定:
    テキストの強調表示に用いるデータファイルを選択します。強調表示の詳細については、こちらをご参照ください。
  • 対応する括弧:
    強調表示したい括弧のペアを入力します。入力時は、左右の対応する括弧を左、右の順で並べて記入してください。括弧の間にスペースなどを挟む必要はありません。
  • 空白文字を強調する:選択するとタブ、半角スペース、全角スペースを強調表示します。強調表示色は、「色」タブの「設定項目」の19〜21で設定します。
置換
  • 用語集を選択:
    設定を行う用語集を選択します。右側の用語集の追加、削除ボタンによって既存の用語集をコンボボックスに追加したり、削除したりすることができるます。
  • コマンドバーのボタン:
    一括置換用コマンドバーに表示するボタンの設定を行います。
    • ボタンのテキスト:ボタンに表示するテキストを入力します。
    • ボタンのイメージ:ボタンに表示する画像を選択します。
  • 置換のオプション:
    一括置換を実行する際のオプションを選択します。
    • スペースで区切る:置換前のテキストを置換後のテキストに置き換える際に、置換後のテキストの前後にスペースを挿入します。
    • 1文字以上はタグで強調:置換後のテキストを挿入する際、<と>で括ります。
    • Ghostで使用する:現在の用語集を対訳形式の一括置換であるGhostで利用します。
  • 区切り文字の設定:
    テキストを文章に分割するための区切り文字を設定します。
    • 設定選択:区切り文字セットを切り替えるためのコンボボックスです。英語、日本語、中国語など言語ごとに文章の区切り文字(句点)を設定し、処理対象に応じて切り替えることができます。
    • 区切り文字セットの作成および削除ボタン:「作成」ボタンを押すと、新しい区切り文字セットを作成することができます。新しいセットの名前(たとえば「英語用」など)を入力し、「区切り文字」に文章の分割に使う句点を半角スペースで区切って入力します。
    • 区切り文字:文章の分割に使う句点などを入力するための入力欄です。各区切り文字を半角のスペースで区切って入力します。
WEB検索と辞書

WEB検索
編集メニューの「WEB検索」で利用するサイトを登録(削除)します。WEB検索は、対訳エディタで選択したテキストを辞書サイトや検索サイトで検索するための機能です。対訳エディタでテキストを選択し、右クリックメニューから「WEB検索」→「サイト名」を実行すると、WEBブラウザが立ち上がり、指定したサイトで選択テキストを検索することができます。
WEBサイトの情報を登録
新しいサイトを登録する際は、右側にある「登録」ボタンを押下します。検索サイト(サイトの名称)、サイトのURLを入力した上で、文字コードを設定します。例えば、オンライン中国語辞書の北辞郎を登録する場合は、次のように入力します。

  1. 検索サイト:北辞郎
  2. サイトのURL:http://www.ctrans.org/cjdic/search.php?word=%s
  3. 文字コードutf-8

※WEB検索に登録できるサイトは、データのやりとりにGETを用いているサイトのみです。
サイトのURLは、検索語句が入る部分に「%s」を入力します。検索の際は、この部分が選択テキストに置き換えられます。文字コードは検索サイトに合わせて指定する必要があります。

各種サイトの登録例

ユーザー辞書
編集メニューの「ユーザ辞書を検索」で検索する辞書を切り替えます。

*1:拡張子がxmlのファイルです。Wordの保存メダイアログで「XMLドキュメント(*.xml)」を選択して作成します。

*2:重複する行をまとめた上で、昇順にソートします。

*3:日本語と中国語が混在していても比較的きれいに表示することができます

*4:http://www.tcl.tk/man/tcl8.5/TkCmd/colors.htm