Xinを利用した翻訳作業

Xinを使った翻訳作業の手順は次の通りです。

  1. まず原文を読み込みます。
  2. テキストに応じた区切り文字を選択します。
  3. 適宜用語集を選んでGhostを実行する。
  4. 原文の下に一括置換後のテキストが挿入されますので、この部分を編集するかたちで翻訳作業を進めます。
  5. 翻訳作業が完了したらVacuumを実行します。これによって訳文だけの状態に整形することができます。

以下、実際の画面を見ながら翻訳作業の様子を紹介します。

原文を読み込み

既存のテキストファイルを開く場合は、ファイルメニューの「開く」を実行します。Xinのデフォルトの文字コードは「UTF-8」ですので、それ以外の文字コードのファイルを開く場合は、同じくファイルメニューの「文字コードを指定して開く」を実行すると、文字コードと改行コードを選択することができます。
他のアプリケーションからテキストを貼り付ける場合は、右クリックメニューの「貼り付け」、ツールバーの「paste」ボタン、ショートカットキーのCtrl-Vなどを利用することができます。
とりあえず試してみたい場合は、ファイルメニューの「開く」を実行し、Xinのインストールフォルダにある「test」フォルダ内の「Spirit.txt」を開いてみて下さい。*1

テキストに応じた区切り文字を選択

次にテキストを文章単位に分割するための区切り文字を指定します。
ツールメニューのオプションを実行して設定ダイアログを出します。同ダイアログの置換タブに「Ghostの区切り文字」を設定するコンボボックスがあります。インストール時には「中国語」「日本語」「英語」を文章単位に区切るための文字セットが登録されていますので、処理対象のテキストに応じて設定を切り替えて下さい。文章単位にうまく区切れない場合は、この区切り文字セットを編集します。

テキストを文章単位に区切る理由:
Ghostでテキストを文章単位に区切るのは、Vacuumの際に対訳データを文章単位で登録するためです。Xinにはいずれ翻訳メモリ機能が実装される予定ですので、文章単位で対訳データを扱う方が都合が良い、という判断に基づき、テキストを分割しています。

用語集を選択

Xinでは複数の用語集を切り替えて一括置換を行うことができます。分野ごとに「会計用語集.dat」や「環境用語集.dat」を用意したり、校正用の用語集を用意したりしておいて、対象テキストに応じて切り替えて利用するかたちです。
ここではXinに同梱の「xin.dat」を選択します。先ほどと同様、設定ダイアログの置換タブで「用語集の選択」を行います。xin.datを選択した上で「1文字以上はタグで強調」と「Ghost処理に使用」にチェックを入れて「OK」ボタンをクリックして下さい。

※「xin.dat」にはいくつかの置換データが登録されています。「Spirit.txt」に適用するとそれなりに置換が行われますが実用には耐えません。あくまでサンプルですので、実際に利用するにはデータを拡充する必要があります。

Ghostの実行と翻訳作業

クリックして大きな画像を確認
設定が終わったら、ファイルを開いた状態でツールバー上のGhostボタンをクリックします。
右の画像のように「Spirit.txt」のテキストが文章単位に分割されて、原文と一括置換適用後の文字列が対訳表示されます。複数の置換が行われて中国語に対応する日本語が挿入されているのが確認できます。なお、先ほど置換オプションの設定で「1文字以上をタグで強調」をチェックしたのでいくつかの単語が<と>で囲まれ、強調表示されています。
これで翻訳作業の準備が完了しました。上部の原文を参照しながら、下部の置換後のテキスト部分を編集していきます。固有名詞などを置換用語集に登録しておくと、1回のGhostでテキスト中の該当個所をすべて変換してくれるので、繰り返し入力する手間が省けます。
 置換用語集の編集

なお、ツールバーのGhostボタンをマウスオーバーするとステータスバーに現在の選択されているGhost用の用語集が表示されます。

翻訳完了とVacuumの実行

クリックして大きな画像を確認
翻訳作業が完了したら、Vacuumを実行して原文を削除します。
ツールバーの「vacuum」ボタンをクリックし、「原文を削除し、DBに保存する」を実行します。
このコマンドによって、テキストから原文を削除すると同時に、原文と訳文をペアにした対訳データを専用の訳文データベースに格納します。訳文データベースは、後からいつでも検索することができます。
なお、テキストの原文部分に((置換前|置換後))形式でデータを記述しておくと、Vacuumの実行時に抽出されて、Ghost用の用語集にデータが自動登録されます。サイドバーから用語集を編集する必要がなく、翻訳作業をしながら単語の情報をメモすることができます。
 Vacuum

*1:このファイルの文字コードUTF-8ですので特に設定をいじる必要はありません。