翻訳メモリ機能

編集中のファイルまたは対訳データベースから、指定した文字列に類似する文字列を検索することができます。同じような表現が繰り返し出現する特許やマニュアル、法律などの翻訳作業の負担を大幅に軽減し、訳文の整合性を保つ上で力を発揮する機能です。

翻訳メモリ

  • 編集状態で検索したい文字列(行)の上で右クリックし、表示されるメニューから「ファジー検索」を選択します。
  • 検索用のサイドバーが表示されますので、類似度を設定し、検索対象(現在のファイルまたは対訳データベース)を選択した上で「Search」ボタンを押します。
  • 類似する文字列が見つかった場合は、サイドバー下方のテキストボックス内に該当する文字列が表示されます。編集中のテキストに類似文字列を挿入するためのリンクも表示されますので、この部分をダブルクリックすると、カーソル行の次の行に類似文字列が挿入されます。



処理の仕組みと検索結果

  • 現在のファイルを検索する際、検索対象の文字列の先頭が「#」である場合は、行頭に「#」がある行(原文)だけを対象に検索が行われます。検索結果では、先頭が#の行とその次の行を原文と訳文のペアと見なして対訳表示を行います。行の先頭が「#」でない場合は、ファイル全体を対象に検索が行われ(ただし、空白行やxinで改行を示すは無視されます)、ヒットした文字列が検索結果に表示されます。
  • 対訳データベースの検索では、常にデータベースの原文カラムを検索対象としてファジー検索が実行されます*1(検索結果は対訳形式で表示されます)。
  • 対訳データベースの検索では、検索結果は50件までしか表示されません。該当件数が多く、期待した結果が得られない場合は、類似度の数値を上げて絞り込みを行って下さい。

検索例

論語の検索
左側の画像は、検索文字列として「任重道远,士不可以不弘毅」を選択し、対訳データベースを検索したところです*2
1件のデータがヒットしていて、この検索文字列と論語のデータが類似していることが分かります。実際の論語のデータでは「士不可以不弘毅,任重而道远」(論語・泰伯)なのですが、語順が入れ替わっていたり、「任重而道远」が「任重道远」になっていたりしても類似していると判断し、検索結果に表示されます。
古典を少しもじったような言い回しは、現代中国語でもよく出てきますので、このように対訳データベースに古典データを保存しておくと何かと便利です。

注意事項

  • ファジー検索で検索される文字列は、サイドバー上部のテキストボックスに表示されている文字列です。この文字列は編集することができます。
  • 検索結果に表示される挿入用のリンクは、とてもシンプルな仕組みで動いています。具体的には、挿入のためにダブルクリックしたリンクの2行上の文字列をコピーし、それをメイン画面のカーソル行の次の行に挿入するという仕組みになっています。そのため、検索結果を編集するとうまく挿入できなくなることがあります。
  • 検索結果では検索文字列と一致した部分が強調表示されますが、対訳表示では原文にも訳文にも強調表示処理が適用されます。少し見難いですがシステムの仕様ということでご容赦ください。
  • 対訳データベースが大きくなると検索もそれだけ時間がかかります。コンピュータにも負荷がかかりますので、処理が終わるまでのんびりとお待ち下さい。

*1:つまり、訳文部分の検索はできません。

*2:対訳データベースへのデータ登録は自分で行う必要があります。