• 用語解説

ホーム> 制度・手続> 法令・施策> 施策・取組> 特許文献等の機械翻訳> 特許文献機械翻訳の辞書等の作成

ここから本文です。

特許文献機械翻訳の辞書等の作成

特許庁では、特許文献の機械翻訳の精度向上のため、機械翻訳辞書、対訳コーパス(※)を作成し、一般にも提供しております。

  • ※「対訳コーパス」:異なる言語の翻訳関係にある文と文の対。機械翻訳の方式の一つである統計的機械翻訳においては、対訳コーパスを学習させることにより、システムの構築や翻訳精度の向上を実現できる。

日英機械翻訳辞書

特許庁は、平成12年3月より特許電子図書館(現在は独立行政法人工業所有権情報・研修館(INPIT)が運営するJ-PlatPat)において、日本語の公報を英語に機械翻訳するサービスを行っております。このサービスで使用する機械翻訳辞書として、特許庁およびINPITは、平成31年まで毎年約5000語の辞書作成を行っていました。これにより作成した辞書を、下記のリンクからダウンロードしてご利用いただけます。

日英機械翻訳用辞書におけるデータの不備等を発見した場合には、下記お問い合わせ先まで御連絡ください。

また、アジア太平洋機械翻訳協会(AAMT)では、上記辞書データを変換し、UTX形式として公開(外部サイトへリンク)をしております。

中日機械翻訳辞書・対訳コーパス

中国語の特許文献を日本語で調査できるようにするため、高精度の機械翻訳を活用する必要性が高まってきたことから、特許庁では平成24年度より、中国と日本のパテントファミリー等を材料として、中日機械翻訳辞書を作成しております。

平成27年度の辞書作成に関する調査事業

  • 中国特許文献の機械翻訳のための辞書整備及び機械翻訳の品質評価に関する調査
    報告書(PDF:12.6MB)

平成26年度の辞書作成に関する調査事業

平成25年度の辞書作成に関する調査事業

平成24年度の辞書作成に関する調査事業

  • 中国特許文献の機械翻訳のための中日辞書整備及び機械翻訳性能向上に関する調査
    概要版(PDF:599KB)
中日機械翻訳辞書・対訳コーパスの仕組み
 

中日機械翻訳辞書を作成する過程で生成された中日対訳コーパスを「アジア翻訳ワークショップ(WAT)」に提供しております。

(参考)アジア翻訳ワークショップ(WAT)(外部サイトへリンク)

[更新日 2024年3月5日]

お問い合わせ

特許庁総務部総務課情報技術統括室特許情報利用推進班

電話:03-3581-1101 内線2361

FAX:03-3592-8838

お問い合わせフォーム