Apertium

機械翻訳のプラットフォーム。オープンソースのルール基準型

Apertiumは、スペイン政府とカタルーニャ州政府がアリカンテ大学に資金援助して開発されている機械翻訳プラットフォーム。フリーソフトウェアであり、GNU General Public License でリリースされている。

Apertium
最新版
3.3.2 / 2016年1月2日 (8年前) (2016-01-02)
リポジトリ ウィキデータを編集
プログラミング
言語
C++
対応OS POSIX互換
対応言語 多言語
種別 機械翻訳
ライセンス GNU General Public License
公式サイト www.apertium.org
テンプレートを表示

もともとはOpenTradというプロジェクトの一環として開発され始めた複数の機械翻訳エンジンの1つであり、言語的に近い言語間での翻訳向けに設計されていた。その後、もっと離れた言語間の翻訳も扱うよう拡張されてきた。新たな言語を対象として加えるには、言語データ(辞書、ルールなど)を既定のXMLフォーマットで作成すればよい。

言語データ作成には、ビーゴ大学カタルーニャ工科大学ポンペウ・ファブラ大学が協力している。既に(安定版で)言語データが作成済みの言語としては、バスク語ブルトン語カタルーニャ語英語エスペラントフランス語ガリシア語アイスランド語オック語ポルトガル語ルーマニア語スペイン語ウェールズ語がある。今ではいくつかの企業もApertium開発に参加している(Prompsit Language Engineering、Imaxin Software、Eleka Ingeniaritza Linguistikoa など)。

Apertiumは「浅い」機械翻訳システムであり、有限状態トランスデューサを使って語彙の変換を行い、隠れマルコフモデルを使って品詞タグ付けや単語カテゴリの曖昧さの処理を行う。言語の組合せによっては(例えば、ブルトン語フランス語制約文法タグ付け器も使うことがある。

2009年の Google Summer of Code では9プロジェクトが採用された[1]

脚注・出典 編集

参考文献 編集

  • Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" in Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005, pp. 79–86
  • Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" in Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006], p 50-59.

関連項目 編集

関連文献 編集

  • Alberto Simões; Xavier Gómez Guinovart; José João Almeida. "Editorial ". (カタルーニャ語). Linguamática, v1. 2009.
  • Bartosz Jarmuż. Machine Translation Development of an experimental machine translation system based on Apertium engine. 電子書籍 (ドイツ語). Saarbrücken : LAP LAMBERT Academic Publishing, 2012. OCLC 863875547.
  • Alexia Bos i Solé; Miquel Strubell i Trueta. Les fronteres del multilinguisme : una visio actual i pluridisciplinar sobre el multilinguisme en la societat contemporania . 電子書籍 (カタルーニャ語). Barcelona : Editorial UOC, abril 2013. OCLC 902819849.
  • Fernand De Varennes; Mikel L Forcada; Jeremy Evas. Les fronteres del multilingüisme : una visió actual i pluridisciplinar sobre el multilingüisme en la societat contemporània. 電子書籍 (カタルーニャ語). Barcelona : Editorial UOC, 2013. OCLC 829432099.
  • Adam Przepiórkowski; Maciej Piasecki; Krzysztof Jassem; Piotr Fuglewicz. Computational Linguistics : Applications 電子書籍 (英語). Berlin, Heidelberg : Springer Berlin Heidelberg, 2013. OCLC 1010679169.
  • Aida Sundetova; Aidana Karibayeva; Ualsher Tukeyev. "Structural Transfer Rules for Kazakh-to-English Machine Translation in the Free/Open-source Platform Apertium." (英語). Türkiye Bilişim Vakfı Bilgisayar Bilimleri ve Mühendisliği Dergisi, v2 n7: 48-53. 2014-12-21.
  • Mireia Ginestí Rossell; Mikel L. Forcada Zubizarreta . "La traducció automàtica en la pràctica: aplicacions, dificultats i estratègies de desenvolupament." (カタルーニャ語). Caplletra: Revista Internacional de Filologia, n46: 43-60. 2014.
  • Sánchez-Cartagena Víctor M.; Pérez-Ortiz Juan Antonio; Sánchez-Martínez Felipe. "RuLearn: an Open-source Toolkit for the Automatic Inference of Shallow-transfer Rules for Machine Translation." (英語). Prague Bulletin of Mathematical Linguistics, v106 n1: 193-204. 2016.
  • Víctor M. Sánchez-Cartagena; Juan Antonio Pérez-Ortiz; Felipe Sánchez-Martínez. "RuLearn: an Open-source Toolkit for the Automatic Inference of Shallow-transfer Rules for Machine Translation". The Prague Bulletin of Mathematical Linguistics, v106, n1: 193-204. 2016-10-15.
  • Gianfranco Fronteddu; Hèctor Alòs i Font; Francis M. Tyers. "Machine translation from Catalan to Sardinian: a translation tool for a language in the process of standardisation." (カタルーニャ語). Linguamática, v9, 2017.
  • Mikel L. Forcada. "Apertium: traducció automàtica de codi obert per a les llengües romàniques". (カタルーニャ語). Linguamática, v1, 2018-04-30.

外部リンク 編集