MLTP: MultiLingual Text Processor

MLTP(MultiLingual Text Processor)は、日本語、中国語、韓国語、英語などの平テキスト、自由なタグ付きテキスト、形態素解析結果、構文解析結果における項目のn-gramや共起などの集計を主とするツール。

集計結果は、専用の統計解析やデータマイニングツールによる処理を前提としている。ツールはJava言語により作成しており、jar形式で公開している。

外部リンク編集

参考文献編集

  • 金明哲 『テキストデータの統計科学入門』岩波書店、2009年。ISBN 9784000057028 
  • 石田基広&金明哲 『コーパスとテキストマイニング』共立出版、2012年。ISBN 4320110331