「機械学習」の版間の差分

削除された内容 追加された内容
m 見出しレベル変更
概要の冗長な表現、およびリンク切れ参考文献由来の内容を削除
3行目:
 
== 概要 ==
機械学習では、[[センサ]]や[[データベース]]などから、あに由来す程度の数のサンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出し、[[アルゴリズム]]を発展させる。なお、データ集合を解析するので、[[統計学]]との関連が深い。また[[人工知能]]における研究課題の一つでもある。
 
そのアルゴリズムは、第一にまずそのデータ(訓練例と呼ぶ)を生成した潜在的機構の特徴([[確率分布]])を捉え、複雑な関係を識別(すなわち定量化する。第二その学習・識別したパターンを用いて新たなデータについて予測・決定を行う。データは、観測された変数群のとりうる関係の具体例と見ることができる。一方、アルゴリズムは、機械[[学習]]者として観測されたデータの部分(訓練例などと呼ぶ)を学習することで、データに潜在する[[確率分布]]の特徴を捉え、学習によって得た知識を用いて、新たな入力データについて知的な決定を行う<ref name=Wernick-Signal-Proc-July-2010>Wernick, Yang, Brankov, Yourganov and Strother, Machine Learning in Medical Imaging, ''IEEE Signal Processing Magazine'', vol. 27, no. 4, July 2010, pp. 25-38 </ref>。
 
1つの根本的な課題は、観測例に全てのりうる挙動データを訓練を示すあらゆる入力を(学習データ)に含めるのは(多くの実用的な関心事の場合)データ数が大きすぎて現実的でないという点である。したがって、学習者アルゴリズム与えられた訓練例を一般化して、新たなデータ入力から有用な出力を生成しなければならない<ref name=Wernick-Signal-Proc-July-2010/>。
 
機械学習は[[検索エンジン]]、[[医療診断]]、[[スパム (メール)|スパムメール]]の検出、金融市場の予測、[[デオキシリボ核酸|DNA]]配列の分類、[[音声認識]]や[[光学文字認識]]などの[[パターン認識]]、ゲーム戦略、[[ロボット]]、など幅広い分野で用いられている。応用分野の特性に応じて学習手法も適切に選択する必要があり、様々な学習手法が提案されている<ref>それらの手法は、''Machine Learning'' や ''IEEE Transactions on Pattern Analysis and Machine Intelligence'' などの学術雑誌などで発表されることが多い。</ref>。これらの手法は、[[テストデータ]]においての検出・予測性能において評価されることがある。大量のデータから従来にない知見を得るという[[ビッグデータ]]の時代では、特にその応用に期待が集まっている<ref>[http://www.mizuho-ir.co.jp/publication/navis/017/special.html もう一度「ビッグデータ」を考える]</ref>。
[[光学文字認識]]では、印刷された活字を事前の例に基づいて自動認識する。これは典型的な機械学習の応用例である<ref name=Wernick-Signal-Proc-July-2010/>。
 
機械学習は[[検索エンジン]]、[[医療診断]]、[[スパム (メール)|スパムメール]]の検出、金融市場の予測、[[デオキシリボ核酸|DNA]]配列の分類、[[音声認識]]や文字認識などの[[パターン認識]]、ゲーム戦略、[[ロボット]]、など幅広い分野で用いられている。応用分野の特性に応じて学習手法も適切に選択する必要があり、様々な手法が提案されている<ref>それらの手法は、''Machine Learning'' や ''IEEE Transactions on Pattern Analysis and Machine Intelligence'' などの学術雑誌などで発表されることが多い。</ref>。これらの手法は、[[テストデータ]]においての検出・予測性能において評価されることがある。大量のデータから従来にない知見を得るという[[ビッグデータ]]の時代では、特にその応用に期待が集まっている<ref>[http://www.mizuho-ir.co.jp/publication/navis/017/special.html もう一度「ビッグデータ」を考える]</ref>。
 
== 定義 ==
174 ⟶ 172行目:
* [[言語獲得]]
* [[ワトソン (コンピュータ)]]
*[[統計学]]
*[[人工知能]]
*[[ビッグデータ]]
 
== 外部リンク ==