2019年2月27日 (水) 15:07時点における版編集 Tarepan (会話 \| 投稿記録) 拡張承認された利用者 2,335 回編集 m 見出しレベル変更タグ: ビジュアルエディター ← 古い編集		2019年2月27日 (水) 15:30時点における版編集取り消し Tarepan (会話 \| 投稿記録) 拡張承認された利用者 2,335 回編集概要の冗長な表現、およびリンク切れ参考文献由来の内容を削除タグ: ビジュアルエディター新しい編集 →
3行目: == 概要 == 機械学習では、[[センサ]]や[[データベース]]など~~から、あ~~に由来する~~程度の数の~~サンプルデータ集合を入力して解析を行い、そのデータから有用な規則、ルール、知識表現、判断基準などを抽出し、[[アルゴリズム]]を発展させ~~る。なお、データ集合を解析するので、[[統計学]]との関連が深い。また[[人工知能]]における研究課題の一つでもあ~~る。そのアルゴリズムは、~~第一に~~まずそのデータが（訓練例と呼ぶ）を生成した潜在的機構の特徴（[[確率分布]]）を捉え、複雑な関係を識別~~（すなわち~~・定量化）する。第二次にその学習・識別したパターンを用いて、新たなデータについて予測・決定を行う。データは、観測された変数群のとりうる関係の具体例と見ることができる。一方、アルゴリズムは、機械[[学習]]者として観測されたデータの部分（訓練例などと呼ぶ）を学習することで、データに潜在する[[確率分布]]の特徴を捉え、学習によって得た知識を用いて、新たな入力データについて知的な決定を行う<ref name=Wernick-Signal-Proc-July-2010>Wernick, Yang, Brankov, Yourganov and Strother, Machine Learning in Medical Imaging, ''IEEE Signal Processing Magazine'', vol. 27, no. 4, July 2010, pp. 25-38 </ref>。 1つの根本的な課題は、~~観測例に~~全てのと取りうる挙動データを訓練例~~を示すあらゆる入力を~~（学習データ）に含めるのは（多くの実用的な関心事の場合）データ数が大きすぎて現実的でないという点である。したがって~~、学習者~~アルゴリズムは与え限られた訓練例を一般化して、新たなデータ入力から有用な出力を生成しなければならない<ref name=Wernick-Signal-Proc-July-2010/>。機械学習は[[検索エンジン]]、[[医療診断]]、[[スパム (メール)\|スパムメール]]の検出、金融市場の予測、[[デオキシリボ核酸\|DNA]]配列の分類、[[音声認識]]や[[光学文字認識]]などの[[パターン認識]]、ゲーム戦略、[[ロボット]]、など幅広い分野で用いられている。応用分野の特性に応じ~~て学習手法も適切に選択する必要があり、~~た様々な学習手法が提案されている<ref>それらの手法は、''Machine Learning'' や ''IEEE Transactions on Pattern Analysis and Machine Intelligence'' などの学術雑誌などで発表されることが多い。</ref>。これらの手法は、[[テストデータ]]においての検出・予測性能において評価されることがある。大量のデータから従来にない知見を得るという[[ビッグデータ]]の時代では、特にその応用に期待が集まっている<ref>[http://www.mizuho-ir.co.jp/publication/navis/017/special.html もう一度「ビッグデータ」を考える]</ref>。▼ [[光学文字認識]]では、印刷された活字を事前の例に基づいて自動認識する。これは典型的な機械学習の応用例である<ref name=Wernick-Signal-Proc-July-2010/>。 ▲機械学習は[[検索エンジン]]、[[医療診断]]、[[スパム (メール)\|スパムメール]]の検出、金融市場の予測、[[デオキシリボ核酸\|DNA]]配列の分類、[[音声認識]]や文字認識などの[[パターン認識]]、ゲーム戦略、[[ロボット]]、など幅広い分野で用いられている。応用分野の特性に応じて学習手法も適切に選択する必要があり、様々な手法が提案されている<ref>それらの手法は、''Machine Learning'' や ''IEEE Transactions on Pattern Analysis and Machine Intelligence'' などの学術雑誌などで発表されることが多い。</ref>。これらの手法は、[[テストデータ]]においての検出・予測性能において評価されることがある。大量のデータから従来にない知見を得るという[[ビッグデータ]]の時代では、特にその応用に期待が集まっている<ref>[http://www.mizuho-ir.co.jp/publication/navis/017/special.html もう一度「ビッグデータ」を考える]</ref>。 == 定義 == 174 ⟶ 172行目: * [[言語獲得]] * [[ワトソン (コンピュータ)]] [[統計学]] [[人工知能]] *[[ビッグデータ]] == 外部リンク ==

「機械学習」の版間の差分