データ分析テクニック

データ分析テクニック4

In マーケティング by admin

Artificial neural network

物の神経回路網(中枢神経系、脳など)のニューロンがシナプスを介して結合されるように、複数の関数の集合と各集合に対する重みを調整して分類/予測するアルゴリズムです。
人工の神経回路網分析の最大の特徴は学習が可能である点です。
人工の神経回路網の基本学習原理は新しいの観測値が発見された場合、Cost functionを最小化する関数を探していく動作します。
神経回路網の複雑さに応じて、結果を得るまでにかかる時間が増加するという欠点があります。
しかし、変数の種類に拘らず非線形の組み合わせが可能なため、予測力が優れているという点のため(AlphaGoも人工の神経回路網ベースのアルゴリズムを採用しました。)注目されています。


Ensemble Learning

じデータセットに複数の予測/分類アルゴリズムを作成し、その結果を総合して、より優れた結果を得ようとする方法です。主に、演算速度が速いアルゴリズムの統合に使用されます。(例: Decision TreeForest)
Netflix Prizeで受賞したチームも、この方法を使用したそうです。複数のこのアルゴリズムを参照している限り精度が高まりますが、演算速度が遅い欠点があります。実際にNetflixでも1位のチームのこのアルゴリズムが推奨精度はもっと高かったですが、速度の問題でこのアルゴリズムを採用していなかったそうです。。


Naive Bayesian Classifier

性の間の独立を仮定したベイズの定理を適用した分類アルゴリズムです。
例えば、嵐がアイドルである確率(上手なダンス、適切な歌の実力、体つき/比率など)が、それぞれ関連がないと仮定して、それぞれの特性が嵐がアイドルである確率に独立して寄与するものと見なします。
ナイーブベイズは、伝統的な確率論に基づいたアルゴリズムはありませんが、他の進歩された分類のアルゴリズムと比較した時も非常に予測力が高いと知られています。
主に文書のテキストを確認して、どの文書がどのカテゴリ(スパム/非スパム)に属しているか、どのようなニュアンス(支持/批判/ニュートラルなど)を持っているかどうかなどを判断する問題に最も頻繁に登場するアルゴリズムです。