大学教授のショップ [ホリエモンのメルマガで副業として1番 に紹介されました!] 大学教授のショップ [ホリエモンのメルマガで副業として1番 に紹介されました!]

Python用 コピペだけで11の見える化・可視化手法を一気に実行して結果を比較する! プログラム・コード

データを準備するだけで、Python言語で11の見える化・可視化手法を一気に実行して結果を比較できるプログラム・コードです。11の可視化手法はこちらです。
■主成分分析 (Principal Component Analysis, PCA):線形の可視化手法であり、データセットのばらつきが大きい方向に新たな軸を作ることで、少ない軸でより多くの情報を表現できる。
■カーネル主成分分析 (Kernel Principal Component analysis, KPCA):PCAとカーネル関数を組み合わせた非線形の可視化手法。本プログラムではガウシアンカーネルを使用。カーネルの行列(グラム行列)の分散が最大になるようにRBFカーネルのパラメータの値を選択。
■因子分析 (Factor Analysis, FA):各変数の線形結合で表されるデータセットの共通因子を抽出する手法。
■多次元尺度構成法 (Multi Dimensional Scaling, MDS):すべてのサンプル間で計算された距離の行列に基づいて、その距離関係がなるべく成り立つように二次元にサンプルを写像する手法。距離としてユークリッド距離を使用。
■Isometric Mapping (Isomap):MDSではすべてのサンプル間で距離を計算したが、Isomapでは近傍のN個のみのサンプル間のみの距離の計算とすることで、局所的な構造を可視化。N=5としてあるが変更も可能。
■Locally Linear Embedding (LLE):あるサンプルが、その近傍のN個のサンプルの線形結合で表現できるとか仮定し、その線形結合の重みが写像先でも一致するように二次元マップを作る。N=5としてあるが変更も可能。
■Modified LLE (MLLE):LLEに正則化項を取り入れた手法。N=5としてあるが変更も可能。
■Hessian-based LLE (HLLE):MLLEと同様にLLEの正則化問題を回避した手法。N=10としてあるが変更も可能。
■Spectral Embedding (SE):サンプル間の隣接行列をスペクトル分解することで可視化する手法。k最近傍法により隣接行列を計算。k=5としてあるが変更も可能。
■Radial Basis Function-based SE (RBFSE):隣接行列の作成にRadial Basis Function (RBF)を使用したSE。カーネルの行列(グラム行列)の分散が最大になるようにRBFカーネルのパラメータの値を選択。
■t-distributed Stochastic Neighbor Embedding (tSNE):非線形の可視化手法。見える化・可視化したいデータセットがあり、それを二次元マップ上で確認することが目的。Perplexityを30にしてあるが変更も可能。

以下のURLからzipファイルをダウンロードしてください。
http://univprofblog.html.xdomain.jp/code/visall_analysis_all_e_python_pass.zip
購入していただくと、zipファイルを解凍するためのパスワードが表示されます。

複数の可視化手法によるデータセットの見える化については下のURLのページをご覧ください。
http://univprof.com/archives/17-02-21-12639621.html

このプログラムはcsvファイルによってデータのやり取りをします。csvファイルのデータ形式およびサンプルデータについては下のURLのページをご覧ください。
https://note.mu/univprof/n/n694487325cb1

プログラムを実行するときのPython環境については下のURLのページをご覧ください。
https://note.mu/univprof/n/nb07629b23252

また下のURLのzipファイルもダウンロードして下さい。
http://univprofblog.html.xdomain.jp/code/supportingfunctions.zip
解凍すると必要なスクリプトと関数があります(こちらは無料です)。解凍した後に、今回のプログラムのディレクトリ(フォルダ)と同じところにすべてのファイルを置いてください。

あとは購入されたプログラムを実行するだけです。

計算終了後、自動的に結果が画面に出てきて、最後に以下のcsvファイルが同じディレクトリ(フォルダ)に保存されます。
■ScoreAll.csv ・・・ それぞれの可視化手法における各サンプルの二次元座標