大学教授のショップ [ホリエモンのメルマガで副業として1番 に紹介されました!] 大学教授のショップ [ホリエモンのメルマガで副業として1番 に紹介されました!]

Python用 コピペだけで12の変数選択手法を一気に実行して結果を比較する! プログラム・コード

¥9,500

データを準備するだけで、Python言語で12の変数選択手法を一気に実行して結果を比較できるプログラム・コードです。12の変数選択手法はこちらです。
■相関係数による変数選択:すべての変数の間の相関係数を計算し、その絶対値が大きい変数の組の一方を削除する。最初は相関係数の絶対値の閾値を0.9にしているが、変更もできる。
■Variable Importance in Projection (VIP):Partial Least Squares (PLS) を実施した後のVIPという指標を用いて、VIPの値が大きい変数のみを選択する。最初はVIPの値の閾値を1にしているが、変更もできる。
■PLS-β:PLSを実施した後の標準回帰係数の絶対値を用いて、その値が大きい変数を選択する。最初は閾値を標準回帰係数の絶対値の中央値にしているが、変更もできる。
■PLSの繰り返しによる変数選択:不要な変数を一つずつ削除しながら、ダブルクロスバリデーション( http://univprof.com/archives/16-06-12-3889388.html )の結果が良くなるように変数を選択する手法。詳しくはこちら( http://univprof.com/archives/16-11-22-8587099.html )。
■Least Absolute Shrinkage and Selection Operator (LASSO):LASSOではモデルに寄与しない変数の標準回帰係数の値が0になりやすい。標準回帰係数の値が0でない変数のみ選択する。
■Elastic Net (EN):ENでもLASSOと同様に標準回帰係数の値が0になりやすい。0でない変数を選択する。
■Random Forest (RF) の変数の重要度に基づく変数選択:RFを実行した後の変数の重要度が大きい変数を選択する。
■Stepwise Ordinary Least Squares (OLS):OLSによるモデル構築を繰り返して、変数を1つずつ削除しながら、クロスバリデーション適した変数の組み合わせを選択する。
■Stepwise Linear Support Vector Regression (LSVR):Stepwise OLSのOLSをLSVRにした手法。
■Stepwise Ridge Regression (RR):Stepwise OLSのOLSをRRにした手法。
■Stepwise LASSO:Stepwise OLSのOLSをLASSOにした手法。
■Stepwise EN:Stepwise OLSのOLSをENにした手法。

以下のURLからzipファイルをダウンロードしてください。
http://univprofblog.html.xdomain.jp/code/varselall_analysis_all_e_python_pass.zip
購入していただくと、zipファイルを解凍するためのパスワードが表示されます。

このプログラムで実行される流れについては下のURLのページをご覧ください。
http://univprof.com/archives/17-02-09-12105097.html

このプログラムはcsvファイルによってデータのやり取りをします。回帰分析用のcsvファイルのデータ形式およびサンプルデータについては下のURLのページをご覧ください。なお今回はdata_prediction1.csv, data_prediction2.csvは必要ありません。
https://note.mu/univprof/n/n694487325cb1

プログラムを実行するときのPython環境については下のURLのページをご覧ください。
https://note.mu/univprof/n/nb07629b23252

また下のURLのzipファイルもダウンロードして下さい。
http://univprofblog.html.xdomain.jp/code/supportingfunctions.zip
解凍すると必要なスクリプトと関数があります(こちらは無料です)。解凍した後に、今回のプログラムのディレクトリ(フォルダ)と同じところにすべてのファイルを置いてください。

あとは購入されたプログラムを実行するだけです。

計算終了後、自動的に結果が画面に出てきて、最後に以下のcsvファイルが同じディレクトリ(フォルダ)に保存されます。
■CalculatedY.csv ・・・ それぞれの回帰分析手法(PLS, LASSO, EN, RF, LSVR, RR)におけるモデル構築用データの目的変数の計算値
■PredictedYcv.csv ・・・ それぞれの回帰分析手法(PLS, LASSO, EN, RF, LSVR, RR)におけるモデル構築用データの目的変数のクロスバリデーション予測値
■StatisticsAll.csv ・・・ それぞれの回帰分析手法におけるモデル構築用データのr^2・RMSE、クロスバリデーション後のr^2cv・RMSEcvの値
■SelectedVariable.csv ・・・ 12の変数選択手法で選択された変数と、変数ごとの選択された回数
■ScoreAll.csv ・・・ 以下のような各変数選択手法における変数ごとのスコアの値
・PLSの標準回帰係数の絶対値
・VIPの値
・LASSOの標準回帰係数の絶対値
・ENの標準回帰係数の絶対値
・RFにおける変数ごとの重要度
・Stepwise OLSにおける変数のランキング
・Stepwise LSVRにおける変数のランキング
・Stepwise RRにおける変数のランキング
・Stepwise LASSOにおける変数のランキング
・Stepwise ENにおける変数のランキング