(旧) ヒノマルクのデータ分析ブログ

どんな企業、地域、国でも働けるようなスキルを身につけていくブログ

PythonやBIツールを使って分析と可視化をします

Python

[Python] その2の2 ボストンの住宅価格を重回帰分析ver2で予測してみた

重回帰分析を以前やりましたが、 説明変数はマニュアル方式で 集計結果のグラフを見ながら選んでいました。 今回はバージョンアップして全ての説明変数の組み合わせを 試して一番精度がよいモデルを選択するプログラムを組みました。 精度の評価方法は色々あ…

【予測結果まとめ】ボストンの住宅価格 (Boston housing prices corrected)

どうもhinomarucです。ずっとやらないといけないと思っていたことですが、今までPythonで機械学習で作成したボストンの住宅価格の予測モデルの結果をまとめました。 結果のまとめ 精度の良さ 指標 単回帰 重回帰 多項式回帰 (n=2) ニューラルネット サポート…

その9 ボストンの住宅価格をアンサンブル学習(Voting regressor)で予測してみた

どうもhinomarucです。 複数のモデルを組み合わせて、 精度がよいアウトプットを作ることは kaggleなどのコンペをみてやってみたいと 思っていました。 アンサンブル学習の一つである、voting regressorで 住宅価格を予測してみました。 A voting regressor …

その8 ボストンの住宅価格をXGBoostで予測してみた(Grid Searchでパラメータチューニング有)

12月に入って初めての投稿です。hinomarucです。 今回はXGBoostのパラメータチューニングをGrid Searchで行いました。 事前に試したいパラメータを定義しておき、一番精度のよい組み合わせを発見する方法です。 最適なパラメータを見つける方法はGrid Search…

その7 ボストンの住宅価格をXGBoostで予測してみた

住宅価格を予測するにあたって、 様々な機械学習アルゴリズムを試してみました。 今回はXGboostを試してみました。 コンペなどで使われることが多く、 上位に入賞するにはほぼマストで 試してみる必要があるアルゴリズムですね。

その6 ボストンの住宅価格をランダムフォーレストで予測してみた

今回はランダムフォーレスト(Random Forest)で ボストンの住宅価格を予測してみました。 数年前はRandom Forestがよく使われていたイメージですが、 いまはXgBoostとかになりましたね。 以前の案件で、あいまいなデータから予測モデルを作る必要があり、Rand…

その5 ボストンの住宅価格をサポートベクター回帰(SVR)で予測してみた

いつものボストン住宅価格の予測モデル作成です。 今回はサポートベクター回帰というものを 使ってみました。 サポートベクターマシーン(SVM)という名前は分類問題で よく聞きましたが、SVMの概念を回帰に適用したものをサポートベクター回帰(Support Vector…

その4 ボストンの住宅価格をニューラルネットワークで予測してみた

今回はニューラルネットワークでボストンの住宅価格を予測しました。前回、多項式回帰でかなり精度を上げることができたので、 このまま波に乗りたいところです。 ニューラルネットワークは、教師信号(正解)の入力によって問題に最適化されていく教師あり…

その3 ボストンの住宅価格を多項式回帰で予測してみた

どうもhinomarucです。 今回は多項式回帰を試す 多項式回帰とは? 統計学における多項式回帰(たこうしきかいき、英: polynomial regression)とは、従属変数 y を独立変数 x の n 次多項式でモデル化する回帰分析の一手法である。多項式回帰は、従属変数と…

[Python] その2 ボストンの住宅価格を重回帰分析で予測してみた

下記記事の続編になります。 hinomaruc.hatenablog.com 前回の記事では、ボストンの住宅価格 (Boston housing prices)のデータセットの説明を書いたので、データの理解をしたい方はこちらへどうぞ 前回は単回帰での住宅価格の予測ですが、今回は重回帰で予測…

ボストンの住宅価格を単回帰分析で予測してみた

前回数値予測が可能なサンプルデータセットをやろうと記事にしていましたが、 候補データを選定しました。町の住宅価格の中央値を周辺環境から予測するといった 回帰分析向けのサンプルデータになります。場所はボストンで1970年代とかなり古めのデータにな…

既婚女性の不倫傾向の集計をしてみた

このデータセットは3,4年くらい前に当時のチームメンバーにPythonでデータ分析する方法を共有したときのサンプルデータとして利用しました。 単純にロジスティック回帰でモデリングするコードを順に説明しただけなので、もう少しデータの中身を詳しく説明す…

アイリスデータであやめの種類を決定木分析で分類してみた

今回見ていくデータはフィッシャーのアイリス(アヤメ)データセットです。 分類問題やクラスタリングのサンプルコード紹介でよく利用されるデータです。フィッシャーという方が論文で紹介したのが始めだったんですね。下記表の一番上にあるのが、アヤメのよう…