Python
重回帰分析を以前やりましたが、 説明変数はマニュアル方式で 集計結果のグラフを見ながら選んでいました。 今回はバージョンアップして全ての説明変数の組み合わせを 試して一番精度がよいモデルを選択するプログラムを組みました。 精度の評価方法は色々あ…
どうもhinomarucです。ずっとやらないといけないと思っていたことですが、今までPythonで機械学習で作成したボストンの住宅価格の予測モデルの結果をまとめました。 結果のまとめ 精度の良さ 指標 単回帰 重回帰 多項式回帰 (n=2) ニューラルネット サポート…
どうもhinomarucです。 複数のモデルを組み合わせて、 精度がよいアウトプットを作ることは kaggleなどのコンペをみてやってみたいと 思っていました。 アンサンブル学習の一つである、voting regressorで 住宅価格を予測してみました。 A voting regressor …
12月に入って初めての投稿です。hinomarucです。 今回はXGBoostのパラメータチューニングをGrid Searchで行いました。 事前に試したいパラメータを定義しておき、一番精度のよい組み合わせを発見する方法です。 最適なパラメータを見つける方法はGrid Search…
住宅価格を予測するにあたって、 様々な機械学習アルゴリズムを試してみました。 今回はXGboostを試してみました。 コンペなどで使われることが多く、 上位に入賞するにはほぼマストで 試してみる必要があるアルゴリズムですね。
今回はランダムフォーレスト(Random Forest)で ボストンの住宅価格を予測してみました。 数年前はRandom Forestがよく使われていたイメージですが、 いまはXgBoostとかになりましたね。 以前の案件で、あいまいなデータから予測モデルを作る必要があり、Rand…
いつものボストン住宅価格の予測モデル作成です。 今回はサポートベクター回帰というものを 使ってみました。 サポートベクターマシーン(SVM)という名前は分類問題で よく聞きましたが、SVMの概念を回帰に適用したものをサポートベクター回帰(Support Vector…
今回はニューラルネットワークでボストンの住宅価格を予測しました。前回、多項式回帰でかなり精度を上げることができたので、 このまま波に乗りたいところです。 ニューラルネットワークは、教師信号(正解)の入力によって問題に最適化されていく教師あり…
どうもhinomarucです。 今回は多項式回帰を試す 多項式回帰とは? 統計学における多項式回帰(たこうしきかいき、英: polynomial regression)とは、従属変数 y を独立変数 x の n 次多項式でモデル化する回帰分析の一手法である。多項式回帰は、従属変数と…
下記記事の続編になります。 hinomaruc.hatenablog.com 前回の記事では、ボストンの住宅価格 (Boston housing prices)のデータセットの説明を書いたので、データの理解をしたい方はこちらへどうぞ 前回は単回帰での住宅価格の予測ですが、今回は重回帰で予測…
前回数値予測が可能なサンプルデータセットをやろうと記事にしていましたが、 候補データを選定しました。町の住宅価格の中央値を周辺環境から予測するといった 回帰分析向けのサンプルデータになります。場所はボストンで1970年代とかなり古めのデータにな…
このデータセットは3,4年くらい前に当時のチームメンバーにPythonでデータ分析する方法を共有したときのサンプルデータとして利用しました。 単純にロジスティック回帰でモデリングするコードを順に説明しただけなので、もう少しデータの中身を詳しく説明す…
今回見ていくデータはフィッシャーのアイリス(アヤメ)データセットです。 分類問題やクラスタリングのサンプルコード紹介でよく利用されるデータです。フィッシャーという方が論文で紹介したのが始めだったんですね。下記表の一番上にあるのが、アヤメのよう…