当ブログは移転しました。 移転先は https://www.hinomaruc.com です。 記事を引用してくださってる方もいらっしゃるので このブログは旧ブログとして記事はそのまま残しておきます。 新ブログでもよろしくお願いいたします。
免責事項 当サイトに掲載している情報は寄稿者の調査・見解・経験に基づくものであり、記事の内容の正確性や品質に関しては一切保証いたしません。 当サイトの記事内容やサイトのURLは事前の予告なく変更・更新する場合があります。変更や更新によって生じた…
重回帰分析を以前やりましたが、 説明変数はマニュアル方式で 集計結果のグラフを見ながら選んでいました。 今回はバージョンアップして全ての説明変数の組み合わせを 試して一番精度がよいモデルを選択するプログラムを組みました。 精度の評価方法は色々あ…
コロナになってからバタバタして更新が滞っていたhinomarcです。 生活様式がかなり変化し、慣れるまで時間がかかってしまいました。 久しぶりにこのブログのアクセス状況を見てみたら、 なかなか閲覧してくださっている方がいることがわかりました。 これは…
奥さんがあつまれ動物の森をやりたいというので、Nintedo Switch Liteを入手しました。 毎週火曜日にAmazonから定価で販売されるので、ねらっていました。 9:00に確認.... 販売されていない。 9:30に確認.... 販売されていない。 今週に限って販売されないの…
どうもhinomarucです。ずっとやらないといけないと思っていたことですが、今までPythonで機械学習で作成したボストンの住宅価格の予測モデルの結果をまとめました。 結果のまとめ 精度の良さ 指標 単回帰 重回帰 多項式回帰 (n=2) ニューラルネット サポート…
どうもhinomarucです。 複数のモデルを組み合わせて、 精度がよいアウトプットを作ることは kaggleなどのコンペをみてやってみたいと 思っていました。 アンサンブル学習の一つである、voting regressorで 住宅価格を予測してみました。 A voting regressor …
明けましておめでとうございます、hinomarucです。 昨年12月までに全8回にわけて、ボストンの住宅価格のデータセットを 使って各種アルゴリズムで数値予測をしました。 仕事をしながら考えていたのですが、 まだ2つ試していないアルゴリズム + α がありまし…
12月に入って初めての投稿です。hinomarucです。 今回はXGBoostのパラメータチューニングをGrid Searchで行いました。 事前に試したいパラメータを定義しておき、一番精度のよい組み合わせを発見する方法です。 最適なパラメータを見つける方法はGrid Search…
住宅価格を予測するにあたって、 様々な機械学習アルゴリズムを試してみました。 今回はXGboostを試してみました。 コンペなどで使われることが多く、 上位に入賞するにはほぼマストで 試してみる必要があるアルゴリズムですね。
今回はランダムフォーレスト(Random Forest)で ボストンの住宅価格を予測してみました。 数年前はRandom Forestがよく使われていたイメージですが、 いまはXgBoostとかになりましたね。 以前の案件で、あいまいなデータから予測モデルを作る必要があり、Rand…
ネットだけでも莫大な情報が検索できるのですが、 はてなブログでどういう設定が必要かを学びたかったので 購入しました。 新しいことを学ぶときに私はまず関係図書を読み漁ります。 ネットだけで調べてもその場しのぎになってしまうので、 極力全体像を把握…
いつものボストン住宅価格の予測モデル作成です。 今回はサポートベクター回帰というものを 使ってみました。 サポートベクターマシーン(SVM)という名前は分類問題で よく聞きましたが、SVMの概念を回帰に適用したものをサポートベクター回帰(Support Vector…
お問い合わせは下記フォームから
今回はニューラルネットワークでボストンの住宅価格を予測しました。前回、多項式回帰でかなり精度を上げることができたので、 このまま波に乗りたいところです。 ニューラルネットワークは、教師信号(正解)の入力によって問題に最適化されていく教師あり…
どうもhinomarucです。 今回は多項式回帰を試す 多項式回帰とは? 統計学における多項式回帰(たこうしきかいき、英: polynomial regression)とは、従属変数 y を独立変数 x の n 次多項式でモデル化する回帰分析の一手法である。多項式回帰は、従属変数と…
最近ブログのことばかり気になってるhinomarucです。 かれこれ1週間くらいこのサイトのデザインのCSSをかなりいじってました。 記事投稿のペースも出来てきたので、まだ記事数が少ないうちに記事の共通フォーマットを作ってしまおうという魂胆です。 当サイ…
下記記事の続編になります。 hinomaruc.hatenablog.com 前回の記事では、ボストンの住宅価格 (Boston housing prices)のデータセットの説明を書いたので、データの理解をしたい方はこちらへどうぞ 前回は単回帰での住宅価格の予測ですが、今回は重回帰で予測…
前回数値予測が可能なサンプルデータセットをやろうと記事にしていましたが、 候補データを選定しました。町の住宅価格の中央値を周辺環境から予測するといった 回帰分析向けのサンプルデータになります。場所はボストンで1970年代とかなり古めのデータにな…
今後サンプルデータとして扱いたいのは「売上」などの数値予測のデータ。今まで推薦システムのアルゴリズムを作ることが多かったので数値予測はあまりやったことがなかったので分析の幅を広げる意味でも一回時間をかけてデータを見たいです。実業務ではスピ…
このデータセットは3,4年くらい前に当時のチームメンバーにPythonでデータ分析する方法を共有したときのサンプルデータとして利用しました。 単純にロジスティック回帰でモデリングするコードを順に説明しただけなので、もう少しデータの中身を詳しく説明す…
今回見ていくデータはフィッシャーのアイリス(アヤメ)データセットです。 分類問題やクラスタリングのサンプルコード紹介でよく利用されるデータです。フィッシャーという方が論文で紹介したのが始めだったんですね。下記表の一番上にあるのが、アヤメのよう…
これから様々なデータの分析や可視化を行なっ ていくにあたり、記事のレイアウトを作成しよ うと思います。何をやればいいか明確になりますし、フォーマットが統一されることによって記事を見やすく読みやすくする狙いです。 あまりブログを長く続けた試しが…