(旧) ヒノマルクのデータ分析ブログ

どんな企業、地域、国でも働けるようなスキルを身につけていくブログ

PythonやBIツールを使って分析と可視化をします

新ブログへ移転しました

当ブログは移転しました。 移転先は https://www.hinomaruc.com です。 記事を引用してくださってる方もいらっしゃるので このブログは旧ブログとして記事はそのまま残しておきます。 新ブログでもよろしくお願いいたします。

免責事項とプライバシーポリシー

免責事項 当サイトに掲載している情報は寄稿者の調査・見解・経験に基づくものであり、記事の内容の正確性や品質に関しては一切保証いたしません。 当サイトの記事内容やサイトのURLは事前の予告なく変更・更新する場合があります。変更や更新によって生じた…

[Python] その2の2 ボストンの住宅価格を重回帰分析ver2で予測してみた

重回帰分析を以前やりましたが、 説明変数はマニュアル方式で 集計結果のグラフを見ながら選んでいました。 今回はバージョンアップして全ての説明変数の組み合わせを 試して一番精度がよいモデルを選択するプログラムを組みました。 精度の評価方法は色々あ…

近況のまとめ

コロナになってからバタバタして更新が滞っていたhinomarcです。 生活様式がかなり変化し、慣れるまで時間がかかってしまいました。 久しぶりにこのブログのアクセス状況を見てみたら、 なかなか閲覧してくださっている方がいることがわかりました。 これは…

Nintendo Switch Lite買ってしまった

奥さんがあつまれ動物の森をやりたいというので、Nintedo Switch Liteを入手しました。 毎週火曜日にAmazonから定価で販売されるので、ねらっていました。 9:00に確認.... 販売されていない。 9:30に確認.... 販売されていない。 今週に限って販売されないの…

【予測結果まとめ】ボストンの住宅価格 (Boston housing prices corrected)

どうもhinomarucです。ずっとやらないといけないと思っていたことですが、今までPythonで機械学習で作成したボストンの住宅価格の予測モデルの結果をまとめました。 結果のまとめ 精度の良さ 指標 単回帰 重回帰 多項式回帰 (n=2) ニューラルネット サポート…

その9 ボストンの住宅価格をアンサンブル学習(Voting regressor)で予測してみた

どうもhinomarucです。 複数のモデルを組み合わせて、 精度がよいアウトプットを作ることは kaggleなどのコンペをみてやってみたいと 思っていました。 アンサンブル学習の一つである、voting regressorで 住宅価格を予測してみました。 A voting regressor …

ボストンの住宅価格のデータセットでまだ試していなかったこと

明けましておめでとうございます、hinomarucです。 昨年12月までに全8回にわけて、ボストンの住宅価格のデータセットを 使って各種アルゴリズムで数値予測をしました。 仕事をしながら考えていたのですが、 まだ2つ試していないアルゴリズム + α がありまし…

その8 ボストンの住宅価格をXGBoostで予測してみた(Grid Searchでパラメータチューニング有)

12月に入って初めての投稿です。hinomarucです。 今回はXGBoostのパラメータチューニングをGrid Searchで行いました。 事前に試したいパラメータを定義しておき、一番精度のよい組み合わせを発見する方法です。 最適なパラメータを見つける方法はGrid Search…

その7 ボストンの住宅価格をXGBoostで予測してみた

住宅価格を予測するにあたって、 様々な機械学習アルゴリズムを試してみました。 今回はXGboostを試してみました。 コンペなどで使われることが多く、 上位に入賞するにはほぼマストで 試してみる必要があるアルゴリズムですね。

その6 ボストンの住宅価格をランダムフォーレストで予測してみた

今回はランダムフォーレスト(Random Forest)で ボストンの住宅価格を予測してみました。 数年前はRandom Forestがよく使われていたイメージですが、 いまはXgBoostとかになりましたね。 以前の案件で、あいまいなデータから予測モデルを作る必要があり、Rand…

はてなブログPerfect Guidebookという本を買いました

ネットだけでも莫大な情報が検索できるのですが、 はてなブログでどういう設定が必要かを学びたかったので 購入しました。 新しいことを学ぶときに私はまず関係図書を読み漁ります。 ネットだけで調べてもその場しのぎになってしまうので、 極力全体像を把握…

その5 ボストンの住宅価格をサポートベクター回帰(SVR)で予測してみた

いつものボストン住宅価格の予測モデル作成です。 今回はサポートベクター回帰というものを 使ってみました。 サポートベクターマシーン(SVM)という名前は分類問題で よく聞きましたが、SVMの概念を回帰に適用したものをサポートベクター回帰(Support Vector…

お問い合わせ

お問い合わせは下記フォームから

その4 ボストンの住宅価格をニューラルネットワークで予測してみた

今回はニューラルネットワークでボストンの住宅価格を予測しました。前回、多項式回帰でかなり精度を上げることができたので、 このまま波に乗りたいところです。 ニューラルネットワークは、教師信号(正解)の入力によって問題に最適化されていく教師あり…

その3 ボストンの住宅価格を多項式回帰で予測してみた

どうもhinomarucです。 今回は多項式回帰を試す 多項式回帰とは? 統計学における多項式回帰(たこうしきかいき、英: polynomial regression)とは、従属変数 y を独立変数 x の n 次多項式でモデル化する回帰分析の一手法である。多項式回帰は、従属変数と…

サイトと記事のデザインを変更

最近ブログのことばかり気になってるhinomarucです。 かれこれ1週間くらいこのサイトのデザインのCSSをかなりいじってました。 記事投稿のペースも出来てきたので、まだ記事数が少ないうちに記事の共通フォーマットを作ってしまおうという魂胆です。 当サイ…

[Python] その2 ボストンの住宅価格を重回帰分析で予測してみた

下記記事の続編になります。 hinomaruc.hatenablog.com 前回の記事では、ボストンの住宅価格 (Boston housing prices)のデータセットの説明を書いたので、データの理解をしたい方はこちらへどうぞ 前回は単回帰での住宅価格の予測ですが、今回は重回帰で予測…

ボストンの住宅価格を単回帰分析で予測してみた

前回数値予測が可能なサンプルデータセットをやろうと記事にしていましたが、 候補データを選定しました。町の住宅価格の中央値を周辺環境から予測するといった 回帰分析向けのサンプルデータになります。場所はボストンで1970年代とかなり古めのデータにな…

サンプルとして扱いたいデータがある

今後サンプルデータとして扱いたいのは「売上」などの数値予測のデータ。今まで推薦システムのアルゴリズムを作ることが多かったので数値予測はあまりやったことがなかったので分析の幅を広げる意味でも一回時間をかけてデータを見たいです。実業務ではスピ…

既婚女性の不倫傾向の集計をしてみた

このデータセットは3,4年くらい前に当時のチームメンバーにPythonでデータ分析する方法を共有したときのサンプルデータとして利用しました。 単純にロジスティック回帰でモデリングするコードを順に説明しただけなので、もう少しデータの中身を詳しく説明す…

アイリスデータであやめの種類を決定木分析で分類してみた

今回見ていくデータはフィッシャーのアイリス(アヤメ)データセットです。 分類問題やクラスタリングのサンプルコード紹介でよく利用されるデータです。フィッシャーという方が論文で紹介したのが始めだったんですね。下記表の一番上にあるのが、アヤメのよう…

ブログを始めるにあたって

これから様々なデータの分析や可視化を行なっ ていくにあたり、記事のレイアウトを作成しよ うと思います。何をやればいいか明確になりますし、フォーマットが統一されることによって記事を見やすく読みやすくする狙いです。 あまりブログを長く続けた試しが…