ビジネスにおける地図の活用事例集
63/70

[フォレストベースの分類と回帰]ツールを用いて予測モデル構築すると、実績値と予測値の相関係数が0.945と非常に高い正相関を得られるモデルを構築することができました。同じデータを用いて重回帰分析を行った場合は、相関係数が0.4程度でしたので、本分析ではランダムフォレストの方が精度よく予測できている結果となりました。機械学習の手法として、ArcGISに標準搭載されている[フォレストベースの分類と回帰(Forest-Based Classification and Regression)]ツールを用います。このツールは、ランダムフォレストと呼ばれる機械学習手法を用いてモデルを作成し、予測や分類を行うことができます。ここでは、取引価格を予測するように設定して分析を行います。それらに加えて、最寄駅の「人口総数」や「人口増減」(平成22年 → 平成27年の人口増減数)などGISで追加したパラメーターも重要な変数となっていることが分かります。GISで情報を付加することで、予測モデルの精度向上に寄与することができました。Advanced Analytics分野■機械学習の手法■学習結果■新規物件に対する価格予測ランダムフォレストとは?ランダムフォレストとは、「決定木」と呼ばれる予測モデルを複数組み合わせたアンサンブル モデルであり、機械学習のアルゴリズムの一種です。回帰を行う場合は、各決定木の平均値を予測値として扱い、分類を行う際は、多数決で分類結果を出力します。質的な変数も多く組み込むことができます。変数の重要度また、ランダムフォレストで解析した場合、予測モデルに寄与する変数の重要度も同時に出力されます。変数の重要度を確認すると、「地積」(土地面積)や「最寄駅までの徒歩時間」、「間口」などが重要であることが分かります。新規物件の情報収集取引価格の予測を行うためには、予測モデルで使用する変数の収集を行う必要があります。今回のケースでは、土地面積や最寄駅、最寄駅までの徒歩時間、間口、などを収集する必要があります。GISで情報付与GIS上に情報を展開することで、最寄駅の名称や徒歩距離など、不足している情報を収集することも可能です。予測モデルの適用新規物件に対する情報が整備し、構築済みの予測モデルを適用することで、予測値を得ることができます。このような予測分析を通じて、対象とする物件のポテンシャルを正しく理解し、効率の良い不動産投資を行うことができます。活用事例

元のページ  ../index.html#63

このブックを見る