AI土地評価 ver3.0を更地の鑑定評価で運用しています。
使い勝手と鑑定評価書の見た目を改善するために、ver.3.0を少し改良しました。
改良点1
鑑定評価に機械学習モデルを取り入れて以来、回帰アルゴリズムはずっとlightGBMを使ってきました。今回XGboostも併用するようにし、二つの価格の平均やより精度が高いほう、さらには二つの価格をしめして、価格のレンジ(例えば80,500~82,000円/㎡など)で示したりすることができるようにしました。
改良点2
説明変数に以下の施設等を加えました。
バス停
ディスカウントストア
ショッピングモール
そして、住宅地にとってマイナスの施設と考えられる斎場
この2点を見直すことで、決定係数R2は0.79を超えるようになりました。
この作業が意外と大変。なぜかというと、例えば石川県にある全バス停(約3300)を手作業で集めることができるわけがない。当然にしてスクレイピングで集めてきます。昔はとりあえず施設名と住所を入手して、その後住所を緯度経度にジオコーディングしていました。今はWebで普通に施設名と地図上の位置が乗っているのが普通になっています。地図に位置が乗っているということは、HTML内をよく探すと緯度経度が乗っている。だから住所なんか取ってこなくても直接座標が手に入ります。良い時代になったもんだ。

こんな感じでバス停がズラズラっと手に入る。
lightGBMを使ったモデルの最終的な精度は0.8036で、初めて0.8を超えることができました。予測値は83,700円/㎡。実際の価格が82,000円/㎡なので誤差2%で、評価書に記載してもそん色ない価格を得ることができました。
XGboostの場合、精度はlightGBMとほとんど同じ。予測値は83,200円/㎡で誤差1.5%。
鑑定評価書では
「lightGBMの予測値とXGboostの予測値はほぼ一致しており、AIモデルによる試算価格を両者の平均である83,500円/㎡と求めた」
などと書くことになるでしょう。