回帰 Regression
私の事務所ではもう5年以上前から土地の鑑定評価にAI評価モデルも使っています。
鑑定評価では、伝統的に原価法、取引事例比較法、収益還元法の3つの手法のうち適用可能なものを使用して鑑定評価額を求めます。これは50年も前から変わっていません。というか、当たり前のように生成AIが利用されている今日に、今だに50年前と大して変わらないことをやっている。大丈夫か、この業界???
これじゃヤバイので、私の事務所では、従来の伝統的な手法に加えてAI評価も採用しています。
具体的には、不動産情報ライブラリーから2005年以降に発生した石川県内の更地の全取引事例約21,000件を取得し、これを使って訓練した価格モデルで、対象不動産の価格を予測しています。
今回価格モデルを全面的に作り直しました。
大きな改良点が二つあって、
1,地理空間情報を活用した接近条件の測定
2.おなじく地理空間情報を利用した地域性の表現
になります。
地理空間情報というのは、要するに緯度経度。
不動産の鑑定では、駅やスーパーなどがどれほど便利かを表現するのに「最寄り」の1施設までの距離を使っていました。でもこれではスーパーが一か所だけの場合と複数か所存在する場合の違いを表現できません。そこで今回は、例えば200m圏内にその施設が何か所存在するかを接近条件として採用することにしました。
不動産の価格は先ほどのスーパーのような接近条件だけで決まるわけではなく、騒音・振動、
緑化、地域の名声のような、数字で表現するのが難しいものも反映しています。このような位置による特徴をいかに価格モデルに反映させるかについて様々な取り組みが行われています。今回のモデルでは、地理的加重回帰という回帰式を使って地域の価格水準の予測値を求め、これを地域の特性を表現する属性として採用しました。
5分割の交差検証でモデルの精度を確認すると、このとおり。
不動産情報ライブラリーで公開されている取引情報は、取引の場所が絶対に分からないように、地番どころか1丁目、2丁目も分からないように加工されています。場所もろくに分からないようなデータでモデルを訓練しているので、決定係数R2は0.79でほぼ限界。0.9台には絶対に乗らない。
構築したモデルをshapのサマリープロットで確認します。
この図は、各特徴量の影響の大きさと方向を表しています。
最も影響が大きいのが都心(金沢駅)で、近いほど価格が高い方に作用します。2番目に影響が大きいのが「重み付き予測値」つまり地域の価格水準であり、高いほど対象不動産も高い。当たり前。
3000m圏内のコンビニ数が影響力3位に入っています。コンビニの数が多いほど価格は高くなります。
経過月数は2005年からの月数を表します。土地価格は時期によって上がったり下がったりしてきましたので、時期によって(経過月数によって)上がったり下がったりしています。
面積は小さいほうが高くて、道路幅員は狭いとマイナス。
またshapでは対象不動産の価格がどのような過程で予測されたかも図示できます。
これは石川県小松市のある住宅の価格を予測したもの。
下から上方向に進みます。対数価格の平均10.677からスタートして、まずその他80の特徴量はマイナス0.05,道路幅員は12mでプラス0.04,3000m圏ドラッグストア数は4か所でマイナス0.07、面積は200㎡でプラス0.07...。以下同じように進んで、最終的に対数価格で10.115円、真数で25,200円と予測しました。
この土地の本当の価格が2万円台前半であることから、まずまず予測できているようです。
データの取得が容易な時代で、NVIDIAさんのおかげでパソコンの処理能力も10年前と比較して飛躍的に高まって、高度なデータ分析ができる土壌はできているのに、不動産鑑定士はなぜ50年前の評価で満足しているのでしょうかね。
いいね!