令和5年の東京都の地価公示(島しょ部を除く)の結果を使って、地理空間加重回帰分析を試してみます。説明変数は公示のデータに含まれている面積、道路幅員、駅との距離の3つを採用し、目的変数はもちろん公示価格(対数化した価格)。
東京都の公示地はと全域にみっちり分布しております。
ところで地理空間加重回帰というのは、Geographically Weighted Regression(GWR)の日本語訳。通常の回帰分析では、y=ax+bのパラメータである傾きaや切片bは一定ですが、GWRでは空間的に近い場所にある複数のxはパラメータが類似しており、遠くにあるxは関係が薄くなるという仮説に基づいています。
例えば道路幅が1m増加したときの価格の変動率は、江東区内の住宅間ではよく似ているが、調布市とは全然異なる、みたいな感じです。
この時の「よく似ている」が当てはまる範囲を「バンド」といいます。最適なバンドもモデルが自動的に求めてくれます。
x軸が本当の公示価格、y軸が作ったモデルで予測した価格。赤線が近似線。
赤線上に青点が全部乗れば100%大正解となりますが、まあ普通そんなことは起こらない。
ここまで近似すると相当精度が高いといえます。
ちなみにR2(決定係数)は0.979とものすごいものが出ました。
公示価格というのは、きれいな価格です。一般の取引では親戚なので安く売ってやったとか、隣の地面なので高くても買ったなど、いろんな個人的な事情を反映して、通常より高い安いということがあります。公示価格はこんな事情は一切ない価格ですので、こんなきれいな結果が出ました。一般の取引価格を使うと、精度はここまで上がることはないし、こんなきれいなグラフにはまずなりません。
この手法は必ずしも地理空間に限らず、例えば趣味が類似する男性あるいは女性で、所得金額が1円増加したときの消費金額の変動率を求めるなど、様々な方面で応用できるそうです。