top of page

回帰 Regression

公開·1名のメンバー

コロナウイルスの感染者数予測

コロナはもう終わりかと思っていたのですが、また増加の兆しが...。兆しというよりもう第8波は始まっていると思います。午後のバラエティ番組でもやっていましたので、サイバー大の卒業生もやってみようと思います。


これは僕の地元の石川県の新規感染者数の推移です。青が実数で赤が予測値。

今思えば1年前の夏の感染なんて、山が小さすぎて山というよりただの起伏。地面が盛り上がっているだけ。最近の部分をもう少し図を拡大してみます。



山と谷の大きさにズレはありますが、大きな傾向は捉えているようです。


第7波のときは感染拡大が始まった7月初旬から、感染が収まった10月まで約3か月かかっています。過去の小さい山の感染も始まりから終わりまでの期間はやはり約3か月でした。この傾向が当てはまるとした場合、第8波は1月下旬まで続き、ピークは12月半ばごろということになります。


それから第8波が始まっている仮定して、第7波のときと比べると感染拡大初期の傾きが緩やかです。でもこの傾きが続くのか、それとも急上昇するのかは分かりません。


時系列分析は、過去の周期やトレンドが続くとした場合どうなるかを表すことができます。簡単に言うと、大きな流れとか傾向を表すのに使われます。「明日は何人になるの」といった細かい数字を出すことは苦手です。


それからこれから感染者数は増加すると考えられますが、増加から減少に転じる時期(ピーク)を前もって予測することもできません。過ぎて初めて、例えば2週間前がピークでしたと分かるだけ。


今回の場合も第7波のピークを超えるのかどうかは、まだ分かりません。多分来週か再来週になると見えてくるとは思いますが...。


第8波と第7波の違いは、プラスの面としては3回接種を終えた人数が増えたこと。マイナス要因としては、旅行支援等での人の流れの増加や飲食店での接触が増えたこと、外国人観光客が増えたことなどがあります。


この時系列分析はSARIMAモデルを使っています。SARIMAモデルは「季節変動自己回帰和分以降平均モデル(seasonal autoregressive integrated moving average model)」という長い名前で、今回のコロナのような1週間周期があって、感染拡大にも3か月程度の周期がありそうな場合に使います。


Pythonならばstatsmodelsというライブラリーを使うと簡単にできてしまいます。


今回はこの本を参考にしています。本文は全部で182ページと少なめ。数式も出てきますが、落ち着いて考えればたいていは大丈夫。

僕のような根っからの文系さんにとっては、ややこしいと思われるものも少し出ます。

閲覧数:35

新規投稿をお知らせします。

登録ありがとうございます。

© 2023 by Healthy Together. Proudly created with Wix.com

bottom of page