1950年以降のホラームービーをまとめたデータがkaggleの中にありました。
ここから入れます ↓
オリジナルのデータはそのままでは使いにくいので、前処理してこんなデータにまとめました。
title: 映画のタイトル
overview: あらすじ
rating: レイティング 1が最悪、10が最高
label: あらすじを感情分析した結果(NEGATIVE,POSITIVE)
ホラームービーのくせにポジティブなあらすじがあってビックリ
score: 感情分析のスコア(1が完全なポジティブあるいはネガティブ)
release_year: 公開年
データを眺めてみたいと思います。
まずはあらずじがネガティブなものとポジティブなものとの割合。
レイティングの分布。
レイティングが1のものがずば抜けて多いです。ホラームービーは駄作が多いということですか。
年別の公開されたホラームービーの数。
2000年あたりから急増しています。何が原因なんでしょうかね?
年別のレイティングが1の数。
総数とだいたい同じカーブを描いています。
年別のレイティングが1の比率
1960年代の後半まではレイティング1の比率は横ばいもしくは減少しているようです。1960年代後半から2015年にかけては、レイティング1率はじわじわと上昇し続けます。2015年以降はレイティング1率は急上昇しています。
2015年以降、リリースされるホラー映画の数は爆発的に増加していますが、その半分以上が最悪(レイティング1)と評価されているようです。2015年以降はホラー映画を見ると駄作に当たる率がとても高いようです。2022年公開のホラー映画に至っては、7割近くが駄作。
ホラー映画のくせにあらすじがポジティブと判断されたものの例です。
'Living in an apocalyptic world, a family of three fight for survival. Michael, determined to protect his family, pushes ten-year-old son Josh into manhood when a routine scavenger hunt goes awry.'
"When Keira Woods' daughter mysteriously vanishes in the cellar of their new house in the country, she soon discovers there is an ancient and powerful entity controlling their home that she will have to face or risk losing her family's souls forever."
ちなみに僕の世代でホラームービーといえば、ウイリアム・フリードキンの「エクソシスト」。映画ではありませんが、日曜の7時から当時の小学生を震え上がらせた「怪奇大作戦」も思い入れがあります。
せっかくデータがまとまったので、次回はこれを使って機械学習的なことをやってみたいと思います。