top of page

自然言語処理 NLP

公開·3名のメンバー

5ちゃんねるはそんな単純なものではありませんでした。

前回の5チャンネルの「金沢市」スレッドに続いて、今度は「スタジオジブリ」のスレッドを分析対象にしてみました。なぜスタジオジブリを選んだかというと、荒れることが少なそうだから。




結論から言うと、ジブリの場合ポジティブ方向へ盛り上がるときに投稿数が増加して、荒れる方向へ向かうと投稿数が減少しているようにも見えますし、あるいは両者の間に特別な関係はないようにも見えます。


投稿数をみると、金沢市の場合1か月あたり多いときで2000を超えていますし、少ない月でも500くらいはあります。一方スタジオジブリは多い月でも600台、少ない月は数十程度しかありません。金沢市はローカルなネタで、ジブリが全国区であることを考えると意外です。


感情分析スコアは、金沢市が基本的に負値でたまに+0.06程度まで盛り上がるのに対して、ジブリは通常0.05を中心として振幅しているようです。また金沢市と比較するとジブリのスコアは安定しています。


金沢市は投稿数が多くてスコアが悪くて大きく上下する、ジブリは投稿数は少ないがスコアは良くて安定している、と言えるかもしれません。


では

荒れるスレッド=投稿数が多い

と結論付けることができるでしょうか。


例えば安部元総理大臣の国葬のスレッドは投稿数がとても多かったのですが、感情分析スコアは意外なほど良かったことを考えると、この結論は短絡的すぎるといえます。


一つのスレッドだけを取り上げて、5チャンネルの傾向をつかむのは無理なようです。でもこんな地道な作業を数十スレッドでやると、何らかの傾向が出てくるかもしれません。

閲覧数:29

新規投稿をお知らせします。

登録ありがとうございます。

© 2023 by Healthy Together. Proudly created with Wix.com

bottom of page