top of page

クラスタリング clustering

公開·1名のメンバー

衛星画像でクラスタリング

近所の海岸の衛星画像を使って、砂浜が浸食されているかどうか検証してみました。


まずは2017年7月の画像



こちらは2022年7月の画像



どちらも暗くて見にくいです。すいません。


閲覧数:40

ジブリの結果 機械学習的に統括します

前回の記事の中で、ラピュタを山田くんと間違えたものと、山田くんをラピュタと間違えたものは、いずれもゼロという結果になりました。その理由は画像の見た目から、ラピュタははっきり鮮やかな絵であるのに対して、山田くんはとてもぼんやりして絵であると説明しました。これをもう少しクラスタリングっぽく説明してみたいと思います。


まず、ラピュタと山田くんの2つだけでクラスタリングするとどうなるのでしょうか。その前にグラフ化するのであらかじめ約15万の特徴量をxとyだけの2次元データに次元削減しています。その結果はこのとおり。星印は各クラスターの中心を表しています。左が山田くん、右がラピュタになります。

このグラフのとおりで、山田くんの塊とラピュタの塊の間、もっと厳密にいうとそれぞれの星からのちょうど中間付近にはどちらの要素もないのが分かります。だから間違えようがありません。


同様にして、かぐや姫も加えて3つでやってみます。グラフは左から、山田くん、かぐや姫、ラピュタとなります。かぐや姫が山田くんとラピュタの間に入り込んでいます。山田くんとかぐや姫のそれぞれの星印の距離は、ラピュタとかぐや姫ものより近くなっています。またかぐや姫と山田くんの中間付近と、かぐや姫とラピュタの中間付近を比べると、かぐや姫と山田くんの間に要素が多く存在し混み合っているのが分かります。


閲覧数:34

お詫びと訂正 ジブリでクラスタリング 追加情報

昨日投稿しました「ジブリでクラスタリング」の正解率に誤りがありました。原因は「式が間違っている」という初歩的なミスでした。そこで、たとえば真の値がラピュタのうちラピュタと当てることができたものの率で正解率を求めることにしました。クラスタリングはそもそも「教師なし学習」ですので、正解率というのも変な話なのですが...


結果は

kaguya acc:0.5800

kaguya failure:0.4200


laputa acc:0.9400

laputa failure:0.0600


閲覧数:22

ジブリでクラスタリング

ジブリの公式Webサイトで、過去に映画化された作品の静止画像を無料でダウンロードできます。しかも「常識の範囲でご自由にお使いください。」以外の縛りがありません。さすがジブリ、太っ腹。

https://www.ghibli.jp/info/013344/


そこで公開されている1178枚を自分のパソコンにダウンロードして、これで作品ごとにクラスタリングできないか

やってみることにしました。でも人間の目で見ても、映画を見ていないと、例えば僕は「耳をすませば」と「コクリコ坂から」は画像によっては区別できない(ファンの人ごめんなさい)。



閲覧数:27

新規投稿をお知らせします。

登録ありがとうございます。

© 2023 by Healthy Together. Proudly created with Wix.com

bottom of page