Twitter(ツイッター)であなたが特定出来るって知ってましたか?

Medivery


皆さんは Twitter をやっていますか?

いま起きたこと、感じたことを140字以内の短い文章で発信するSNSサービス「Twitter」

特に若者の間で非常に人気のSNSの一つです。

 

日本国内のユーザー数はフェイスブックやインスタグラムを超え、不動のトップを保っています。

2017年のデータで、日本のツイッターのアクティブユーザー数はなんと4500万人にも登っているのです。

 

そんな皆さんが大好きなTwitter。

実はかなりの確率で個人特定が可能であることはご存知でしたか?

今回はTwitterからどのくらいの確率で個人特定ができるのか科学論文を解説しながらお話したいと思います。

最近、話題のTikTokよりも実は恐ろしかったりするかもしれませんね。

 

  1. Twitter での個人特定は容易
  2. メタデータ
  3. Twitter ユーザーが知らない Twitter の恐怖
  4. Twitter による個人特定のメリット
  5. まとめ

 

Twitter での個人特定は容易

イギリスの研究チームが報告した論文から、“Twitterのメタデータを分析することで、非常に高い精度で個人を特定できる”ということが明らかになりました。

この研究では、機械学習という方法を用いてツイート内容や蓄積されたメタデータを分析することで、10,000人のTwitterユーザーの身元を信じられない精度で特定できたと報告しています。

ではどのくらいの精度で特定できるのでしょうか?

非常に気になりますね!

研究データを見ていきましょう。

メタデータ

メタデータとは、Twitter内に投稿されたありとあらゆるデータになります。

 

  • ツイートの文字
  • 投稿された写真・動画
  • 共有されたリンク
  • 投稿された時間

 

など、Twitter内部に集約されたすべてのデータです。

これらのメタデータは、身元や所在地を隠そうとする人の所在を割り出すために、時に警察の捜査に用いられます。

例えばある人の自撮り写真をメタデータに照らし合わせると、その画像が撮影されたときの「服装」「髪型」はもちろん、「背景」「天気」など、ありとあらゆるデータを照合させることで身元の特定につながり、犯罪者のアリバイを検証するのに役立つのです。

 

この基本技術を用いて、ユニヴァーシティ・カレッジ・ロンドンと”ビッグデータの専門機関”であるアラン・チューリング研究所のチームが共同で研究を行い、そして論文を発表しました。

その結果、科学者達はツイートに関連づけられたメタデータを使用し、10,000人のTwitterユーザーの身元を特定しようとしたところ、なんと96.7%の精度で個人を特定できたのです。

また、“集約されたメタデータのうち60%の情報を遮断し、残りの 40パーセントだけで検証”してもなんと95%以上の精度で1人の人間をピンポイントで特定することができたのです。

Twitter ユーザーが知らない Twitter の恐怖

研究結果によりますと、ほとんどのTwitterユーザーは次のような重要なことを知らないとのことです。

まず、Twitterには144種のメタデータが保存されていて、それらはAPI(アプリケーションプログラミングインターフェース)を通じて簡単に外部からアクセスできるとのことです。

彼らは500万回に及ぶツイートから14種メタデータを抽出し、それらを3つの異なる機械学習アルゴリズム分析しました。

このメタデータには、

 

  • アカウントがつくられた時間
  • ツイートが投稿された時間
  • お気に入り
  • フォロワー・フォローの数

 

などが含まれています。

彼らの研究結果によると、個人を特定するうえで最も精度が高く効果的だったのは、先ほど例で挙げたような“写真の服装、髪型、天気、背景などの小難しいアルゴリズム”ではなく、これらの「アカウントがつくられた時間」「ツイートが投稿された時間」「お気に入り」「フォロワー・フォローの数」などの基本的なアルゴリズムだったとのことです。

つまり、我々が普段何気なくツイートしている内容から、ほんのわずかなメタデータを利用することで、ほぼ正確に個人を特定できるという結果に至ったのです。

Twitter による個人特定のメリット

ここまで簡単に個人を特定されてしまうことがわかると何だか怖いですね…。

しかし、これにはいい面もあります。

 

犯罪情報をツイートしているアカウントに対しても非常に高い確率で個人特定が可能であるので、ツイッター上の犯罪予告に関して個人を特定犯罪を抑制できるというデータもあります。

最近ニュースで、「SNS で殺害予告をしたとして、〇〇県の〇〇容疑者を逮捕しました。」というような報道が流れるのを耳にしますよね?

そのような犯行予告が流れると、警察がそのTwitterアカウントから犯人を特定するためにメタデータにアクセスし、データを解析し、犯人を特定して逮捕に踏み切るのです。

メタデータによって個人が特定される可能性が高い反面、犯罪者をいち早く特定できる恩恵もあることがこの研究からわかったのです。

まとめ

今回はツイッターの個人特定が思った以上に精度が高く、また簡単であることをお話しししました。

Twitterは気軽に投稿できる反面、簡単に自分を特定されてしまうリスクくを備えていることがお分かりになったと思います。

 

以前、“テ〇スハ〇ス”に出演していた格闘家の女性がお亡くなりになる事件がありましたが、その原因となったのは SNS 上での誹謗中傷だったとされています。

匿名で投稿できるからといって、何の気なしに人を傷つけるような投稿をしてしまうこともあるのかもしれませんが、そのツイートが人の命を奪うのです。

そのこと自体が一番の問題点だと思いますが、それに加えて、今回の動画でご指摘させていただいた通り、いくら匿名にしていても 95% 以上の確率で投稿者を特定することができます。

自分の身を守るためにも Twitterだからといって個人を中傷するような投稿は絶対にやめましょう。

その言霊は、必ずあなたの身に舞い戻ってきます…。

 

このブログでは様々な科学情報をお伝えし、みなさんの科学知識を増やすお手伝いをしています。

この記事がためになったなぁ!と思った方は、チャンネル登録やベル通知をしていただけると大変嬉しいです!

また、

 

「こんな内容を調べてほしい!」

「この病気について知りたい!」

 

というというリクエストがある方はコメント欄にご連絡いただけますと、とても嬉しいです!

ありがとうござました!

【参考文献】

  1. An Investigation for Crime Information Extraction from Twitter. 研究報告 デジタルドキュメント(DD) 2011-DD-82(3), 1-6, 2011-10-01
  2. Twitter’s vast metadata haul is a privacy nightmare for users
  3. https://www.wired.co.uk/article/twitter-metadata-user-privacy

【監修医師】

  1. Dr. KyoJi: 医師11年目の外科医, 新宿の医局→フリーランス, 《Twitter》https://twitter.com/dkyoji
  2. 小山翔平 (Shohei Oyama): 整形外科専門医, おやま整形外科クリニック院長 《Web》https://oyama-seikei.gassankai.com/