top of page

AIは性的画像被害支援をどう変えるか

  • 4 時間前
  • 読了時間: 8分

ぱっぷすでは現在、エンジニア2名でAIを活用して、性的画像被害にあった人を支援するためのシステム開発を進めています。

Embeddingを行っているGPU
Embeddingを行っているGPU

インターネット上に一度画像が広がってしまうと、それを見つけ出すことはとても大変です。SNS、掲示板、海外サイト、動画サイトなど、画像が置かれる場所はさまざまで、人の手だけで探し続けるには限界があります。

ぱっぷすでは、2019年から三菱財団の助成を受け、機械学習を使った被害対策の研究・開発を続けてきました。2022年度からはAIを使った支援システムの開発にも本格的に取り組んできました。この1年間でAI技術が大きく進化したことで、これまで人の手に頼るしかなかった作業にも、新しい可能性が広がっています。



ProtectionAI ― 被害画像を探し出す仕組み

現在開発している「ProtectionAI」は、被害者の性的画像がインターネットやSNS上に広がっていないかを探すためのシステムです。


被害者本人から提供された画像をもとに、AIが顔の特徴を読み取り「512個の数字の並び」に変換します。これを専門用語では「特徴ベクトル」と呼びます。特徴ベクトルから顔写真を復元することはできません。プライバシーに配慮した形で登録できます。


Protection AIフロント画面
Protection AIフロント画面

そのうえで、インターネット上から集められた画像と比べ、「同じ人の画像かもしれない」と判断します。この比較には、「コサイン類似度」という方法を使います。これは、2つのデータがどれくらい似ているかを調べる計算方法です。

現在、ProtectionAIでは約1億枚規模の画像データを対象に、学習や解析を進めています。なお、顔認識に使用している具体的なAIモデル名は、悪用を防ぐために公開していません。


Paprika ― ネット上を探しに行くシステム(ぱぷりか)

被害画像を見つけるためには、インターネット上のさまざまな場所を探しに行く必要があります。そのために、ぱっぷすでは独自のクローラーシステム「Paprika」を開発しています。クローラーとは、Webサイトを自動で見て回り、必要な情報を集めるプログラムのことです。「Paprika」という名前は、PAPSの「PAP」に「rika」をつけた造語です。

Paprikaの管理画面
Paprikaの管理画面

被害画像は、SNS、海外サイト、匿名掲示板、動画サイトなど、さまざまな場所に拡散されます。しかも、それぞれのサイトで画像の置かれ方や見つけ方が違います。そのため、普通のクローラーでは対応が難しいという問題があります。


以前は、Webページの内部構造である「DOM」を読み取って、自動操作する方法も検討していました。DOMとは、Webページの中にあるボタン、入力欄、画像、リンクなどの構造のことです。しかし、実際のWebサイトは複雑で、サイトごとに作りも違うため、うまくいかないことが多くありました。


そこで現在は、Vision AI、つまり「画面を見て理解するAI」を活用しています。人間がブラウザ画面を見て「ここに入力欄がある」「このボタンを押せばよさそう」と判断するように、AIが画面を見ながら操作方法を考えます。


Paprikaでは、AIが安全な実験環境の中で、画像を取得するためのコードを自動で作り、試す仕組みも取り入れています。この安全な実験環境を「サンドボックス」と呼びます。失敗しても外のシステムに影響を与えないようにするための隔離された場所です。


AI開発では「小さく分ける」ことが大切

AI開発では、高性能なAIを使うだけでなく、システム全体をどう作るかも大切です。

ぱっぷすでは、AIの機能を一つの大きなシステムにまとめるのではなく、機能ごとに小さく分けて使う「マイクロAPI化」を重視しています。


APIとは、ある機能を外から呼び出して使うための入り口のようなものです。たとえば、画像を読み取る機能、顔の特徴を取り出す機能、似ている画像を探す機能、削除要請フォームを操作する機能などを、それぞれ小さく分けておきます。


大きなAIシステム、とくにGPUを使う処理は、起動に時間がかかることがあります。GPUとは、AIの計算を高速に行うための装置です。そこで、必要な機能だけを必要なときに使えるように分けることで、処理を効率よく行い、問題が起きたときにも原因を見つけやすくしています。


独自AIモデルの開発を目指して

ProtectionAIでは、被害者本人から提供された画像をもとに、顔の特徴を読み取り、インターネット上の画像と照合する仕組みを使っています。


現在、この顔認識の中心部分には、高性能な顔認識AIモデルを活用しています。精度が高く、被害画像を見つけるうえで重要な役割を果たしていますが、将来的には、ぱっぷす独自の顔認識AIモデルを開発・運用していくことを目指しています。


その理由は、性的画像被害の支援では、被害者の顔という非常にセンシティブな情報を扱います。そのため、どのようなデータを使い、どのように学習し、どのように照合し、誰がアクセスできるのかを、支援の現場に合わせて厳密に管理できることが重要です。


独自モデルを持つことができれば、被害者支援に特化した精度改善や、安全設計、悪用防止の仕組みをより細かく組み込むことができます。


サーバー群はProxmoxで仮想化
サーバー群はProxmoxで仮想化

一方で、独自の顔認識AIモデルを開発するには、大きな計算能力が必要です。そのため、GPUなどの計算資源が欠かせません。GPUとは、AIの計算を高速に行うための装置です。


ぱっぷすでは現在、AMD EPYCを搭載したデータセンター級サーバー2台、PCサーバー3台、NAS 3台、GPU 7台を整備しています。AMD EPYCは大量の処理を行うためのサーバー向け高性能CPUで、NASは複数のサーバーから使える大容量の保存装置です。


また、SSD価格が高騰する前に32TBのSSDを確保することができ、大きなデータを扱うための環境づくりも進めています。


熱と音とのたたかい

AI開発では、計算能力だけでなく「熱」と「音」も大きな課題です。

GPUは、AIの計算をするときに大きな熱を出します。長時間高い負荷をかけ続けると、温度が上がりすぎて、性能が落ちたり、機械の寿命が短くなったりします。そのため、GPUの温度を60度前後に保つことが大切です。

ProtectionAIサーバー群
ProtectionAIサーバー群

ぱっぷすではGPUにヒートシンクを取り付けたり、サーキュレーターやファンを複数台使ったりして、熱がこもらないようにしています。ヒートシンクとは、機械の熱を逃がすための金属部品です。昨年度の夏はとても過酷だったため、今年の夏までにはさらに本格的な熱対策を考える必要があります。


また、サーバーやGPUはオフィスの中で動いているため、冷却ファンの音も問題になります。そこで、12センチの大型ファンを多く使い、できるだけ低い回転数でも十分な風量を確保できるようにしています。


AI開発は、アルゴリズムだけではありません。熱、音、電気、置き場所といった、かなり地道な問題とのたたかいでもあります。


「探す技術」が持つ怖さ

一方で、顔を探す技術には大きな課題もあります。開発を始めた当初は、ここまで高い精度で人の顔を探し出せるようになるとは想像していませんでした。しかし、実際に運用してみると、想定以上の精度で画像を見つけられる場面があり、ビッグデータとAIの力の大きさに驚くと同時に、恐怖も感じました。もうネット検索では出てこなくなった10年近く前に被害に遭われた方の画像を見つけることもできました。


被害者の画像を探せるということは、反対に言えば、ある人が過去に性的画像の被害にあっいたたかどうかを、数秒のうちに調べられてしまう可能性があるということでもあります。


被害者を助けるための技術が、誰かを監視したり、過去を暴いたり、差別や嫌がらせに使われたりする可能性があります。だからこそ、ぱっぷすでは「悪用されない仕組み」を作ることを大切にしています。


また、被害画像を探すためには、支援する側が被害者の顔を確認しなければならないという難しさもあります。「見つけてほしい」でも、「見られたくない」という気持ちが同時にあるからです。性的画像被害の支援には、このようなジレンマがあります。ぱっぷすでは、社会のために必要な支援と、一人ひとりのプライバシーをどう守るか、その両方を考えながら開発を進めています。


AI技術の進化によって、これまで人の手で長い時間をかけなければならなかった作業の一部が、自動化できる可能性が広がっています。しかし、性的画像被害の支援において、AIは魔法の道具ではありません。精度、費用、熱や音、セキュリティ、そして被害者のプライバシーと尊厳をどう守るかという課題があります。


ぱっぷすがAIを開発しているのは、新しい技術を使いたいからではありません。目的は、被害にあった人が少しでも早く、安全に、自分の生活を取り戻せるようにすることです。


一方で、顔認識のAI技術は、使い方を誤れば、監視や嫌がらせに悪用される危険性があります。だからこそ、ぱっぷすでは「誰が、何のために、どこまで使ってよいのか」というルールを重視しています。


また、悪用を防ぐため、AIモデル名や詳しい検索方法など、公開すべきでない情報もあります。透明性は大切にしながらも、被害者の安全を守るために、公開できる情報と伏せるべき情報を慎重に分けています。


プライバシー保護は最も大切な原則です。しかし、本人の意思に反して拡散された画像を見つけ、削除要請につなげることには高い公益性があります。本人の同意を前提に、必要最小限の範囲で、厳格に管理しながら技術を使うことが重要です。


ぱっぷすは、AIの便利さだけでなく危うさにも向き合いながら、被害を受けた方の尊厳を守るために開発を続けています。


 
 
bottom of page