上妻 拓也, 梅澤 猛, 大澤 範高
情報処理学会論文誌 62(6) 1358-1367 2021年6月15日 査読有り
視覚の補完機能であるアモーダル補完を応用し,人間には負担が大きすぎず,自動文字認識には攻撃コストが増加し難度が高いCAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)を生成する手法を提案し,評価を行った.提案手法では背景色の図形によって文字の一部を欠けさせた欠損画像と,欠損画像上の欠けた部分を覆い隠すことができる図形を透明背景に描画したマスク画像の2枚を提示する.欠損部にマスクがかかるように2枚の画像を重ね合わせると,アモーダル補完の効果により人間にとっては容易に文字認識ができる.画像の重ね合わせ操作は,ボットが攻撃に必要とするコストを増大させると期待できるが,欠損画像のみから文字認識されると効果がない.そこで,3種類の認識困難化手法を組み合わせた欠損画像を生成し,畳み込みニューラルネットワークによる自動文字認識率を評価した.反転ノイズ重畳と文字幅・間隔不均一化の組合せが最も効果があり,正解率を認識困難化手法を使わない場合の0.946から0.788に低減可能であることを示した.また,被験者による文字列読み取り実験によって,提案したCAPTCHAに対する正解率と解答時間および操作に対する主観的な負荷について調査した.画像の重ね合わせを適切に行うことで,アモーダル補完の効果によって文字の認識が容易になることを確認し,画像の重ね合わせ操作に対する負担感軽減が必要であることも明らかにした.