1 枯れ果てた名無し@転載禁止 (3872ed4a🔰) 2025/01/29 (水) 03:38:35.978 ID:dP2Frhx68
AIのトレーニングに使用されるデータをインターネット上からかき集めるために使用されるのがクローラーです。自身のウェブサイト上のデータをAIのトレーニングに利用されないようにするためのオプションを大手AI企業は提供していますが、この種のブロックを迂回してクローラーがウェブサイトから情報を抜き出していることも問題視されています。そんなクローラーを無限に生成される迷路に閉じ込めることができるのが「Nepenthes」です。
Nepenthesは数十のリンクを持つウェブページを無限に生成することで、クローラーを捕獲するというもの。生成されたリンクはNepenthesが設置されたウェブページへのリンクであるため、クローラーは無限にリンクを周回してもAIのトレーニングに使えるようなデータを収集することはできません。なお、作者はNepenthesについて「有害なアクティビティを引き起こすことを意図した悪意のあるソフトウェアであるため、実行内容に完全に納得できない場合はデプロイしないでください」と注意喚起しています。
https://gigazine.net/news/20250127-infinite-maze-traps-ai-crawler-nepenthes/