AI数据投毒:对抗未经授权的网络爬虫

由人类主导互联网、发布社交媒体动态或分享梗图的日子已一去不复返。今年早些时候,自相关数据开始追踪以来首次,网络流量的大部分来自网络浏览机器人,而非人类。

其中,超过一半的机器人流量来自恶意机器人,例如,它们会在线收集未受保护的个人数据。但越来越多的流量来自人工智能公司为收集模型训练数据或响应用户提示而派出的机器人。事实上,为某机构旗下的ChatGPT提供动力的ChatGPT-User机器人,现已占所有网络流量的6%;而由某公司开发的自动化系统ClaudeBot则占据了13%的流量。

人工智能公司称,此类数据抓取对于保持其模型更新至关重要。然而,内容创作者持不同看法,他们认为AI机器人是大规模版权侵权的工具。例如,今年早些时候,某中心和某机构起诉了某AI公司,指控该科技公司的图像生成器抄袭了来自《星球大战》和《神偷奶爸》等热门系列的角色。

很少有内容创作者有足够的资金进行诉讼,因此有些人正在采用更激进的方法进行反击。他们使用在线工具,使AI机器人更难找到其内容——或者对内容进行处理,以欺骗机器人误读,例如,让AI开始混淆汽车图像与奶牛图像。但这种“AI投毒”在帮助内容创作者保护其作品的同时,也可能无意中使网络环境变得更加危险。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

公众号二维码

公众号二维码

posted @ 2025-12-05 14:02  CodeShare  阅读(4)  评论(0)    收藏  举报