SIGIR会议推动包容性AI技术发展
某中心在SIGIR:迈向更包容的AI技术
ACM信息检索特别兴趣小组(SIGIR)年度会议将于下周召开,某机构访问学者、智利大学计算机科学副教授Barbara Poblete担任博士联盟及多样性、公平与包容委员会联合主席。
Poblete自2019年该委员会成立以来始终是其成员。"对SIGIR会议及整个社区而言,尽可能保持包容性至关重要。每个人都应感受到欢迎,并获得尊重与尊严。我们制定了SIGIR会议指导方针——称为'包容性清单',帮助会议更具包容性。"
仇恨言论检测技术
Poblete的研究重点是将机器学习效益扩展至新社区,并使在线社区成员感到更安全。"我从事仇恨言论检测研究,专注于多语言方面,因为现有工作主要集中于英语。这对南美等非英语国家造成了技术鸿沟。"
主要技术挑战在于利用英语资源为训练数据较少的非英语语言社区构建模型。"直接使用多语言嵌入效果不佳。我们采用数据集增强方法:在西班牙语数据集中添加标注英语数据以改进分类器,或针对特定领域(如仇恨言论)创建专用嵌入,或训练偏向特定问题的嵌入。"
灾害检测技术创新
研究团队将社交媒体分析技术应用于危机信息学领域。"利用社交媒体数据改进灾害检测和信息收集工具。智利多发地震和洪水,对此有强烈需求。"
团队开发的twicalli.cl网站使用机器学习模型自动处理推文,以评估感知地震强度。"智利国家地震中心使用该系统。通过分析推文频率峰值,30分钟内即可估算地震影响,而传统方法需要数天且需专家现场评估。危机管理的最初几分钟至关重要,这些信息将改变应急响应方式和救援速度。"
当前研究重点在于区分危机相关信息与噪声。"当出现热门标签(如尼泊尔地震)时,许多无关消息也会使用相同标签。我们为此训练灾害特定词嵌入,测试能否用其他国家地震数据增强西班牙语信息。不仅跨语言学习,还探索跨领域应用:能否从地震检测中学习检测飓风或洪水等新型灾害?这也是应急准备的重要组成部分。"
实时灾害检测仪表盘界面。上方时间轴显示地震相关语言推文频率,下方为最新活动细节放大视图
研究领域:信息检索、会话AI
技术标签:SIGIR、迁移学习
技术要点:
- 多语言仇恨言论检测模型
- 跨语言嵌入优化技术
- 基于社交媒体的实时灾害检测系统
- 灾害特定词嵌入训练方法
- 跨领域灾害预测技术
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码
![办公AI智能小助手]()


浙公网安备 33010602011771号