ACL 2024大语言模型研究全景解析

如同整个对话式AI领域一样，某中心在今年计算语言学协会（ACL）会议上发表的论文主要集中在大语言模型（LLM）的研究工作上。那些使LLM输出如此卓越的特性——如语言流畅性和语义连贯性——也 notoriously 难以量化；因此，模型评估已成为一个特别关注的领域。但某中心的论文探索了广泛的LLM相关主题，从代码合成和自动语音识别等应用，到持续预训练和幻觉缓解等LLM训练与部署问题。被新创刊的ACL会议录接受的论文以星号标记。

代码合成

微调语言模型以联合重写和补全潜在错误代码
Dingmin Wang, Jinman Zhao, Hengzhi Pei, Samson Tan, Sheng Zha

持续预训练

高效持续预训练用于构建领域特定大语言模型*
Yong Xie, Karan Aggarwal, Aitzaz Ahmad

数据质量

网络上机器翻译内容惊人之多：来自多向并行性的洞察*
Brian Thompson, Mehak Dhaliwal, Peter Frisch, Tobias Domhan, Marcello Federico

文档摘要

摘要-源对齐的力量
Ori Ernst, Ori Shapira, Aviv Slobodkin, Sharon Adar, Mohit Bansal, Jacob Goldberger, Ran Levy, Ido Dagan

幻觉缓解

通过事实一致性模型学习生成带引用的答案
Rami Aly, Zhiqiang Tang, Samson Tan, George Karypis

意图分类

你的模型能区分否定与含义吗？揭示意图编码器的挑战
Yuwei Zhang, Siffi Singh, Sailik Sengupta, Igor Shalyminov, Hwanjun Song, Hang Su, Saab Mansour

反讽识别

MultiPICo：多语言视角主义反讽语料库
Silvia Casola, Simona Frenda, Soda Marem Lo, Erhan Sezerer, Antonio Uva, Valerio Basile, Cristina Bosco, Alessandro Pedrani, Chiara Rubagotti, Viviana Patti, Davide Bernardi

知识基础

图思维链：通过在图上的推理增强大语言模型
Bowen Jin, Chulin Xie, Jiawei Zhang, Kashob Kumar Roy, Yu Zhang, Zheng Li, Ruirui Li, Xianfeng Tang, Suhang Wang, Yu Meng, Jiawei Han

MATTER：使用异构知识源的记忆增强变换器*
Dongkyu Lee, Chandana Satya Prakash, Jack G. M. FitzGerald, Jens Lehmann

遍历树：一种零样本推理算法，用于通过知识图增强黑盒语言模型
Elan Markowitz, Anil Ramakrishna, Jwala Dhamala, Ninareh Mehrabi, Charith Peris, Rahul Gupta, Kai-Wei Chang, Aram Galstyan

LLM解码

BASS：批量注意力优化的推测采样*
Haifeng Qian, Sujan Gonugondla, Sungsoo Ha, Mingyue Shang, Sanjay Krishna Gouda, Ramesh Nallapati, Sudipta Sengupta, Anoop Deoras

机器翻译

拼写错误查询对翻译和产品搜索的影响
Greg Hanneman, Natawut Monaikul, Taichi Nakatani

微调悖论：提升翻译质量而不牺牲LLM能力
David Stap, Eva Hasler, Bill Byrne, Christof Monz, Ke Tran

模型编辑

传播与陷阱：通过反事实任务的基于推理的知识编辑评估
Wenyue Hua, Jiang Guo, Marvin Dong, Henghui Zhu, Patrick Ng, Zhiguo Wang

模型评估

贝叶斯提示集成：黑盒大语言模型的模型不确定性估计
Francesco Tonolini, Jordan Massiah, Nikolaos Aletras, Gabriella Kazai

ConSiDERS—人类评估框架：重新思考生成式大语言模型的人类评估
Aparna Elangovan, Ling Liu, Lei Xu, Sravan Bodapati, Dan Roth

LLM的事实置信度：关于当前估计器的可靠性和鲁棒性
Matéo Mahaut, Laura Aina, Paula Czarnowska, Momchil Hardalov, Thomas Müller, Lluís Marquez

微调的机器翻译指标在未见领域表现不佳
Vilém Zouhar, Shuoyang Ding, Anna Currey, Tatyana Badeka, Jenyuan Wang, Brian Thompson

测量检索增强生成的问答难度
Matteo Gabburo, Nicolaas Jedema, Siddhant Garg, Leonardo Ribeiro, Alessandro Moschitti

模型鲁棒性

极端未校准与对抗鲁棒性的幻觉
Vyas Raina, Samson Tan, Volkan Cevher, Aditya Rawal, Sheng Zha, George Karypis

多模态模型

CaMML：面向大模型的上下文感知多模态学习器
Yixin Chen, Shuai Zhang, Boran Han, Tong He, Bo Li

基于大语言模型的语音识别的多模态检索
Jari Kolehmainen, Aditya Gourav, Prashanth Gurunath Shivakumar, Yi Gu, Ankur Gandhe, Ariya Rastrow, Grant Strimel, Ivan Bulyko

REFINESUMM：用于生成多模态摘要数据集的自我精炼MLLM
Vaidehi Patil, Leonardo Ribeiro, Mengwen Liu, Mohit Bansal, Markus Dreyer

序数分类

探索文本分类中的序数性：显式与隐式技术的比较研究
Siva Rajesh Kasa, Aniket Goel, Sumegh Roychowdhury, Karan Gupta, Anish Bhanushali, Nikhil Pattisapu, Prasanna Srinivasa Murthy

问答

超越边界：在结构化和非结构化信息源上进行类人问答*
Jens Lehmann, Dhananjay Bhandiwad, Preetam Gattogi, Sahar Vahdati

MinPrompt：基于图的少样本问答最小提示数据增强
Xiusi Chen, Jyun-Yu Jiang, Wei-Cheng Chang, Cho-Jui Hsieh, Hsiang-Fu Yu, Wei Wang

使用自动响应分割从未标记文档合成对话
Fanyou Wu, Weijie Xu, Chandan Reddy, Srinivasan Sengamedu, "SHS"

推理

通过代码从LLM中引发更好的多语言结构化推理
Bryan Li, Tamer Alkhouli, Daniele Bonadiman, Nikolaos Pappas, Saab Mansour

II-MMR：识别和改进视觉问答中的多模态多跳推理*
Jihyung Kil, Farideh Tavazoee, Dongyeop Kang, Joo-Kyung Kim

负责任AI

SpeechGuard：探索多模态大语言模型的对抗鲁棒性
Raghuveer Peri, Sai Muralidhar Jayanthi, Srikanth Ronanki, Anshu Bhatia, Karel Mundnich, Saket Dingliwal, Nilaksh Das, Zejiang Hou, Goeric Huybrechts, Srikanth Vishnubhotla, Daniel Garcia-Romero, Sundararajan Srinivasan, Kyu Han, Katrin Kirchhoff

文本补全

通过字符匹配实现子词补全的令牌对齐*
Ben Athiwaratkun, Shiqi Wang, Mingyue Shang, Yuchen Tian, Zijian Wang, Sujan Gonugondla, Sanjay Krishna Gouda, Rob Kwiatkowski, Ramesh Nallapati, Bing Xiang

更多精彩内容请关注我的个人公众号公众号（办公AI智能小助手）或者我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号（网络安全技术点滴分享）

公众号二维码

公众号二维码

posted @ 2025-10-14 15:12 CodeShare 阅读(15) 评论(0) 收藏举报

刷新页面返回顶部

codeshare1135

ACL 2024大语言模型研究全景解析

ACL 2024大语言模型研究全景解析

代码合成

持续预训练

数据质量

文档摘要

幻觉缓解

意图分类

反讽识别

知识基础

LLM解码

机器翻译

模型编辑

模型评估

模型鲁棒性

多模态模型

序数分类

问答

推理

推荐系统

负责任AI

文本补全

公告