HackerChen - 博客园

2024年2月3日

ICLR 2024 | Mol-Instructions: 面向大模型的大规模生物分子指令数据集

摘要：这些数据表现出显著的长尾分布，凸显了推断特定蛋白质功能的挑战，尤其是那些罕见功能的蛋白质。在自然语言处理（NLP）的众多应用场景中，大型语言模型（Large Language Model, LLM）展现了其卓越的文本理解与生成能力，不仅在传统的文本任务上成绩斐然，更在生物学、计算化学、药物研发等跨学科领域证明了其广泛的应用潜力。Mol-Instructions数据集共计含2043K条指令数据，覆盖了小分子、蛋白质以及生物分子文本三大领域的17个关键任务，包含了不同复杂度和结构的生物分子及丰富的文本描述。阅读全文

posted @ 2024-02-03 13:07 HackerChen 阅读(107) 评论(0) 推荐(0) 编辑

2021年7月15日

【论文小综】基于外部知识的VQA（视觉问答）

摘要：我们生活在一个多模态的世界中。视觉的捕捉与理解，知识的学习与感知，语言的交流与表达，诸多方面的信息促进着我们对于世界的认知。作为多模态领域的一个典型场景，VQA旨在结合视觉的信息来回答所提出的问题。从15年首次被提出[1]至今，其涉及的方法从最开始的联合编码，到双线性融合，注意力机制，组合模型，阅读全文

posted @ 2021-07-15 16:28 HackerChen 阅读(1190) 评论(0) 推荐(1) 编辑

2020年4月18日

我的2019计算机保研夏令营/预推免经历【中南，北理工，北航，南大，浙大】

摘要：参加了中南，北理工，南大，北航，浙大的j计算机夏令营。普通211信息安全专业，专业排名2%，非ACM队，因为喜欢编程参加过一些校赛。国奖等奖学金+3年优秀共青团员。有数学建模，CCF，软件设计师，大英竞赛等等。无论文。有一个国家级大创项目【NLP与信安交叉】，后来参加了一个国家级比赛在8月拿到全国二等奖。保研拉开序幕，上个月有过和一个CV方向的北航老师进行网络面试。感觉很不好。我挺喜欢那位老师的研究方向，但是可能是因为第一次面试经验不足，加上自己的工作展示ppt与老师所期望大相径庭。阅读全文

posted @ 2020-04-18 02:13 HackerChen 阅读(5192) 评论(1) 推荐(0) 编辑

hackerchenzhuo

公告