会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
dataset-k
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
9
10
11
12
13
2024年9月8日
GRAB:评估大型多模态模型在图分析任务上的性能
摘要: 2024-08-22,由剑桥大学和香港大学联合创建GRAB,目标是通过包括广泛的图表类型和问题格式来全面评估前沿模型分析图形的能力。重点关注重要的分析任务,例如从图中提取关键属性和解释复杂的数据表示。 目前遇到问题和挑战: 现有基准测试的局限性: 大型多模态模型在视觉任务上的表现已经非常出色,但现有
阅读全文
posted @ 2024-09-08 15:25 数据猎手小k
阅读(46)
评论(0)
推荐(0)
2024年9月6日
CMM-Math:用于数学推理的中文多模态数据集
摘要: 2024-09-05 ,由华东师范大学发布 CMM-Math ,是一个用于数学推理的多模态数据集,其中每个问题可能包含多个图像,专为 LMM 设计。目标是提升大型多模态模型的数学推理能力,展示了专门的数学语言模型在处理具有视觉背景的复杂数学问题方面的有效性。 一、目前遇到问题和挑战: 1、中文多模态
阅读全文
posted @ 2024-09-06 18:21 数据猎手小k
阅读(236)
评论(0)
推荐(0)
COIG-CQIA 由中科院深圳先进技术研究院、北京大学等联合发布高质量多样化中文指令微调数据集
摘要: 2024-03-26 , 由中国科学院深圳先进技术研究院、北京大学、中国科学技术大学等联合发布数据集COIG-CQIA,这是一个高质量的中文指令微调数据集,包括问答和文章,以提供与人类互动一致的指令微调数据。 一、目前遇到困难和挑战 1、语言和文化差异: 中文具有独特的语言特征和文化深度,与英文存在
阅读全文
posted @ 2024-09-06 16:47 数据猎手小k
阅读(78)
评论(0)
推荐(0)
IEPile:由浙江大学和蚂蚁集团等联合发布一个全面的双语信息抽取(IE)指令语料库
摘要: IEPile:由浙江大学和蚂蚁集团等联合发布一个全面的双语信息抽取(IE)指令语料库 2024-04-11 ,由浙江大学;蚂蚁集团;浙江大学-蚂蚁集团知识图谱联合实验室联合发布IEPile,一个全面的双语(英语和中文)IE指令语料库,包含约3.2亿个标记。 现在目前遇到问题和挑战 1、大型语言模型(
阅读全文
posted @ 2024-09-06 16:43 数据猎手小k
阅读(47)
评论(0)
推荐(0)
2024年6月14日
Pandas-查看数据整体情况
摘要: 一、获取要分析的数据 最近发现一个数据集搜索引擎,里面有很多数据集资源。界面设计小清新,看起来挺舒服的。通过关键词搜索,也能找到相关的数据集。如果找不到,下面也提供很多站点,可以扩大寻找范围。 遇见数据集-https://www.selectdataset.com/专注于发现数据集的引擎 二、 查看
阅读全文
posted @ 2024-06-14 18:29 数据猎手小k
阅读(32)
评论(0)
推荐(0)
上一页
1
···
9
10
11
12
13
公告