摘要: 2024-10-30 ,由惠州大学、上海交通大学、中国科学院深圳先进技术研究院等联合创建的StainDoc数据集,首次为文档去污任务提供了大规模、高分辨率的图像对,极大地推动了文档图像增强技术的发展,特别是在去除文档上的污渍方面。 一、研究背景 文档图像常常受到各种污渍的,严重影响其可读性,并阻碍了 阅读全文
posted @ 2024-11-20 10:14 数据猎手小k 阅读(49) 评论(0) 推荐(0)
摘要: 2024-11-15,由麻省理工学院和Google联合创建的ParClusterers Benchmark Suite (PCBS)数据集,为图聚类算法的评估带来了革命性的意义。这个数据集不仅规模宏大,包含1.2M短文本,而且通过精确的50-最近邻图构建,为聚类算法提供了一个真实且具有挑战性的测试平 阅读全文
posted @ 2024-11-20 10:12 数据猎手小k 阅读(44) 评论(0) 推荐(0)