2024 年 8月 22 日随笔档案 - 晓飞的算法工程笔记

2024年8月22日

DLAFormer：微软提出多任务统一的端到端文本分析Transformer模型 | ICDAR 2024

摘要：论文提出新颖的基于Transformer的端到端方法DLAFormer，在统一的模型中集成多个文档布局分析任务，包括图形页面对象检测、文本区域检测、逻辑角色分类和阅读顺序预测。为了实现这一目标，将各种DLA子任务视为关系预测问题并提出了统一标签空间方法，使得统一关系预测模块能够有效而高效地同时处理这阅读全文

posted @ 2024-08-22 09:46 晓飞的算法工程笔记阅读(249) 评论(0) 推荐(0)

SLAB：华为开源，通过线性注意力和PRepBN提升Transformer效率 | ICML 2024

摘要：论文提出了包括渐进重参数化批归一化和简化线性注意力在内的新策略，以获取高效的Transformer架构。在训练过程中逐步将LayerNorm替换为重参数化批归一化，以实现无损准确率，同时在推理阶段利用BatchNorm的高效优势。此外，论文设计了一种简化的线性注意力机制，其在计算成本较低的情况下达到阅读全文

posted @ 2024-08-22 09:40 晓飞的算法工程笔记阅读(419) 评论(0) 推荐(0)

晓飞的算法工程笔记

公告