YoungF

2021年1月26日

2020年ML和NLP领域研究总结

摘要：本博客翻译自RUDER的博客《ML and NLP Research Highlights of 2020》本文选取的领域和方法很大程度上受到自身兴趣的影响，所选择的话题偏向于表征学习和迁移学习，也偏向于NLP。我尽量覆盖自己听到看到的所有论文，但是也可能会遗漏很多相关的工作，请读者不要拘束，直接阅读全文

posted @ 2021-01-26 10:30 YoungF 阅读(612) 评论(0) 推荐(0)

2021年1月21日

由"2021年辛丑年"引起的一个头脑风暴

摘要：抬起头，小米电视上写着"2021年辛丑年"，那么下一年呢？辛寅年？查了下，是"壬寅年"，天干地支都挪了一位。我们知道，天干共有10个，分别是甲乙丙丁戊己庚辛壬癸；地支对应生肖，共有十二个，分别是子丑寅卯辰巳午未申酉戌亥。那么天干地支记年法将二者结合，按道理是120年一个循环，但是实际上，一个循环阅读全文

posted @ 2021-01-21 11:06 YoungF 阅读(333) 评论(0) 推荐(0)

2021年1月20日

翻译《Adam: A Method for Stochastic Optimization》

摘要： Adam: 一个随机优化方法 https://arxiv.org/pdf/1412.6980.pdf 摘要我们基于低阶矩(lower-order moments)的自适应估计提出Adam算法来解决随机目标函数的基于一阶梯度的优化。该方法易于实现，计算效率高，对内存要求低，不随梯度的对角线重缩放发生阅读全文

posted @ 2021-01-20 21:06 YoungF 阅读(1260) 评论(0) 推荐(0)

2021年1月19日

动态规划专题

摘要：最大子数组这个题，初学之时，老师教我们用分治算法，分三路：在左边子数组、在右边子数组以及跨越中线，其实用动态规划已经很简单了，看状态转移方程就明白了： \[ dp[i] = \begin{cases}arr[i], & \quad i==0\\ max\{dp[i-1]+arr[i], arr[i 阅读全文

posted @ 2021-01-19 11:17 YoungF 阅读(68) 评论(0) 推荐(0)

2021年1月18日

梯度提升树GBDT

摘要： GBDT全称Gradient-boosting decision tree，即用gradient boosting策略训练出来的决策树模型。模型的结果是一组CART树（回归分类树）的组合$T_1, ..., T_K$，其中**$T_j$学习的是之前$j-1$棵树预测结果的残差**。这种思想就像准备阅读全文

posted @ 2021-01-18 17:55 YoungF 阅读(90) 评论(0) 推荐(0)

2021年1月16日

论文阅读《BERT for Joint Intent Classification and Slot Filling》

摘要：论文链接：https://arxiv.org/pdf/1902.10909.pdf 这篇论文的思路非常简单，就是把BERT用来同时做意图分类和槽填充，其中[CLS]对应的隐藏状态$h_1$用来做句子分类： \[ y^i = softmax(W^ih_1+b^i) \] 同时又拿最后一层每个subwo 阅读全文

posted @ 2021-01-16 18:12 YoungF 阅读(494) 评论(0) 推荐(0)

论文阅读《LEX-BERT: Enhancing BERT based NER with lexicons》

摘要： key value 论文名称 LEX-BERT: Enhancing BERT based NER with lexicons 一作 Wei Zhu 单位上海华东师范大学; 圣地亚哥AI4ALL 发表 ICLR 2021 领域命名实体识别主要贡献提出一种将词信息融入到字嵌入的方法基础模型阅读全文

posted @ 2021-01-16 17:12 YoungF 阅读(1132) 评论(0) 推荐(0)

论文阅读《Pre-training with Whole Word Masking for Chinese BERT》

摘要： key value 名称 Pre-training with Whole Word Masking for Chinese BERT 一作崔一鸣单位哈工大; 讯飞实验室发表技术报告时间 2019.10 领域预训练模型主要贡献将whole word masking方法用在中文预训练上阅读全文

posted @ 2021-01-16 17:03 YoungF 阅读(1730) 评论(0) 推荐(0)

2020年11月21日

基于Trie树实现自动补齐（autocomplete）功能

摘要： """ Trie树 """ __author__ = 'youngf' class TrieNode: def __init__(self): self.children = {} self.last = False class Trie: def __init__(self): self.root 阅读全文

posted @ 2020-11-21 19:30 YoungF 阅读(242) 评论(0) 推荐(0)

2020年11月7日

pytorch.utils.data

摘要：概览 torch.utils.data主要是负责容纳数据集、数据打散、分批等操作。这里面有三个概念：数据集dataset，抽样器sampler，数据加载器dataloader。其中第三个就是最终对外的接口，也是最重要的。它们之间的关系是：首先需要根据源数据创建数据集dataset，然后根据dat 阅读全文

posted @ 2020-11-07 16:15 YoungF 阅读(430) 评论(0) 推荐(0)

focusing on nlp & llm

公告