摘要: 什么是有趣“大会”?它并不是一个和官方相关,真正的大会。它会是以趣味为导向的一系列文章,可以用放松、不太正式的心态去阅读它。 有趣大会都会有哪些内容,可以给我带来什么? 会挑选会议中一些有奇奇妙妙的想法或者任务的工作,然后进行非常简短的介绍。定位在于奇妙的角度或者有趣的任务,所以不会出现对模型方法的 阅读全文
posted @ 2023-04-28 00:06 createMoMo 阅读(116) 评论(0) 推荐(0) 编辑
摘要: Using Language Models in Specific Domains (1) 微信公众号版本:https://mp.weixin.qq.com/s/G24skuUbyrSatxWczVxEAg 这一系列文章仍然坚持走“通俗理解”的风格,用尽量简短、简单、通俗的话来描述清楚每一件事情。本 阅读全文
posted @ 2023-04-09 12:06 createMoMo 阅读(227) 评论(0) 推荐(0) 编辑
摘要: 当第一次看到自然语言理解的时候,我是感到困惑的。因为自然语言处理的目的就是要去理解人类产生的文本信息,从这个角度讨论,那应该所有的自然语言处理任务,都应该自然语言理解的范围之内。 而当经过进一步调查之后,发现大家基本上是把特定的任务称呼为自然语言理解。这一系列中,会贴合大家已经形成的习惯用语,所以这 阅读全文
posted @ 2022-10-06 02:34 createMoMo 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 目录: 简介 理解Gradient Checkpointing的基本概念 为什么我们需要存储中间结果? Gradient Checkpointing到底是怎么工作的呢? 实验部分 结论 完整内容见微信公众号文章:https://mp.weixin.qq.com/s/IwcfUP_j6JYFXH_xh 阅读全文
posted @ 2022-03-27 06:52 createMoMo 阅读(883) 评论(0) 推荐(0) 编辑
摘要: 开头语:这一系列的笔记仍然致力于简洁 + 尽量能说清楚怎么回事。为了理解GBDT和XGBoost,从最基础的决策树开始,一步一步,手把手深入到GBDT和XGBoost。 一段发自肺腑感谢的话:非常感谢Youtube上“StatQuest with Josh Starmer”公众号,发布了很多通俗易懂 阅读全文
posted @ 2020-04-05 04:55 createMoMo 阅读(1017) 评论(0) 推荐(0) 编辑
摘要: 【2020-04-03】微信公众号已经创建好了!会第一时间收到其他文章的更新!(二维码在末尾) 虽然网上的文章对BiLSTM-CRF模型介绍的文章有很多,但是一般对CRF层的解读比较少。 于是决定,写一系列专门用来解读BiLSTM-CRF模型中的CRF层的文章。 我是用英文写的,发表在了github 阅读全文
posted @ 2017-09-16 05:23 createMoMo 阅读(23791) 评论(5) 推荐(7) 编辑
摘要: “ 此系列文章不包含chatGPT等通用语言模型在文本纠错任务上的应用。如果需要这一系列或者其他文章的PPT(免费),私信发送“获取”即可。This series of articles does not include applications of chatGPT or similar meth 阅读全文
posted @ 2023-05-15 11:21 createMoMo 阅读(53) 评论(0) 推荐(0) 编辑
摘要: Kaggle Notebook每周会提供30小时的GPU免费使用额度。这为一些想先小小熟悉一下语言模型、但是手里没有资源可用、暂时还不想租用服务器的小伙伴来说,可能带来了一丝安慰。这篇教程以能够运行ColossalAI的“RLHF Training Stage1 - Supervised instr 阅读全文
posted @ 2023-05-01 11:00 createMoMo 阅读(765) 评论(0) 推荐(0) 编辑
摘要: 微信公众号版全文:https://mp.weixin.qq.com/s/prSr_zDLMGN7m3jhb6Bbkw 开源语言模型百宝袋 (Ver. 1.3) Open-Source Language Model Pocket Github: https://github.com/createmom 阅读全文
posted @ 2023-03-17 00:58 createMoMo 阅读(506) 评论(0) 推荐(0) 编辑
摘要: 目录: 背景简介 解决的问题 解码策略 Standard Greedy Search Beam Search Sampling Top-k Sampling Sampling with Temperature Top-p (Nucleus) Sampling 代码快览 总结 This post co 阅读全文
posted @ 2023-03-11 22:38 createMoMo 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 什么是有趣“大会”?它并不是一个和官方相关,真正的大会。它会是以趣味为导向的一系列文章,可以用放松、不太正式的心态去阅读它。 有趣大会都会有哪些内容,可以给我带来什么? 会挑选会议中一些有奇奇妙妙的想法或者任务的工作,然后进行非常简短的介绍。定位在于奇妙的角度或者有趣的任务,所以不会出现对模型方法的 阅读全文
posted @ 2022-10-10 10:25 createMoMo 阅读(205) 评论(0) 推荐(0) 编辑
摘要: 完整内容见微信公众号文章:https://mp.weixin.qq.com/s/0d4y9VzSVIcqemqp5O7nzA 官方主页:https://baiduworld.baidu.com/m/world/2022 “ 感受科技,感知未来!7月21日,央视新闻首场《超级发布》“AI深耕,万物生长 阅读全文
posted @ 2022-08-26 19:11 createMoMo 阅读(195) 评论(0) 推荐(0) 编辑