玄天妙地 - 博客园

[Top] colab上基于tensorflow2的BERT中文文本多分类finetuning

整体背景本文实现了在colab环境下基于tf-nightly-gpu的BERT中文多分类，如果你在现阶段有实现类似的功能的需求，相信这篇文章会给你带来一些帮助。准备工作 1.环境：硬件环境：直接使用谷歌提供的免费训练环境colab，选择GPU 软件环境： tensorflow：tensorf Read More

posted @ 2020-01-22 16:21 玄天妙地 Views(4608) Comments(5) Diggs(0)

[Top] 【转载 | 翻译】Visualizing A Neural Machine Translation Model（可视化讲解神经机器翻译模型）

转载并翻译Jay Alammar的一篇博文：Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention) 原文链接：https://jalammar.github.io/visu Read More

posted @ 2019-11-28 11:11 玄天妙地 Views(1264) Comments(0) Diggs(0)

2020年8月29日

最长公共子序列图解、算法实现和复杂度分析

LCS和莱文斯坦距离的解决思路非常类似，都是利用动态规划的方式来解决。可以参见上一篇“莱文斯坦距离”，两个概念对比着看理解为更深入！ LCS定义同样引用百科：最长公共子序列（LCS）是一个在一个序列集合中（通常为两个序列）用来查找所有序列中最长子序列的问题。与查找最长公共子串的问题不同的地方是： Read More

posted @ 2020-08-29 16:42 玄天妙地 Views(4723) Comments(0) Diggs(0)

2020年8月25日

莱文斯坦距离图解、算法实现与复杂度分析

编辑距离定义与分类编辑距离的定义，直接引用百科：编辑距离是針對二個字符串的差异程度的量化量测，量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。编辑距离可以用在自然语言处理中，例如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离，判断哪一个或几个是比较可能的字。 DNA也可 Read More

posted @ 2020-08-25 20:07 玄天妙地 Views(3062) Comments(0) Diggs(0)

2019年8月9日

斯坦福【概率与统计】课程笔记（六）：EDA | 标准差和方差

这一篇比较简单，就不展开记录了，方差和标准差的计算方法记住了就可以。另外，记得标准差和方差都是衡量样本集中程度的，方差或标准差越大，样本越向两边离散；方差或标准差越小，样本越向mean集中。标准差在对称分布下面，有几个在统计学上非常有用的数字：68%，95%，99.7%，意思是：用median Read More

posted @ 2019-08-09 16:58 玄天妙地 Views(943) Comments(0) Diggs(0)

斯坦福【概率与统计】课程笔记（五）：EDA | 箱线图

介绍箱线图之前，需要先介绍若干个其需要的术语 min：整个样本的最小值 max：整个样本的最大值 Range：即整个样本的取值范围，Range = max - min Inter-Quartile Range (IQR)：四分之一range，即通过取3次中位数（median），将整个range分成四 Read More

posted @ 2019-08-09 16:15 玄天妙地 Views(1355) Comments(0) Diggs(0)

斯坦福【概率与统计】课程笔记（四）：EDA | 茎叶图

茎叶图的只做方法如下：举个例子：我们有一份奥斯卡影后的年龄集合： 34 34 27 37 42 41 36 32 41 33 31 74 33 49 38 61 21 41 26 80 42 29 33 36 45 49 39 34 26 25 33 35 35 28 30 29 61 32 33 Read More

posted @ 2019-08-09 15:52 玄天妙地 Views(1187) Comments(0) Diggs(0)

斯坦福【概率与统计】课程笔记（三）：EDA | 直方图

单个定量变量的直方图表示大家知道，定量变量是连续型变量，即不会像分类变量那样有明显的分类，那么如何将其画成直方图呢？一般来说，会将其按照某个维度来将其分组（group），举个例子。我们有15个学生的考试成绩：88, 48, 60, 51, 57, 85, 69, 75, 97, 72, 71, Read More

posted @ 2019-08-09 15:22 玄天妙地 Views(1979) Comments(0) Diggs(0)

2019年8月8日

斯坦福【概率与统计】课程笔记（〇）：前言

这个系列的随笔，起源于工作中遇到的问题：拿到一份试验数据后，该如何分析其内容并得到有价值的结论？一般说来，某个产品在上线之前，都会在小范围内做实验，看看用户对产品新功能/新样式的反映如何，实验的结论会产出很多体现用户反映的各种维度、各种指标的数据，而且量级都比较大（可能几万个甚至十几万个值）。那么 Read More

posted @ 2019-08-08 11:01 玄天妙地 Views(780) Comments(0) Diggs(0)

2019年8月7日

斯坦福【概率与统计】课程笔记（二）：从EDA开始

探索性数据分析（Exploratory Data Analysis）本节课程先从统计分析四步骤中的第二步：EDA开始。课程定义了若干个术语，如果学习过机器学习的同学，应该很容易类比理解： population：上节课说过，整体数据集合被称作population individual：其中每个个体 Read More

posted @ 2019-08-07 22:32 玄天妙地 Views(836) Comments(0) Diggs(0)

众妙之门

公告