转载并翻译Jay Alammar的一篇博文:Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention) 原文链接:https://jalammar.github.io/visu Read More
介绍箱线图之前,需要先介绍若干个其需要的术语 min:整个样本的最小值 max:整个样本的最大值 Range:即整个样本的取值范围,Range = max - min Inter-Quartile Range (IQR):四分之一range,即通过取3次中位数(median),将整个range分成四 Read More
这个系列的随笔,起源于工作中遇到的问题:拿到一份试验数据后,该如何分析其内容并得到有价值的结论? 一般说来,某个产品在上线之前,都会在小范围内做实验,看看用户对产品新功能/新样式的反映如何,实验的结论会产出很多体现用户反映的各种维度、各种指标的数据,而且量级都比较大(可能几万个甚至十几万个值)。那么 Read More
探索性数据分析(Exploratory Data Analysis) 本节课程先从统计分析四步骤中的第二步:EDA开始。 课程定义了若干个术语,如果学习过机器学习的同学,应该很容易类比理解: population:上节课说过,整体数据集合被称作population individual:其中每个个体 Read More