上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 59 下一页
摘要: 数据类型object与category比较 category数据类型 官方文档是这样描述的: Categoricals 是 pandas 的一种数据类型,对应着被统计的变量。 1.Categoricals 是由固定的且有限数量的变量组成的。比如:性别、社会阶层、血型、国籍、观察时段、赞美程度等等。 阅读全文
posted @ 2020-04-27 13:47 wqbin 阅读(2881) 评论(0) 推荐(0) 编辑
摘要: 采用lightGBM模型 准备数据与训练 calendar.csv数据集导入。 该数据数聚包含物品的售卖时间与物品类型 date: The date in a “y-m-d” format. wm_yr_wk: The id of the week the date belongs to. week 阅读全文
posted @ 2020-04-27 11:48 wqbin 阅读(1414) 评论(0) 推荐(0) 编辑
摘要: 方法详解: pandas.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None “Unpivots” a DataFrame from wide format to l 阅读全文
posted @ 2020-04-26 20:31 wqbin 阅读(4992) 评论(0) 推荐(0) 编辑
摘要: M5比赛 M5竞赛是M竞赛中最新的一次,将于2020年3月2日至6月30日举行。它与前四届竞赛有五个重要方面的差异,其中一些是M4竞赛的讨论者提出的。 它使用沃尔玛慷慨提供的分层销售数据,从商品级别开始,再汇总到美国三个地理区域(加利福尼亚州,德克萨斯州和威斯康星州)的部门,产品类别和商店。 除时间 阅读全文
posted @ 2020-04-26 16:30 wqbin 阅读(4752) 评论(0) 推荐(0) 编辑
摘要: 比赛介绍 这是M5预测挑战赛的两个互补比赛之一。你能尽可能准确地估计沃尔玛在美国销售的各种产品的单位销售额吗?如果你对估计同一系列已实现值的不确定性分布感兴趣,一定要查看它的竞争对手 一家商店一年内每月能卖多少露营用具?对于外行来说,在这个水平上计算销售额似乎和预测天气一样困难。这两种预测都依赖科学 阅读全文
posted @ 2020-04-26 16:13 wqbin 阅读(1301) 评论(0) 推荐(0) 编辑
摘要: http://jalammar.github.io/illustrated-transformer/ 阅读全文
posted @ 2020-04-24 00:41 wqbin 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 自信息 自信息I表示概率空间中的单一事件或离散随机变量的值相关的信息量的量度。它用信息的单位表示,例如bit、nat或是hart,使用哪个单位取决于在计算中使用的对数的底。如下图: 对数以2为底,单位是比特(bit) 对数以e为底,单位是纳特(nat) 如英语有26个字母,假设在文章中出现的概率相等 阅读全文
posted @ 2020-04-22 15:53 wqbin 阅读(2305) 评论(0) 推荐(1) 编辑
摘要: 11 阅读全文
posted @ 2020-04-20 14:58 wqbin 阅读(212) 评论(0) 推荐(0) 编辑
摘要: 深度学习领域的NLP 阅读全文
posted @ 2020-04-19 13:06 wqbin 阅读(122) 评论(0) 推荐(0) 编辑
摘要: one-hot中只有一个非零向量,相对集中。而对于分布式表示,向量中有大量的非零向量,相对分散,把词的信息分布到各个向量中去了。这一点跟并行计算里的分布式并行相像。 Global Generation of Distributed Representation 在cs224n中Richard Soc 阅读全文
posted @ 2020-04-17 12:07 wqbin 阅读(188) 评论(0) 推荐(0) 编辑
上一页 1 ··· 9 10 11 12 13 14 15 16 17 ··· 59 下一页