上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页
摘要: 一、请知晓 本文是基于Event Recommendation Engine Challenge分步解析第一步,需要读者先阅读上篇文章解析 二、用户相似度计算 第二步:计算用户相似度信息 由于用到:users.csv,我们先看看其内容(看前10行) 结果如下,有国家,有地区: 我们使用locale和 阅读全文
posted @ 2019-03-07 17:25 河水青山1 阅读(833) 评论(0) 推荐(0)
摘要: 一、简介 在机器学习中,我们常常需要把训练好的模型存储起来,这样在进行决策时直接将模型读出,而不需要重新训练模型,这样就大大节约了时间 Python提供的pickle模块就很好地解决了这个问题,它可以序列化对象并保存到磁盘中,并在需要的时候读取出来,任何对象都可以执行序列化操作 二、使用 (1)pi 阅读全文
posted @ 2019-03-07 14:08 河水青山1 阅读(760) 评论(0) 推荐(0)
摘要: 5.1 MNIST数据处理 MNIST是NIST数据集的一个子集,包含60000张图片作为训练数据,10000张作为测试数据,其中每张图片代表0~9中的一个数字,图片大小为28*28(可以用一个28*28矩阵表示) 为了清楚表示,用下图14*14矩阵表示了,其实应该是28*28矩阵 TF提供了一个类 阅读全文
posted @ 2019-02-22 13:43 河水青山1 阅读(350) 评论(1) 推荐(0)
摘要: 一、简介 我们知道在windows下输入:win + r,会弹出下面的窗口,而在下面的窗口出现后我们接着按下esc键,下面的窗口会消失 现在设想我们想在python代码里控制键盘,想通过运行代码->弹出上面的窗口->按下esc->窗口消失,那么如何实现这样控制键盘的功能呢? python中pyaut 阅读全文
posted @ 2019-02-21 14:12 河水青山1 阅读(700) 评论(0) 推荐(0)
摘要: 一、简述 mysql与oracle相比小,便宜,装机量大,下载地址:https://www.mysql.com/downloads/,去找Community Edition,然后根据自己的Windows是32位还是64位下载对应的版本 这里本人的是32位的,并且这里我选择了一个老版本的:https: 阅读全文
posted @ 2019-02-12 12:23 河水青山1 阅读(330) 评论(0) 推荐(0)
摘要: 两方面(发散,相关)~三方法(FWE) F:方皮卡互 W:RFE E:惩罚树 一、简介 我们的数据处理后,喂给算法之前,考虑到特征的实际情况,通常会从两个方面考虑来选择特征: 1)特征是否发散:如果一个特征不发散,例如方差接近于0,也就是说样本在这个特征上基本上没有差异,这个特征对于样本的区分并没有 阅读全文
posted @ 2019-02-11 16:31 河水青山1 阅读(893) 评论(0) 推荐(0)
摘要: 一、python内存管理 这个问题需要从三个方面来说: 1)对象的引用计数机制(四增五减) 2)垃圾回收机制(手动自动,分代回收) 3)内存池机制(大m小p) 1)对象的引用计数机制 要保持追踪内存中的对象,Python使用了引用计数这一简单的技术。sys.getrefcount(a)可以查看a对象 阅读全文
posted @ 2019-01-29 15:31 河水青山1 阅读(1118) 评论(0) 推荐(0)
摘要: 一、从不订购的客户 题目描述: 某网站包含两个表,Customers 表和 Orders 表。编写一个 SQL 查询,找出所有从不订购任何东西的客户 例如给定上述表格,你的查询应返回: 二、超过经理收入的员工 题目描述: Employee 表包含所有员工,他们的经理也属于员工。每个员工都有一个 Id 阅读全文
posted @ 2019-01-25 09:47 河水青山1 阅读(235) 评论(0) 推荐(0)
摘要: 四、模型测试 1)下载文件 在已经阅读并且实践过前3篇文章的情况下,读者会有一些文件夹。因为每个读者的实际操作不同,则文件夹中的内容不同。为了保持本篇文章的独立性,制作了可以独立运行的文件夹目标检测。 链接:https://pan.baidu.com/s/1tHOfRJ6zV7lVEcRPJMiWa 阅读全文
posted @ 2019-01-02 14:34 河水青山1 阅读(1460) 评论(0) 推荐(0)
摘要: 一、简介 此文是对利用jieba,word2vec,LR进行搜狐新闻文本分类的准确性的提升,数据集和分词过程一样,这里就不在叙述,读者可参考前面的处理过程 经过jieba分词,产生24000条分词结果(sohu_train.txt有24000行数据,每行对应一个分词结果) 1)TfidfVector 阅读全文
posted @ 2018-12-29 11:24 河水青山1 阅读(5048) 评论(2) 推荐(1)
上一页 1 ··· 3 4 5 6 7 8 9 10 11 ··· 13 下一页