摘要: 1. 有一个文件user.txt,每行一条user记录,共若干行,可以实现“统计出现次数最多的前3个user及其次数”的命令是? sort user.txt | uniq -c | sort -m | head -n 3 sort 命令将以默认的方式将文本文件的第一列以ASCII 码的次序排列,并将 阅读全文
posted @ 2019-04-13 16:49 miya_zzz 阅读(496) 评论(0) 推荐(0) 编辑
摘要: 什么是哈希? 哈希,也称散列。在某种程度上,散列是与排序相反的一种操作,排序是将集合中的元素按照某种方式比如大小顺序排列在一起,而散列通过计算哈希值,打破元素之间原有的关系,使集合中的元素按照散列函数的分类进行排列。 为什么用哈希? 我们通常使用数组或者链表来存储元素,一旦存储的内容数量特别多,需要 阅读全文
posted @ 2019-02-25 17:01 miya_zzz 阅读(1206) 评论(0) 推荐(0) 编辑
摘要: 我来说一下我创建第一个spider小demo的过程,以及过程中出现的问题,供大家参考,希望大家少走弯路! 我的是windows系统,在pycharm上编码的。下面是创建运行爬虫的步骤: 一、创建一个scrapy项目 进入打算存储代码的目录中,在控制台中输入以下命令: scrapy startproj 阅读全文
posted @ 2018-11-29 21:05 miya_zzz 阅读(228) 评论(0) 推荐(0) 编辑
摘要: 一、命令行输入:sudo vim /etc/..(某文件) 若要编辑该文件:1.敲字母i 2.对文件编辑完后,按Esc,:q(退出不保存);:wq(保存退出) 二、安装python3 1.安装必要工具 yum -y install net-tools yum -y install wget 2. 安 阅读全文
posted @ 2018-11-26 20:33 miya_zzz 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 最近在学习数据分析线性回归算法时,产生了很多疑问。作为初学者,我认为应该先从基本概念上进行一些深度理解。下面将我的一些思考总结如下: 线性回归模型为: (1) 其中ε是剩余误差,假设它服从的是高斯分布,然后因此就将线性回归模型和高斯模型联合起来,获取公式如下: 到这里我是完全没看懂! 对于线性回归我 阅读全文
posted @ 2018-09-01 22:56 miya_zzz 阅读(1976) 评论(0) 推荐(0) 编辑