会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
TopCoderのZeze
At Ease, What You Want, Time Will Give You
首页
新随笔
联系
订阅
管理
上一页
1
···
4
5
6
7
8
9
10
11
12
···
33
下一页
2017年5月10日
【Ubuntu】任务管理器loadruner
摘要: linux1 准备工作 可以通过两种方法验证服务器上是否配置了rstatd守护程序: ①使用rup命令,它用于报告计算机的各种统计信息,其中就包括rstatd的配置信息。使用命令rup 10.130.61.203,此处10.130.61.203是要监视的linux/Unix服务器的Ip,如果该命令返
阅读全文
posted @ 2017-05-10 16:04 陈泽泽
阅读(675)
评论(0)
推荐(0)
2017年5月9日
【Ubuntu】服务器状态命令
摘要: 序号 命令名称 命令 1 查看Ubuntu版本 cat /etc/issue2 查看物理CPU个数 cat /proc/cpuinfo| grep "physical id"| sort| uniq| wc -l3 查看每个物理CPU中core的个数(即核数) cat /proc/cpuinfo|
阅读全文
posted @ 2017-05-09 15:28 陈泽泽
阅读(1268)
评论(0)
推荐(0)
2017年5月8日
【Ensemble methods】组合方法&集成方法
摘要: 机器学习的算法中,讨论的最多的是某种特定的算法,比如Decision Tree,KNN等,在实际工作以及kaggle竞赛中,Ensemble methods(组合方法)的效果往往是最好的,当然需要消耗的训练时间也会拉长。 所谓Ensemble methods,就是把几种机器学习的算法组合到一起,或者
阅读全文
posted @ 2017-05-08 23:32 陈泽泽
阅读(619)
评论(0)
推荐(0)
【Bootstrap Method】Evaluating The Accuracy of a Classifier
摘要: 自助法介绍: 非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法,也称为自助法。其核心思想和基本步骤如下:(1)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。 (2)根据抽出的样本计算给定的统计量T。 (3)重复上述B次(一般大于1000),得到N个统计量
阅读全文
posted @ 2017-05-08 23:21 陈泽泽
阅读(307)
评论(0)
推荐(0)
2017年5月5日
【Professional English】Words Summary
摘要: 01、数据库管理系统(Database Management Systems,DBMS) A database management system (DBMS) is a computer software application that interacts with the user, othe
阅读全文
posted @ 2017-05-05 10:55 陈泽泽
阅读(323)
评论(0)
推荐(0)
2017年5月3日
【神经网络】Reducing the Dimensionality of Data with Neural Networks
摘要: 这篇paper来做什么的? 用神经网络来降维、之前降维用的方法是主成分分析法PCA,找到数据集中最大方差方向。(附:降维有助于分类、可视化、交流和高维信号的存储) 这篇paper提出了一种非线性的PCA 的推广,通过一个小的中间层来重构高维输入向量,训练一个多层神经网络。利用一个自适应的、多层的编码
阅读全文
posted @ 2017-05-03 14:41 陈泽泽
阅读(784)
评论(0)
推荐(0)
2017年4月28日
【Deep Learning】Hinton. Reducing the Dimensionality of Data with Neural Networks Reading Note
摘要: 2006年,机器学习泰斗、多伦多大学计算机系教授Geoffery Hinton在Science发表文章,提出基于深度信念网络(Deep Belief Networks, DBN)可使用非监督的逐层贪心训练算法,为训练深度神经网络带来了希望。如果说Hinton 2006年发表在《Science》杂志上
阅读全文
posted @ 2017-04-28 14:50 陈泽泽
阅读(1654)
评论(0)
推荐(0)
2017年4月14日
【Python爬虫】教务处模拟登陆
摘要: Python2模拟登陆获取cookie 直接从本地读取cookie模拟登陆 Python3版本
阅读全文
posted @ 2017-04-14 16:12 陈泽泽
阅读(1931)
评论(0)
推荐(1)
Python之Cookielib
摘要: cookielib模块的主要作用是提供可存储cookie的对象,以便于与urllib2模块配合使用来访问Internet资源。Cookielib模块非常强大,我们可以利用本模块的CookieJar类的对象来捕获cookie并在后续连接请求时重新发送,比如可以实现模拟登录功能。该模块主要的对象有Coo
阅读全文
posted @ 2017-04-14 15:42 陈泽泽
阅读(618)
评论(0)
推荐(0)
Python爬虫设置Headers
摘要: Python设置Headers 这样,我们设置了一个headers,在构建request时传入,在请求时,就加入了headers传送,服务器若识别了是浏览器发来的请求,就会得到响应。 另外,我们还有对付”反盗链”的方式,对付防盗链,服务器会识别headers中的referer是不是它自己,如果不是,
阅读全文
posted @ 2017-04-14 11:38 陈泽泽
阅读(21571)
评论(0)
推荐(0)
Python爬虫之Urllib库的基本使用
摘要: Python爬虫之Urllib库的基本使用 其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写 运行结果是完全一样的,只不过中间多了一个request对象,推荐大家这么写,因
阅读全文
posted @ 2017-04-14 11:32 陈泽泽
阅读(385)
评论(0)
推荐(0)
2017年4月12日
GBDT 迭代决策树
摘要: GBDT(Gradient Boosting Decision Tree) 又叫 MART(Multiple Additive Regression Tree),是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和SVM一起被认为是泛化能力(genera
阅读全文
posted @ 2017-04-12 15:01 陈泽泽
阅读(262)
评论(0)
推荐(0)
2017年4月2日
【网络爬虫】微信公众号采集
摘要: # WeixinCrawler 根据搜狗搜索 关键词采集 微信公众号和相应推文 采集策略:深度搜索采集 核心代码: Github地址: https://github.com/chzeze/WeixinCrawler
阅读全文
posted @ 2017-04-02 23:08 陈泽泽
阅读(522)
评论(0)
推荐(0)
2017年4月1日
【爬虫】通用抽取网页URL
摘要: package model; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.HashSet; import java.util.Set; import org.apac...
阅读全文
posted @ 2017-04-01 15:49 陈泽泽
阅读(791)
评论(0)
推荐(0)
2017年3月31日
【CNN】卷积神经网络
摘要: 什么是卷积神经网络 卷积神经网络是一种特殊的、简化的深层神经网络模型,它的每个卷积层都是由多个卷积滤波器组成。它最先由lecun在LeNet[40]中提出,网络结构如下图所示。在cnn中,图像的一小部分(局部感受区域)作为层级结构的最低层的输入,信息再依次传输到不同的层,每层通过多个卷积滤波器去获得
阅读全文
posted @ 2017-03-31 10:02 陈泽泽
阅读(891)
评论(0)
推荐(0)
上一页
1
···
4
5
6
7
8
9
10
11
12
···
33
下一页
公告