上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 15 下一页
摘要: 协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组成一个排序的目录作为推荐给你.核心问题:1,如何确定一个用户是不是和你有相似品位?2.如何将邻居们的喜好组织成一个排序的目录?步骤:1.收集用户偏好 评分,投票,转发,保存书签... 阅读全文
posted @ 2015-09-24 07:18 农民阿姨 阅读(400) 评论(0) 推荐(0) 编辑
摘要: 奥卡姆剃刀定律(Occam's Razor, Ockham'sRazor)又称“奥康的剃刀”,是由14世纪逻辑学家、圣方济各会修士奥卡姆的威廉(William of Occam,约1285年至1349年)提出。这个原理称为“如无必要,勿增实体”,即“简单有效原理”。 阅读全文
posted @ 2015-09-23 19:23 农民阿姨 阅读(676) 评论(0) 推荐(0) 编辑
摘要: 欠拟合:对样本预测得不好,对新数据预测不好过拟合:对样本预测好,对新数据预测不好. 阅读全文
posted @ 2015-09-23 16:40 农民阿姨 阅读(186) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2015-09-23 16:28 农民阿姨 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 1.如果一味追求提高对训练数据的预测能力,所选模型的复杂度则往往会比真模型更高,这种现象称为过拟合(over-fitting ). 2.过拟合是指学习时选择的模型所包含的参数过多,以致于出现这一模型对已知数据预测得很好,但对未知数据预测很差的现象.3.可以说模型选择旨在避免过拟合并提高模型的预测能力... 阅读全文
posted @ 2015-09-23 11:48 农民阿姨 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 下载jettyhttp://www.eclipse.org/jetty/ 看好jdk 版本安装解压压缩包到指定目录,且将其目录路径定义为${JETTY_HOME}进入${JETTY_HOME}目录,然后运行“java -jar start.jar”,就可以启动Jetty server了启动:java... 阅读全文
posted @ 2015-09-23 11:43 农民阿姨 阅读(143) 评论(0) 推荐(0) 编辑
摘要: 一.启动命令 tar -zxvf solr-4.10.4.tgzcd solr-4.10.4\examplejava -jar start.jar 默认监听8983端口java -Djetty.port=8980 -jar start.jar 指定端口后台启动:java -DSTOP.PORT... 阅读全文
posted @ 2015-09-22 11:04 农民阿姨 阅读(210) 评论(0) 推荐(0) 编辑
摘要: 1.项目架构 2.详细技术点 1.解析,(依赖注入) 2,使用queue队列实现循环抓取 3.实现优先级队列并提取接口 4.使用log4j实现配置检查及日志打印 5.实现多线程爬虫并提取接口 6.实现url调度器 7.使用queue队列实现url随机榨取 8.使用redis队列实现url 随机抓取 10.使用httpclient 实现模拟登录 11.使用curator 监控爬虫的生命周期 1... 阅读全文
posted @ 2015-09-19 21:35 农民阿姨 阅读(3675) 评论(0) 推荐(0) 编辑
摘要: 一、常用命令:(hbase shell 进入终端) 1.创建表: create 'users','user_id','address','info' 表users,有三个列族user_id,address,info 2.列出全部表 list 3.得到标的信息 describe‘users’ 4.删除表 disable 'users' drop 'users‘ 5.清空表 trunca... 阅读全文
posted @ 2015-09-19 11:02 农民阿姨 阅读(490) 评论(0) 推荐(0) 编辑
摘要: 1.单机安装 redis官网:http://redis.io/解压:tar -zxvf redis-3.0.0.tar.gz编译、安装makemake install拷贝配置文件cp redis/redis.conf /etc/修改配置文件redis.confdaemonize yes(后台运行)logfile /usr/local/redis/log(日志文件)启动redis-serve... 阅读全文
posted @ 2015-09-17 18:38 农民阿姨 阅读(329) 评论(0) 推荐(0) 编辑
摘要: redis的常用命令主要分为两个方面、一个是键值相关命令、一个是服务器相关命令(redis-cli进入终端)1、键值相关命令keys * 取出当前所有的keyexists name 查看n是否有name这个keydel name 删除key name expire confirm 100 设置con... 阅读全文
posted @ 2015-09-17 18:07 农民阿姨 阅读(851) 评论(0) 推荐(0) 编辑
摘要: jdk.tools:jdk.tools是与JDK一起分发的一个JAR文件,可以如下方式加入到Maven项目中: jdk.tools jdk.tools 1.7 system ${JAVA_HOME}/lib/tools.jar详见Maven FAQ for adding dependencies t... 阅读全文
posted @ 2015-09-17 16:04 农民阿姨 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2015-09-16 18:28 农民阿姨 阅读(290) 评论(0) 推荐(0) 编辑
摘要: 接口的作用 1.在spide中创建一个私有接口 private Downloadable downlaodable 覆盖set get 方法 创建一个方法 Public Page down load (String url) { Page page = this.downloadable.download(url);//在这里传值 } 2然后Downloadable 接口中定义方法 P... 阅读全文
posted @ 2015-09-16 17:42 农民阿姨 阅读(160) 评论(0) 推荐(0) 编辑
摘要: http://www.python()tab.com/html/2013/pythonjichu_1010/582.html ()需要删除 阅读全文
posted @ 2015-09-15 22:49 农民阿姨 阅读(277) 评论(0) 推荐(0) 编辑
摘要: http://v.koolearn.com/c/2285-1.html 阅读全文
posted @ 2015-09-15 21:50 农民阿姨 阅读(192) 评论(0) 推荐(0) 编辑
摘要: 1.木桶效应(猪一样的队友) 2.羊群效应(从中) 3.马太效应() 沙丁鱼-鲶鱼 4.蝴蝶效应 阅读全文
posted @ 2015-09-15 07:38 农民阿姨 阅读(191) 评论(0) 推荐(0) 编辑
摘要: You are beautiful 阅读全文
posted @ 2015-09-15 07:32 农民阿姨 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 1.内存文件存储系统 Tachyon是一个开源分布式存储系统,拥有高性能、高容错等优点。并具有类Java的文件API、插件式的底层文件系统、兼容Hadoop MapReduce和 Apache Spark 等特征。Tachyon能够为集群框架(如Spark、MapReduce等)提供内存级速度的跨集群文件共享服务,官方号称最高比HDFS吞吐量高300倍。诞生于Berkeley的AMPLab实验室... 阅读全文
posted @ 2015-09-14 10:23 农民阿姨 阅读(159) 评论(0) 推荐(0) 编辑
摘要: http://news.cnblogs.com/n/528978/ 阅读全文
posted @ 2015-09-14 06:20 农民阿姨 阅读(143) 评论(0) 推荐(0) 编辑
上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 15 下一页