2015年7月22日

Scrapy安装及使用

摘要: 本文介绍了常见的网络爬虫工具*Scrapy的安装及使用过程*,另外介绍了Scrapy运行时常见问题以及相应解决办法,希望能对您的学习带来帮助。 Scrapy简介Scrapy是一个快速高级屏幕抓取和爬行网页的框架,用来抓取的网站,从网页中抽取结构化的数据。它可以用于广泛的用途,从数据... 阅读全文

posted @ 2015-07-22 20:35 爱你一万年123 阅读(404) 评论(0) 推荐(0)

大数据,云计算,物联网和移动互联网关系图解

摘要: 我们在《互联网进化论》一书中提出“互联网的未来功能和结构将于人类大脑高度相似,也将具备互联网虚拟感觉,虚拟运动,虚拟中枢,虚拟记忆神经系统” ,并绘制了一幅互联网虚拟大脑结构图。 根据这一观点,我们尝试分析目前互联网最流行的四个概念————-大数据,云计算,物联网和移动互联网与传统... 阅读全文

posted @ 2015-07-22 13:21 爱你一万年123 阅读(746) 评论(0) 推荐(0)

程序员必须知道的10大基础算法及讲解

摘要: 快速排序算法快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大... 阅读全文

posted @ 2015-07-22 13:20 爱你一万年123 阅读(242) 评论(0) 推荐(0)

数据挖掘笔记

摘要: 数据挖掘(KDD)(1)数据清理(消除噪声和删除不一致数据) (2)数据集成(多种数据源可以组合在一起) (3)数据选择(从数据库中提取与分析任务相关的数据) (4)数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式) (5)数据挖掘(基本步骤,使用智能方法提取数据模式... 阅读全文

posted @ 2015-07-22 13:18 爱你一万年123 阅读(249) 评论(0) 推荐(0)

孤立点挖掘算法

摘要: 简介孤立点是数据集中不符合一般模型的那些对象,即和其它 的数据有着不同的性质。它可能是度量或执行错误所导致的,也可能是固有数据变异性的结果。对此,Hawkins[1]给出了其本质性定义:孤立点是在数据集中与众不同的数据,使人怀疑这些数据 并非随机偏差,而是产生于完全不同的机制。 一... 阅读全文

posted @ 2015-07-22 13:17 爱你一万年123 阅读(856) 评论(0) 推荐(1)

数据结构算法代码

摘要: 本文总结了关于BF算法、strassen矩阵乘法、TSP问题、大整数乘法、堆排序、多元最短路径、汉诺塔等常见的16种基本算法代码,编程语言采用C/C++实现,通过,经测试编译均能希望对初学算法的人能有所帮助。 BF算法#include #include using namespac... 阅读全文

posted @ 2015-07-22 13:15 爱你一万年123 阅读(493) 评论(0) 推荐(0)

导航