上一页 1 ··· 5 6 7 8 9

2016年3月1日

摘要: 在进行数据分析时,绘图是必不可少的模式探索方式。用Python进行数据分析时,matplotlib和pandas是最常用到的两个库。1、matplotlib库的应用准备工作如下:打开ipython,输入命令分别导入numpy和matplotlib.pylab库。imp... 阅读全文

posted @ 2016-03-01 22:29 jackley 阅读(179) 评论(0) 推荐(0)

2016年2月28日

摘要: 利用python的pandas库进行数据分组分析十分便捷,其中应用最多的方法包括:groupby、pivot_table及crosstab,以下分别进行介绍。0、样例数据df = DataFrame({'key1':['a','a','b','b','a'],'key... 阅读全文

posted @ 2016-02-28 17:01 jackley 阅读(429) 评论(0) 推荐(0)

2016年2月27日

摘要: 本文数据源及分析方法均参考《利用python进行数据分析》一书。但我重新对数据分析目标和步骤进行了组织,可以更加清晰的呈现整个挖掘分析流程。 分析对象为美国某短域名网站记录的短域名生成数据(http://1usagov.measuredvoice.com/)。数据基本结构如下,可以看到内容包括所用浏 阅读全文

posted @ 2016-02-27 21:06 jackley 阅读(142) 评论(0) 推荐(0)

2016年2月26日

摘要: 通常使用ipython的%logstart日志功能时,仅开启输入的记录。 例如在ipython中开启%logstart后,记录的日志文件内容如下: 如果想不仅记录print "test"这条指令,同时还能记录输出test怎么办呢。 这里可以使用-o选项,即在ipython中输入%logstart - 阅读全文

posted @ 2016-02-26 14:30 jackley 阅读(176) 评论(0) 推荐(0)

2016年2月23日

摘要: 最近在读《R语言与网站分析》,书中对分类、聚类算法的讲解通俗易懂,和数据挖掘理论一起看的话,有很好的参照效果。 然而,这么好的讲解,作者居然没提供对应的数据集。手痒之余,我自己动手整理了一个可用于分类算法的数据集(下载链接:csdn下载频道搜索“R语言与网站分析:数据集样例及分类算法实现”),并用R 阅读全文

posted @ 2016-02-23 22:53 jackley 阅读(337) 评论(0) 推荐(0)

2016年2月20日

摘要: 初学git,用来下载github上的数据和源代码,具体步骤如下。1、百度搜索git并下载:本想从github直接下载安装,无奈国外服务器的下载速度太慢,建议国内的直接搜索下载完整安装版。2、完成git程序安装:双击安装包,跟着提示一步步往下(默认选项即可)。3、点击安... 阅读全文

posted @ 2016-02-20 11:11 jackley 阅读(269) 评论(0) 推荐(0)

2016年1月17日

摘要: 代码:File file= newFile("demo"+File.separator+"HelloWorld.txt");file.createNewFile(); 报错:java.io.IOException:系统找不到指定的路径。 atjav... 阅读全文

posted @ 2016-01-17 00:22 jackley 阅读(524) 评论(0) 推荐(0)

2016年1月8日

摘要: 报错原文:Cannot make a static reference to the non-static method maxArea(Shape[]) from the type ShapeTestb 报错原因:在一个类中写了一个public void maxAr... 阅读全文

posted @ 2016-01-08 19:51 jackley 阅读(4338) 评论(0) 推荐(0)

上一页 1 ··· 5 6 7 8 9