随笔分类 -  Python

摘要:VirtualEnv可以方便的解决不同项目中对类库的依赖问题。这通常是通过以下方式实现的:首先将常用的类库安装在系统环境中;然后为每个项目安装独立的类库环境。这样子可以保证每个项目都运行在独立的类库环境中。 本文简要的介绍如何方便的在Windows环境下使用VirtualEnv进行开发工作。 阅读全文
posted @ 2015-05-04 13:20 ChaoSimple 阅读(42033) 评论(4) 推荐(8) 编辑
摘要:标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。 实现时,有两种不同的方式: 阅读全文
posted @ 2014-12-09 14:14 ChaoSimple 阅读(307140) 评论(9) 推荐(25) 编辑
摘要:在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。 首先需要说明的是,numpy的数组中可以使用np.nan/np.NaN(Not A Number)来代替缺失值,对于数组中是否存在nan可以使用np.isnan()来判定。 使用type(np.nan)或者type(np.NaN)可以发现改值其实属于float类型,代码如下: 阅读全文
posted @ 2014-12-09 14:12 ChaoSimple 阅读(31327) 评论(1) 推荐(2) 编辑
摘要:本文是对pandas官方网站上《10 Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下面格式引入所需要的包: 一、 创建对象 可以通过 Data Structure Intro Setion 来查看有关该节内容的详细信息... 阅读全文
posted @ 2014-12-09 13:46 ChaoSimple 阅读(621878) 评论(18) 推荐(34) 编辑
摘要:描述了使用pyInstaller打包使用jieba分词的文件时出现的一种错误,分析了导致该错误的原因,最后给出了解决方案。 阅读全文
posted @ 2014-11-16 17:22 ChaoSimple 阅读(2981) 评论(0) 推荐(0) 编辑
摘要:本文使用两个实例说明了假设检验的过程,在Python中使用KS检验来验证一个数列是否是服从正态分布,两个数列是否服从相同分布等问题。 阅读全文
posted @ 2014-11-11 20:35 ChaoSimple 阅读(45530) 评论(3) 推荐(4) 编辑
摘要:本文通过代码介绍了使用Matplotlib绘图时如何为X轴添加刻度及设置显示文本的方法。 阅读全文
posted @ 2014-10-28 21:55 ChaoSimple 阅读(41934) 评论(0) 推荐(2) 编辑
摘要:本文介绍了使用Python和C#编程时借助Json字符串进行消息传递,并给出了两种不同的实现方式。 阅读全文
posted @ 2014-10-20 20:50 ChaoSimple 阅读(10409) 评论(0) 推荐(0) 编辑
摘要:本文用代码描述了使用Python和C#混合编程时,如何使用Json作为中间件进行自定义类对象的转换。 阅读全文
posted @ 2014-10-19 21:55 ChaoSimple 阅读(7282) 评论(0) 推荐(4) 编辑
摘要:本文介绍了如何在Matplotlib中添加Latex风格的公式 阅读全文
posted @ 2014-10-17 16:19 ChaoSimple 阅读(23053) 评论(0) 推荐(1) 编辑
摘要:数据分析的过程中,往往需要对所建立的模型进行可视化,并调整其中的某些参数。 通常情况下,在Python中可以通过Matplotlib来进行绘制图像。然而该绘制过程是静态的,也就是每次调整完参数需要重新调用绘图语句进行绘图展示。我们的目标是结合GUI组件,实现对模型参数的交互式绘图。这样,可以在展示出的GUI界面中动态的调整模型的参数,并绘制图像。 阅读全文
posted @ 2014-10-16 21:01 ChaoSimple 阅读(32585) 评论(5) 推荐(0) 编辑