随笔分类 - python
摘要:Python初次连接数据库总结 用JDBC访问Oracle,即java连接本机数据库的时候,地址用localhost和127.0.0.1都可以。但是这两者有什么区别?哪个更好?有很多人认为这两个是完全一样的,也有人认为127.0.0.1更好,因为是本地IP,不需要从域名解析。 一. 两者区别 1.
阅读全文
摘要:from sklearn import svm 1. 数据预处理 针对《Python数据分析与挖掘实战》一书中第9章“基于水色图像的水质评价”。需要对原始的203张图片进行预处理,得到专家样本集。然后再使用svm分类器进行训练测试。 2. svm 部分原始数据展示: 得到结果: cm_train:
阅读全文
摘要:解决Matplotlib绘图中,负号不正常显示问题。 添加两行代码: 更多关于Matplotlib绘图问题,可参考大牛博客http://www.cnblogs.com/awishfullyway/p/6124668.html
阅读全文
摘要:TSNE提供了一种有效的降维方式,让我们对高于2维数据的聚类结果以二维的方式展示出来: 结果图: 原数据data_zs是三维的数据!
阅读全文
摘要:不想动手编辑了,偷个懒。。。取自《Python数据分析与挖掘实战》第5章 还没用过"Kappa统计"和"多类混淆矩阵"!
阅读全文
摘要:pandas是python的一个大数据模块,pandas基本的数据结构是Dataframe和Series。pandas在处理大规模数据时,真的优势很明显。 安装pandas:pip install pandas 导入pandas:import pandas as pd pandas有一些依赖库: 比
阅读全文
摘要:以查找re模块源代码为例,输入代码: import re re.__file__ 实例如图:
阅读全文
摘要:适用情况:在test.py模块中需要导入其他文件下的模块model.py 方法: 在test.py模块中添加以下脚本: import syssys.path.append("model.py的文件路径")import model导入模块关键是能够根据sys.path环境变量的值,找到具体模块的路径。
阅读全文
摘要:机器学习过程分为训练过程和预测过程。训练过程得到一个模型,预测过程得到预测结果。为了节省时间,最好能够在每次执行预测时,调用已经构造好的模型,而不是每次预测前都需要重新训练一次模型。 以“决策树”为例,最好能够在每次执行分类时调用已经构造好的决策树。可以使用Python中的pickle模块序列化对象
阅读全文
摘要:python27中matplotlib并不支持直接使用中文,此处提供四种方法解决这个问题: Method 1: 在代码中插入以下三行代码: 经实测,这种解决办法会引发一个问题就是,就是同时导入numpy和pylab两个模块的所有方法时,需要"np.random()",才能正确使用random(),不
阅读全文
摘要:“Make a script both importable and executable”: 让脚本模块既可以被调用(import hello),又可以自己运行。 在C/C++/Java中,main()函数是程序执行的起点,在Python中,'__main__'也有类似的运行机制,但方式却截然不同
阅读全文
摘要:python实战之线性回归、局部加权回归 1.基本概念与思想 回归:求回归方程中回归系数的过程称为回归。 局部加权思想:给待预测点附近的每个点赋予一定的权重。 2.线性回归 回归方程的解: Θ=(XTX)-1XTY (1) 其中,Θ表示回归系数矩阵,X表示样本矩阵,Y表示样本类标矩阵。 3.局部加权
阅读全文
摘要:解决问题: 1 一张画布画多个子图; 2 matplotlib绘图中文不能显示问题 3 线绘图函数plt.plot()与散点绘图函数plt.scatter()之间的区别 上代码: 注意:1 代码中调用了局部加权回归主函数"lwlrTest()",参见"python--局部加权回归" 2 为了解决绘图
阅读全文
摘要:功能:python画2D图 直接上代码,注释很详细! 关于官方pyplot.scatter()函数详解见:http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.scatter
阅读全文
摘要:系统:windows为主 python 版本:2.7 1. 背景 在Python中,文件对象sys.stdin、sys.stdout和sys.stderr分别对应解释器的标准输入、标准输出和标准出错流。在程序启动时,这些对象的初值由sys.__stdin__、sys.__stdout__和sys._
阅读全文
摘要:Coding by Chang, 2017/04/30 1.主成分分析(PCA) 1.1 PCA数学模型 最大可分性出发(参考《机器学习》周志华):样本点在超平面上的投影能尽可能分开。 即应该使投影后样本点的方差最大化: maxtr(WTXXTW) s.t. WTW=I 这个目标函数可以通过对协方差
阅读全文
摘要:Coding by Chang,2017/4/28 编程环境:python27, 依赖库:numpy, 实现算法:主成分分析(pca) 代码实现:
阅读全文
摘要:NOTE: 文件中有中文时(#注释也算),一定要加入如下两句, #!/usr/bin/python # -*- coding:utf-8 -*-
阅读全文

浙公网安备 33010602011771号