随笔分类 - python
记录一些比较特殊的python程序
摘要:背景简介 爬取外国的某两个网站的数据,网站都没有被墙,爬取三种数据。 A: 爬取页面并存储到数据库 B: 爬取页面内的表格内数据并存储到数据库 C: 爬取页面,分析页面并将页面的所有数据分类存入数据库,且页面内存在下级页面,也需要进行同样的操作 python包选取以及使用 连接链接 在windows
阅读全文
摘要:场景: 连接postgre数据库并进行增删改查操作,为了方便复用,自己写了一个工具类,其他模块使用时需要导入该模块 详情: 工具类模块目录如下: python tools test test.py(需要导入工具类模块的代码) postgre(工具类) \__init__.py u
阅读全文
摘要:请从上到下安装 numpy importlib pytz python dateutil pandas scipy pasty statemodels backports.functools_lru_cache pyparsing cycler subprocess32 3.5.0rc1 matpl
阅读全文
摘要:导入包 回归拟合的建立 创建一个线性模型,用我们的X_parameters和Y_parameter训练它。 预测
阅读全文
摘要:在导入包显示画图时,出错:ImportError: No module named '_tkinter 解决办法:通常原因是tkinter和tk devel缺失 ERROR: matplotlib的图显示问题 libtk8.5.so cannot open shared object SOLUTIO
阅读全文
摘要:```python
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# hive util with hive server2 """
@author:
@create:
""" __author__ = 'knktc'
__version__ = '0.1' import pyhs2 class HiveClient: def ...
阅读全文
摘要:figure的使用 设置x/y坐标轴刻度 刻度设置 以xticks为例: 获取或者设置当前刻度位置和文本的 x limits: 关键字 ,如果有其他的参数则是 Text 属性。例如,旋转长的文本标注。 Axis containers matplotlib.axis.Axis 对象负责刻度线、格网线、
阅读全文
摘要:Python图表绘制:matplotlib绘图库入门 matplotlib 简介 matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。 它的文档相当完备,并且Gallery页
阅读全文
摘要:series Series 是pandas两大数据结构中(DataFrame,Series)的一种。 创建Series Series的定义 :Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。 Series对象本质上是一个Nu
阅读全文
摘要:mean() 1. mean() 函数定义: mean`(a, axis=None, dtype=None, out=None, keepdims=) "[source\]" Compute the arithmetic mean along the specified axis. Returns
阅读全文
摘要:1、判断是否是数字 2、数学math 3、查看安装路径 4、字符串与日期的转换 5、 生成数字数组 6、除法保留小数 7、输出%
阅读全文
摘要:python获取当前路径 import os,sys 使用sys.path[0]、sys.argv[0]、os.getcwd()、os.path.abspath(__file__)、os.path.realpath(__file__) sys.path是Python会去寻找模块的搜索路径列表,sys
阅读全文
摘要:```python
def runShell(cmd): try: (status, output) = commands.getstatusoutput(cmd) except Exception, e: return (1, "") # write shell and shell's result into shelllog r...
阅读全文
摘要:```python coding:utf 8 __author__ = 'zzd' import xlrd open excelfile def open_excel(file): try: data = xlrd.open_workbook(file) return data except Exc
阅读全文
摘要:简介 龟叔 Guido van rossum 胶水语言 提供了非常完善的代码库 运行速度慢,大小写敏感 是解释型语言,也就是说,发布项目时相当于发布源代码 编译型语言,如C语言,运行以后生成exe文件,不能从exe文件反推出C语言代码 Python语言解释器: CPython 使用广泛 IP
阅读全文
摘要:有的项目使用tornado框架比较好,有的用Django框架比较好,容易发生冲突,这个时候可以建立一个虚拟的python环境。 1. 安装virtualenv包 2. 进入项目所在目录,执行命令 3. 进入tornadoenv文件夹里,里面的Scripts里面有python\pip等命令,该虚拟环境
阅读全文
摘要:系统配置:Windows10 x64, Visual Studio 2017, Python2.7.1 报错信息:error: Unable to find vcvarsall.bat 报错原因:在生成的时候,编译器从%PythonInstallPath%\distutils\msvc9compil
阅读全文
摘要:下载 第三方模块的下载地址:https://pypi.python.org/pypi 其他版本的第三方模块下载地址: pipy国内镜像目前有: 豆瓣 阿里云 中国科技大学 清华大学 华中理工大学 山东理工大学 1、安装 1.1 命令行下安装模块 例:xlrd模块 下载xlrd: tar.gz包解压后
阅读全文
摘要:一次、二次、三次指数平滑计算思想及代码 概述 一般常用到的指数平滑法为一次指数平滑、二次指数平滑和三次指数平滑,高次指数平滑一般比较难见到,因此本文着重介绍了一次、二次和三次指数平滑的特点与不同。 一次指数平滑一般应用于直线型数据,且一次指数平滑具有滞后性,可以说明有明显的时间性、季节性。 二次指数
阅读全文