摘要:参考: iconv -f UTF8 -t GB18030 a.csv >b.csv 或iconv -f UTF-8 -t GB18030 a.csv >b.csv
阅读全文
摘要:更改 sys.defaultencoding 为文件的编码方式 #! /usr/bin/env python # -*- coding: utf-8 -*- import sys reload(sys) # Python2.5 初始化后删除了 sys.setdefaultencoding 方法,我们
阅读全文
摘要:浅拷贝:直接赋值,传递对象的引用而已 深拷贝:包含对象里面的自对象的拷贝,所以原始对象的改变不会造成深拷贝里任何子元素的改变 不多说,之间看结果。
阅读全文
摘要:添加NumPy headers 给 CFLAGS: export CFLAGS="-I /usr/local/lib/python2.7/site-packages/numpy/core/include $CFLAGS"再次执行,done!
阅读全文
摘要:链接: Cython是一个快速生成Python扩展模块的工具,从语法层面上来讲是Python语法和C语言语法的混血,当Python性能遇到瓶颈时,Cython直接将C的原生速度植入Python程序,这样使Python程序无需使用C重写,能快速整合原有的Python程序,这样使得开发效率和执行效率都有
阅读全文
摘要:index_col : int or sequence or False, default None 用作行索引的列编号或者列名,如果给定一个序列则有多个行索引。 如果文件不规则,行尾有分隔符,则可以设定index_col=False 来使得pandas不使用第一列作为行索引。 如: train_d
阅读全文
摘要:level1_list = [os.path.join(base_path, f) for f in listdir(base_path) if os.path.isdir(os.path.join(base_path, f))] 结合路径: 原来的目录层级:c:/a/b/c/test.py pri
阅读全文
摘要:UnicodeDammit 是BS内置库, 主要用来猜测文档编码. 编码自动检测 功能可以在Beautiful Soup以外使用,检测某段未知编码时,可以使用这个方法: from bs4 import UnicodeDammit dammit = UnicodeDammit("Sacr\xc3\xa
阅读全文
摘要:链接: 计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。Unicode把所有语言都统一到一套编码里,这样就不会再有乱码问题了。Unicode标准也在不断发展,但最常用的是用两个字节表示一个字符(如果要用到非常偏僻的字符,就需要4个字节)。现代操作系统和大多数编程语言都直接支持U
阅读全文
摘要:转自: http://pythonguidecn.readthedocs.io/zh/latest/dev/virtualenvs.html virtualenv 是一个创建隔绝的Python环境的 工具。virtualenv创建一个包含所有必要的可执行文件的文件夹,用来使用Python工程所需的包。 它可以独立使用,代替Pipenv。 通过pip安装virtualenv: $ pi...
阅读全文
摘要:转载请注明出处 http://www.cnblogs.com/pengwang52/。
阅读全文
摘要:转载需注明出处。如: ::before 伪元素xpath css_selector、 id、 class_name各种定位失效,可以选择用, .get_attribute('innerHTML')方法,拿到源码,再进行正则匹配。 ::before "857" ...
阅读全文
摘要:详情见>>> import re >>> s = "adfad asdfasdf asdfas asdfawef asd adsfas " >>> reObj1 = re.compile('((\w+)\s+\w+)') >>> reObj1.findall(s) [('adfad asdfasdf', 'adfad'), ('asdfas asdfawef', 'asdfas'), ('as...
阅读全文
摘要:转:编码:urllib.quote(string[, safe]),除了三个符号“_.-”外,将所有符号编码,后面的参数safe是不编码的字符, 使用的时候如果不设置的话,会将斜杠,冒号,等号,问号都给编码了。 如下: >>> import urllib >>> print urllib.quote("http://neeao.com/index.php?id=1") http%3A//n...
阅读全文
摘要:#!/bin/bash i="this/is/a/path.config" name=${i#*/} path=${i%/*} echo $name echo $path is/a/path.config this/is/a
阅读全文
摘要:阅读来源: 字符串在Python内部的表示是unicode编码,因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode)成unicode,再从unicode编码(encode)成另一种编码。 decode的作用是将其他编码的字符串转换成unicode编码
阅读全文
摘要:Python startswith() 方法用于检查字符串是否是以指定子字符串开头,如果是则返回 True,否则返回 False。如果参数 beg 和 end 指定值,则在指定范围内检查。 结果:
阅读全文