爬虫_numpy
1. 安装numpy
打开cmd 输入:pip install numpy
2. numpy数据类型
名称 | 描述 |
---|---|
bool_ | 布尔型数据类型(True 或者 False) |
int_ | 默认的整数类型(类似于 C 语言中的 long,int32 或 int64) |
intc | 与 C 的 int 类型一样,一般是 int32 或 int 64 |
intp | 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64) |
int8 | 字节(-128 to 127) |
int16 | 整数(-32768 to 32767) |
int32 | 整数(-2147483648 to 2147483647) |
int64 | 整数(-9223372036854775808 to 9223372036854775807) |
uint8 | 无符号整数(0 to 255) |
uint16 | 无符号整数(0 to 65535) |
uint32 | 无符号整数(0 to 4294967295) |
uint64 | 无符号整数(0 to 18446744073709551615) |
float_ | float64 类型的简写 |
float16 | 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位 |
float32 | 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位 |
float64 | 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位 |
complex_ | complex128 类型的简写,即 128 位复数 |
complex64 | 复数,表示双 32 位浮点数(实数部分和虚数部分) |
complex128 | 复数,表示双 64 位浮点数(实数部分和虚数部分) |
实例 1
import numpy as np
# 使用标量类型
dt = np.dtype(np.int32)
print(dt)
实例 2
import numpy as np
# int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
dt = np.dtype('i4')
print(dt)
实例 3
# 首先创建结构化数据类型
import numpy as np
dt = np.dtype([('age',np.int8)])
print(dt)
实例 4
# 将数据类型应用于 ndarray 对象
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print(a)
3. 创建数组
import numpy as np
# 默认为浮点数
x = np.zeros(5)
print(x)
# 设置类型为整数
y = np.zeros((5,), dtype = np.int) print(y)
# 自定义类型
z = np.zeros((2,2), dtype = [('x', 'i4'), ('y', 'i4')])
print(z)
4. 操作数组
实例
import numpy as np
a = np.arange(10)
s = slice(2,7,2)
# 从索引 2 开始到索引 7 停止,间隔为2
print (a[s])
实例
import numpy as np
a = np.arange(10)# [0 1 2 3 4 5 6 7 8 9]
b = a[5]
实例 import numpy as np
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print (a[...,1])
# 第2列元素 print (a[1,...])
# 第2行元素 print (a[...,1:])
# 第2列及剩下的所有元素print(b)
实例
#可以加减乘除
import numpy as np
a = np.array([1,2,3,4])
b = np.array([10,20,30,40])
c = a * b
print (c)
函数
描述
add() 对两个数组的逐个字符串元素进行连接
import numpy as np
print ('连接两个字符串:')
print (np.char.add(['hello'],[' xyz']))
multiply() 返回按元素多重连接后的字符串
import numpy as np
print (np.char.multiply('Runoob ',3))
center() 居中字符串
import numpy as np
# np.char.center(str , width,fillchar) :
# str: 字符串,width: 长度,fillchar: 填充字符
print (np.char.center('Runoob', 20,fillchar = '*'))
capitalize() 将字符串第一个字母转换为大写
import numpy as np
print (np.char.capitalize('runoob'))
title() 将字符串的每个单词的第一个字母转换为大写
import numpy as np
print (np.char.title('i like runoob'))
lower() 数组元素转换为小写
import numpy as np
#操作数组
print (np.char.lower(['RUNOOB','GOOGLE']))
# 操作字符串
print (np.char.lower('RUNOOB'))
upper() 数组元素转换为大写
import numpy as np
#操作数组
print (np.char.upper(['runoob','google']))
# 操作字符串
print (np.char.upper('runoob'))
split() 指定分隔符对字符串进行分割,并返回数组列表
import numpy as np
# 分隔符默认为空格
print (np.char.split ('i like runoob?'))
# 分隔符为 .
print (np.char.split ('www.runoob.com', sep = '.'))
splitlines() 返回元素中的行列表,以换行符分割
import numpy as np
# 换行符 \n
print (np.char.splitlines('i\nlike runoob?'))
print (np.char.splitlines('i\rlike runoob?'))
strip() 移除元素开头或者结尾处的特定字符
import numpy as np
# 移除字符串头尾的a 字符
print (np.char.strip('ashok arunooba','a'))
# 移除数组元素头尾的 a 字符
print (np.char.strip(['arunooba','admin','java'],'a'))
join() 通过指定分隔符来连接数组中的元素
import numpy as np
# 操作字符串
print (np.char.join(':','runoob'))
# 指定多个分隔符操作数组元素
print (np.char.join([':','-'],['runoob','google']))
replace() 使用新字符串替换字符串中的所有子字符串
import numpy as np
print (np.char.replace ('i like runoob', 'oo', 'cc'))
decode() 数组元素依次调用str.decode
import numpy as np
a = np.char.encode('runoob', 'cp500')
print (a)
encode() 数组元素依次调用str.encode
import numpy as np
a = np.char.encode('runoob', 'cp500')
print (a)