爬虫_numpy

1. 安装numpy

打开cmd 输入:pip install numpy

 

2. numpy数据类型

名称描述
bool_ 布尔型数据类型(True 或者 False)
int_ 默认的整数类型(类似于 C 语言中的 long,int32 或 int64)
intc 与 C 的 int 类型一样,一般是 int32 或 int 64
intp 用于索引的整数类型(类似于 C 的 ssize_t,一般情况下仍然是 int32 或 int64)
int8 字节(-128 to 127)
int16 整数(-32768 to 32767)
int32 整数(-2147483648 to 2147483647)
int64 整数(-9223372036854775808 to 9223372036854775807)
uint8 无符号整数(0 to 255)
uint16 无符号整数(0 to 65535)
uint32 无符号整数(0 to 4294967295)
uint64 无符号整数(0 to 18446744073709551615)
float_ float64 类型的简写
float16 半精度浮点数,包括:1 个符号位,5 个指数位,10 个尾数位
float32 单精度浮点数,包括:1 个符号位,8 个指数位,23 个尾数位
float64 双精度浮点数,包括:1 个符号位,11 个指数位,52 个尾数位
complex_ complex128 类型的简写,即 128 位复数
complex64 复数,表示双 32 位浮点数(实数部分和虚数部分)
complex128 复数,表示双 64 位浮点数(实数部分和虚数部分)

 

 

实例 1

import numpy as np

# 使用标量类型

dt = np.dtype(np.int32)

print(dt)

实例 2

import numpy as np

# int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替

dt = np.dtype('i4')

print(dt)

实例 3

# 首先创建结构化数据类型

import numpy as np

dt = np.dtype([('age',np.int8)])

print(dt)

实例 4

# 将数据类型应用于 ndarray 对象

import numpy as np

dt = np.dtype([('age',np.int8)])

a = np.array([(10,),(20,),(30,)], dtype = dt)

print(a)

 

3. 创建数组

import numpy as np

# 默认为浮点数

x = np.zeros(5)

print(x)

# 设置类型为整数

y = np.zeros((5,), dtype = np.int) print(y)

# 自定义类型

z = np.zeros((2,2), dtype = [('x', 'i4'), ('y', 'i4')])

print(z)

 

 

 

 

4. 操作数组

实例

import numpy as np

a = np.arange(10)

s = slice(2,7,2)

# 从索引 2 开始到索引 7 停止,间隔为2

print (a[s])

实例

import numpy as np

a = np.arange(10)# [0 1 2 3 4 5 6 7 8 9]

b = a[5]

实例 import numpy as np

a = np.array([[1,2,3],[3,4,5],[4,5,6]])

print (a[...,1])

# 第2列元素 print (a[1,...])

# 第2行元素 print (a[...,1:])

# 第2列及剩下的所有元素print(b)

 

实例

 

#可以加减乘除

import numpy as np

a = np.array([1,2,3,4])

b = np.array([10,20,30,40])

c = a * b

print (c)

import numpy as np
x=np.arange(32).reshape((8,4))
print (x[[4,2,1,7]])
 
5. numpy函数

函数

描述

add() 对两个数组的逐个字符串元素进行连接

import numpy as np

print ('连接两个字符串:')

print (np.char.add(['hello'],[' xyz']))

 

multiply() 返回按元素多重连接后的字符串

import numpy as np

print (np.char.multiply('Runoob ',3))

 

center() 居中字符串 

import numpy as np

# np.char.center(str , width,fillchar) :

# str: 字符串,width: 长度,fillchar: 填充字符

print (np.char.center('Runoob', 20,fillchar = '*'))

 

capitalize() 将字符串第一个字母转换为大写

import numpy as np

print (np.char.capitalize('runoob'))

 

title() 将字符串的每个单词的第一个字母转换为大写

import numpy as np

print (np.char.title('i like runoob'))

 

lower() 数组元素转换为小写

import numpy as np

#操作数组

print (np.char.lower(['RUNOOB','GOOGLE']))

# 操作字符串

print (np.char.lower('RUNOOB'))

 

 

upper() 数组元素转换为大写

import numpy as np

#操作数组

print (np.char.upper(['runoob','google']))

# 操作字符串

print (np.char.upper('runoob'))

 

 

split() 指定分隔符对字符串进行分割,并返回数组列表

import numpy as np

# 分隔符默认为空格

print (np.char.split ('i like runoob?'))

# 分隔符为 .

print (np.char.split ('www.runoob.com', sep = '.'))

 

splitlines() 返回元素中的行列表,以换行符分割

import numpy as np

# 换行符 \n

print (np.char.splitlines('i\nlike runoob?'))

print (np.char.splitlines('i\rlike runoob?'))

 

strip() 移除元素开头或者结尾处的特定字符

import numpy as np

# 移除字符串头尾的a 字符

print (np.char.strip('ashok arunooba','a'))

# 移除数组元素头尾的 a 字符

print (np.char.strip(['arunooba','admin','java'],'a'))

 

 

join() 通过指定分隔符来连接数组中的元素

import numpy as np

# 操作字符串

print (np.char.join(':','runoob'))

# 指定多个分隔符操作数组元素

print (np.char.join([':','-'],['runoob','google']))

 

replace() 使用新字符串替换字符串中的所有子字符串

import numpy as np

print (np.char.replace ('i like runoob', 'oo', 'cc'))

 

 

decode() 数组元素依次调用str.decode

import numpy as np

a = np.char.encode('runoob', 'cp500')

print (a)

 

encode() 数组元素依次调用str.encode

import numpy as np

a = np.char.encode('runoob', 'cp500')

print (a)

posted @ 2022-04-24 14:13  三重丶刘德华  阅读(51)  评论(0)    收藏  举报