数字、字符串、列表、字典,jieba库,wordcloud词云

一、基本数据类型

什么是数据类型

变量:描述世间万物的事物的属性状态

为了描述世间万物的状态,所以有了数据类型,对数据分类

为什么要对数据分类

针对不同的状态需要不同的数据类型标识

数据类型的分类

二、数字类型

整型(int)

作用

表示人的年龄 / 身份证号

定义

age = 21
pringt(age, type(age))
# 打印结果:21 <class 'int'>

# 或者:
age = int(21)
print(age, type(age))
# 打印结果:21 <class 'int'>

使用方法

x = 1
y = 2
print(x + y)  # 加
print(x - y)  # 减
print(x * y)  # 乘
print(x / y)  # 除
print(x % y)  # 取余
print(x // y)  # 取整
print(x ** y)  # 幂

浮点型(float)

作用

用来描述(身高/体重/薪资)

定义

salary = 3.1
print(salary)   # 3.1

salary1 = float(3)  # 强制类型转换(动态语言),静态语言不能改变
print(salary1)  # 3.0

height = int(180.5)
print(height)   # 180

使用方法

与整形类似

+  -  *  /   % //  **

三、字符串类型

作用

字符串:字符用引号串起来

描述姓名/性别

定义方式

name = 'setcreed' 
name2 = "setcreed"

gender = 'male'
height1 = 'setcreed"s height'   # 读取第一个单引号的时候,字符串开始;第二引号结束
height2 = "setcreed's height"   # 读取第一个双引号的时候,字符串开始;第二引号结束

用三单引号/三双引号

poem = '''孩儿立志出湘关,学不成名誓不还;
埋骨何须桑梓地,人生无处不青山。'''

使用方法

内置方法

  • startswith() 以。。。开始
s = 'hello world'
print(s.startswith('hello'))  # 打印True
  • endswith() 以。。。结束
s = 'hello world'
print(s.startswith('d'))  # 打印True

索引取值

poem1 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''

print(poem1[0])  # 孩
print(poem1[-1])  # 。

索引切片

poem2 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''

print(poem2[0:7])  # 取0-6个  孩儿立志出湘关

步长

poem3 = '''孩儿立志出湘关,学不成名誓不还;埋骨何须桑梓地,人生无处不青山。'''

print(poem3[0:7:3])  # 孩志关

四、列表

作用

列表可以存储多个值,如存放 爱好

定义方式

用[]存储,用逗号隔开多个元素(可以是任意数据类型)

my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]

使用方法

  • 索引取值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[6][0])

# 打印结果:
666
  • 切片
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
print(my_list[:5])  # 前面默认为0
print(my_list[:])  # 没写,默认全部
  • 索引修改值
my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list[0] = 'hello'
print(my_list)

# 打印结果:
['hello', 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
  • 内置方法

append方法: 追加

my_list = [1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9]
my_list.append('999999999')
print(my_list)

# 打进结果:
[1, 2, 3, 'name', 'age', 'color', [666, '123', 4], 12.9, '999999999']

split 方法

s = 'a+b+c+d'
print(s.split('+'))  # 按照+把字符串切开,然后把切开的元素放入列表内

# 打印结果:
['a', 'b', 'c', 'd']

join 方法

lis = ['a','b','c','d']
res = ' '.join(lis)  # 按照字符串把列表里的每一个元素取出来拼接
print(res)

# 打印结果:
a b c d

五、字典

作用

用来存取多个值,按照key: value键值对的方式存值,取的时候可以通过key而非索引去取值,key对value具有描述性的作用。存放数据的种类各种各样并且数据较多的时候可以使用字典。

定义方式

my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}

使用方法

  • 取值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
print(my_info_dict['name'])

# 打印结果:
setcreed
  • del删除值
my_info_dict = {'name': 'setcreed','age': 20, 'height': 180, 'weight': 150}
del my_info_dict['height']
print(my_info_dict)

# 打印结果:
{'name': 'setcreed', 'age': 20, 'weight': 150}

六、jieba库

jieba库一般用于分词

import jieba

res = jieba.lcut('中华人民共和国是一个伟大的国家')   # 精确模式,返回一个列表类型的分词结果
print(res)

# 打印结果:
['中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba

res = jieba.lcut_for_search('中华人民共和国是一个伟大的国家')  # 搜索引擎模式,返回一个列表类型的分词结果,存在冗余
print(res)

# 打印结果:
['中华', '华人', '人民', '共和', '共和国', '中华人民共和国', '是', '一个', '伟大', '的', '国家']
import jieba

res = jieba.lcut('中华人民共和国是一个伟大的国家',cut_all=True) # 把所有的可能全部切出来
print(res)

# 打印结果:
['中华', '中华人民', '中华人民共和国', '华人', '人民', '人民共和国', '共和', '共和国', '国是', '一个', '伟大', '的', '国家']

七、wordcloud词云

import wordcloud
import jieba
from imageio import imread

mk = imread('test.png')  # 把图片读入内存
s = '''当其他人盲目的追寻真相和真实的时候,记住。万物皆虚。
当其他人受到法律和道德的束缚的时候,记住。万事皆允。
我们服侍光明却耕耘于黑暗。
真正睿智的人不会向你指明真相,而是教导你去发现真相。
世界上明明有一万种宗教,人们却用一种方式祈祷。这里没有上帝,只有属于我们自己的信条。
我们在黑暗中工作,为光明服务,我们,是刺客。'''

s_list = jieba.lcut(s)  # 把字符串切成列表
s = ' '.join(s_list)  # 把列表拼接成字符串
w = wordcloud.WordCloud(font_path='C:\Windows\Fonts\simkai.ttf', background_color='white', mask=mk)
w.generate(s)
w.to_file('set.png')

词云

posted @ 2019-08-26 17:22  SetCreed  阅读(379)  评论(0编辑  收藏  举报