摘要: 1.评论去重的代码 import pandas as pd import re import jieba.posseg as psg import numpy as np # 去重,去除完全重复的数据 reviews = pd.read_csv("./reviews.csv") reviews = 阅读全文
posted @ 2023-04-06 16:18 小黄& 阅读(107) 评论(0) 推荐(0)
摘要: 1.导入sql文件 利用cmd 登入mysql use database 输入 “ SET SESSION innodb_strict_mode = OFF; ” “source + 路径” 2.数据库连接 # 修改工作路径到指定文件夹 import pandas as pd import pymy 阅读全文
posted @ 2023-04-02 22:15 小黄& 阅读(34) 评论(0) 推荐(0)
摘要: 1.数据探索 import pandas as pd import matplotlib.pyplot as plt inputfile = './original_data.xls' # 输入的数据文件 data = pd.read_excel(inputfile) # 读取数据 # 查看有无水流 阅读全文
posted @ 2023-03-23 16:06 小黄& 阅读(39) 评论(0) 推荐(0)
摘要: 1.数据探索--查看数据特征 import numpy as np import pandas as pd inputfile = './GoodsOrder.csv' # 输入的数据文件 data = pd.read_csv(inputfile,encoding = 'gbk') # 读取数据 d 阅读全文
posted @ 2023-03-20 10:34 小黄& 阅读(269) 评论(0) 推荐(0)
摘要: 1.数据描述与探索 import matplotlib.pyplot as plt import numpy as np import pandas as pd #对数据进行基本的探索 #返回缺失值个数以及最大最小值 import pandas as pd datafile = './air_dat 阅读全文
posted @ 2023-03-12 22:33 小黄& 阅读(47) 评论(0) 推荐(0)
摘要: 1. 数据分析 import matplotlib.pyplot as plt import numpy as np import pandas as pd inputfile = './data.csv' data = pd.read_csv(inputfile) describe = data. 阅读全文
posted @ 2023-03-04 22:42 小黄& 阅读(70) 评论(0) 推荐(0)
摘要: 1.缺失值分析及箱型图 数据:catering_sale.xls(餐饮日销额数) 缺失值使用函数:describe()函数,能算出数据集的八个统计量 import pandas as pd catering_sale = r'.\catering_sale.xls' #餐饮数据 data = pd. 阅读全文
posted @ 2023-02-25 16:04 小黄& 阅读(981) 评论(0) 推荐(0)
摘要: tensorflow中的tensor就是张量,是多维数组(多维列表),用阶来表示张量的维数,判断张量是几阶的可以看有几个方括号 import tensorflow as tf a=tf.constant([1,5],dtype=tf.int64) #直接打印a,会输出a的所有信息 print(a) 阅读全文
posted @ 2022-04-24 23:48 小黄& 阅读(31) 评论(0) 推荐(0)