玉滨的博客

导航

随笔分类 -  python

大作业
摘要:import os import jieba path=r"/Volumes/E盘/词库/258" with open(r'/Volumes/E盘/词库/stopsCN.txt',encoding='utf-8')as f: stopword=f.read().split('\n') List01=[] List02=[] # for root,dirs,files in os.w... 阅读全文

posted @ 2018-12-19 14:58 玉滨的博客 阅读(400) 评论(1) 推荐(0)

回归模型与房价预测
摘要:from sklearn.datasets import load_boston#导入数据集 boston=load_boston() #住宅平均房数与房价之间的关系 import matplotlib.pyplot as plt from sklearn.linear_model import LinearRegression lineR=LinearRegression() x=boston... 阅读全文

posted @ 2018-12-16 21:18 玉滨的博客 阅读(386) 评论(0) 推荐(0)

朴素贝叶斯应用:垃圾邮件分类
摘要:import nltk from nltk.corpus import stopwords from nltk.stem import WordNetLemmatizer def preprocessing(text): tokens=[word for sent in nltk.sent_tokenize(text) for word in nltk.word_tokenize(sen... 阅读全文

posted @ 2018-12-03 11:43 玉滨的博客 阅读(1169) 评论(0) 推荐(0)

分类与监督学习,朴素贝叶斯分类算法
摘要:1.理解分类与监督学习、聚类与无监督学习 1)、简述分类与聚类的联系与区别。 分类——分类是根据文本的特征或属性,划分到已有的类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。 聚类——聚类是事先不知道数据会分为几类,通过分析将数 阅读全文

posted @ 2018-11-22 21:45 玉滨的博客 阅读(428) 评论(0) 推荐(0)

KMeams算法应用:图片压缩与贝叶斯公式理解
摘要:from sklearn.datasets import load_sample_image import matplotlib.pyplot as plt from sklearn.cluster import KMeans import numpy as np flower=load_sample_image('flower.jpg')#原始图片 plt.imshow(flower) plt... 阅读全文

posted @ 2018-11-15 16:10 玉滨的博客 阅读(451) 评论(0) 推荐(0)

numpy数组及处理:效率对比
摘要:一、处理日期时间 取系统时间 转换成‘2017年9月30日星期六10时28分56秒’格式字符串 ’2018-10-25 22:00‘转换成一个日期时间变量 计算两者的间隔 二、问题: 数列: a = a1,a2,a3,·····,an b = b1,b2,b3,·····,bn 求: c = a12 阅读全文

posted @ 2018-11-05 08:29 玉滨的博客 阅读(244) 评论(0) 推荐(0)

python中的列表的嵌套与转换
摘要:第一种方法:这行代码的for循环的意识,是先将matrix列表中的每行的第一个元素拿出。 其输出结果: 其具体的代码如下:先要在外层有一个for循环,内部也要有个for循环;外层的for循环,目的是要循环二维数组的内部数组数目,内层的数组要将每个分列表中的每个元素遍历出来。 阅读全文

posted @ 2018-10-28 21:31 玉滨的博客 阅读(5195) 评论(0) 推荐(0)

中英文统计
摘要:第一种方法: 第二种方法: 中文统计: 阅读全文

posted @ 2018-10-15 11:29 玉滨的博客 阅读(255) 评论(0) 推荐(0)

numpy数据集练习 ----------sklearn类
摘要:# 1. 安装scipy,numpy,sklearn包 import numpy from sklearn.datasets import load_iris # 2. 从sklearn包自带的数据集中读出鸢尾花数据集data print(data.data) # 3.查看data类型,包含哪些数据 data = load_iris() print(data.keys()) ... 阅读全文

posted @ 2018-10-14 20:03 玉滨的博客 阅读(444) 评论(0) 推荐(0)

组合数据类型,英文词频统计
摘要:sunstr = '''Girl I can't notice but to, notice you, noticing me From across the room I can see it and can't Stop myself from looking and noticing you, noticing me Watch out I've seen her type before ... 阅读全文

posted @ 2018-10-08 11:37 玉滨的博客 阅读(216) 评论(0) 推荐(0)

Python中元组、列表、字典的遍历和相互转化
摘要:一、元组,列表,字典的遍历 1.1 元组的遍历 元组的遍历借助 range() 函数,基本思想是通过元组的长度使用for循环进行遍历,代码如下: fruits=("apple","banana","orange") for i in range(len(fruits)): print(fruits[ 阅读全文

posted @ 2018-10-08 11:35 玉滨的博客 阅读(1151) 评论(0) 推荐(0)

python 字符串,列表,元组,字典相互转换
摘要:1、字典 dict = {'name': 'Zara', 'age': 7, 'class': 'First'} 字典转为字符串,返回:<type 'str'> {'age': 7, 'name': 'Zara', 'class': 'First'} print type(str(dict)), s 阅读全文

posted @ 2018-10-08 11:26 玉滨的博客 阅读(315) 评论(0) 推荐(0)

NUMPY数组及处理:效率对比
摘要:用数组处理: 执行结果: 用numpy执行: 执行结果: 执行结果: 很显然 用numpy的函数执行,速度会更快一些 阅读全文

posted @ 2018-10-02 18:59 玉滨的博客 阅读(964) 评论(0) 推荐(0)

组合数据类型,英文词频统计 python
摘要:练习: 总结列表,元组,字典,集合的联系与区别。列表,元组,字典,集合的遍历。 区别: 一、列表:列表给大家的印象是索引,有了索引就是有序,想要存储有序的项目,用列表是再好不过的选择了。在python中的列表很好区分,遇到中括号(即[ ]),都是列表,定义列表也是如此。列表中的数据可以进行增删查改等 阅读全文

posted @ 2018-09-21 23:17 玉滨的博客 阅读(601) 评论(0) 推荐(0)

{python}完成完整的温度转换程序 猜数字游戏(猜价格,猜年龄等) 解析身份证号、学号不同片段的含义
摘要:运行结果; 运行结果; 解析身份证号、学号不同片段的含义 运行结果; 字符串的:连接,重复,in判断 运行结果; 用for循环产生一系列网址 运行结果; 阅读全文

posted @ 2018-09-10 10:05 玉滨的博客 阅读(683) 评论(0) 推荐(0)

摄氏与华氏的转换
摘要:摄氏度转化成华氏x = input("输入摄氏温度:") y = int(x)*9/5 +32 input("当摄氏温度为:{0}时,华氏温度:+{1}".format(x,y)) 阅读全文

posted @ 2018-09-03 11:24 玉滨的博客 阅读(781) 评论(0) 推荐(0)

mod libs 课堂
摘要:name1= input("请输入一个名字:") name2 = input("再输入一个名字:") print("{}刚化妆完\n就被路过的{}拍照了\n".format(name1,name2)) input("press any key") 阅读全文

posted @ 2018-09-03 10:59 玉滨的博客 阅读(142) 评论(0) 推荐(0)