摘要: 阅读全文
posted @ 2021-05-25 21:43 老婆说的都对团队博客 阅读(88) 评论(22) 推荐(0)
摘要: 目前的任务完成情况如上 我组目前的现任分工任务 基本完成 等下一次冲刺阶段继续分配任务 本次任务的进行还存在很多问题 比如页面内容不全面, 确实个人主页, 第二阶段将会持续跟进。 阅读全文
posted @ 2021-05-24 23:33 老婆说的都对团队博客 阅读(48) 评论(0) 推荐(0)
摘要: 按照另一种json网址爬取 #-*-coding:utf-8-*- # @Time :2021/4/22 7:08 # @Author:shuaichao # @File :.py # @Software: PyCharm from bs4 import BeautifulSoup #网页解析,获悉 阅读全文
posted @ 2021-05-10 23:32 老婆说的都对团队博客 阅读(72) 评论(0) 推荐(0)
摘要: 通过json爬取新闻数据(1)——搜狐不同的新闻主页有不同的页码格式 #-*-coding:utf-8-*- # @Time :2021/4/17 14:58 # @Author:shuaichao # @File :.py # @Software: PyCharm import gzip from 阅读全文
posted @ 2021-05-09 11:20 老婆说的都对团队博客 阅读(60) 评论(0) 推荐(0)
摘要: 按照标签名字爬取新闻 from bs4 import BeautifulSoup #网页解析,获悉数据.231 import re #正则表达式 import urllib.request,urllib.error #制定URL,获取网页数据 import pymysql import traceb 阅读全文
posted @ 2021-05-08 20:10 老婆说的都对团队博客 阅读(70) 评论(0) 推荐(0)
摘要: 网格布局 其中网格布局的一个实现是由一个css的样式 display: grid;grid-template-columns: repeat(4, 1fr); 使用此功能来对div进行一个划分 .container > div:nth-last-of-type(3) { grid-column: 1 阅读全文
posted @ 2021-05-07 23:29 老婆说的都对团队博客 阅读(58) 评论(0) 推荐(0)
摘要: 网站首页前端制作 在挑选了众多模板之后选择了 一个滑动手风琴的一个样式 其中手风琴的效果是对于一个ul标签的一个css样式制作 其中是一个超链接 然后其中包含一个h1标签和一个p标签 在鼠标移入超链接后整体进行滑动然后展开 显示和h1 和p标签 其中分别用div包裹 3个div 整体一个div包裹 阅读全文
posted @ 2021-05-06 21:05 老婆说的都对团队博客 阅读(37) 评论(0) 推荐(0)
摘要: KNN算法的实现 在数据集准备完成之后 开始进行算法的实现 其中本次项目分为3个部分 数据的获取 其中数据已经保存到了txt文件 直接读取 print('(1) load texts...')train_texts = open('../dataset_train/x_train.txt', enc 阅读全文
posted @ 2021-05-05 23:25 老婆说的都对团队博客 阅读(66) 评论(0) 推荐(0)
摘要: 数据清洗 二 第一波对数据的清洗其中已经完成了文本的一个清洗 基本上可以满足当前的准确率 然后是对数据文档的合并 和 新闻类别的抽取 其中 文档的合并是 将所有测试集和训练集的各个部分合并 其中在测试集和训练集的划分是手动完成 总共选取了6个类别 每个类别500条新闻 总共3000条 其中合并是让每 阅读全文
posted @ 2021-05-04 23:01 老婆说的都对团队博客 阅读(52) 评论(0) 推荐(0)
摘要: 数据清洗 一 数据已经取出,然后是对数据的一个清洗 其中中文文本的分类 需要分词 还需要进行 停用词的取出 以防对特征值的抽取造成过大影响 分词是为了进行特征抽取的一个词语分割 然后进行提取作用 # encoding=utf-8 #遍历文件,用ProsessofWords处理文件from imp i 阅读全文
posted @ 2021-05-03 23:15 老婆说的都对团队博客 阅读(61) 评论(0) 推荐(0)