摘要: Python3修行之路 第一关:Python3基础 查看 第二关:数据库及ORM Mysql Redis Mongodb ORM 第三关:web前端 HTML CSS JS BootStrap JQuery 第四关:web框架 Django Flask Tronado 第五关:Linux 第六关:网 阅读全文
posted @ 2019-03-09 14:23 Mr_Yun 阅读(341) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/qq_39259944/article/details/88869341 阅读全文
posted @ 2021-01-14 17:00 Mr_Yun 阅读(265) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/flashsun/p/14266148.html 阅读全文
posted @ 2021-01-14 15:35 Mr_Yun 阅读(195) 评论(0) 推荐(0) 编辑
摘要: pip使用国内源升级 python -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip 常用的国内源 https://pypi.tuna.tsinghua.edu.cn/simple/ # 清华大学 htt 阅读全文
posted @ 2020-09-14 21:58 Mr_Yun 阅读(851) 评论(1) 推荐(0) 编辑
摘要: 本文采用的数据集是阿里天池提供的user_behavior_data_on_taobao_app公开数据集进行分析,期望通过此次分析能通推动产品迭代、实现精准营销,提供定制服务,驱动产品决策等,需要此数据的小朋友们可以前往天池下载 用户行为分析 想要进行精细化运营,围绕的中心永远是用户。用户研究的常 阅读全文
posted @ 2020-09-14 17:49 Mr_Yun 阅读(2798) 评论(0) 推荐(1) 编辑
摘要: 机器学习之集成学习方式 1、bagging-(RF) 随机森林 两种随机过程的区别(bagging和RF(随机森林)) 随机森林的优缺点: 随机的艺术 2、boosting-(GBDT/Adaboost/XGBOOST) 加权步骤 权重更新 统计机器学习例子 3、stacking 阅读全文
posted @ 2020-09-07 16:49 Mr_Yun 阅读(235) 评论(0) 推荐(0) 编辑
摘要: Python进行携程酒店评论舆情分析 第一步:分析设计 我们是对酒店进行舆情分析,所有我们的核心是酒店的评论数据;对住客的评论数据进行特征提取,通过住客对酒店的评分,对数据进行分类,并使用朴素贝叶斯算法建立数学模型 第二步:数据收集 爬取酒店的相应类型的数据,如酒店的名称,住客的评论,酒店的回复,住 阅读全文
posted @ 2020-08-31 02:39 Mr_Yun 阅读(1949) 评论(0) 推荐(0) 编辑
摘要: 本文介绍文本处理时比较常用且有效的tfidf特征提取方法 1. 提取tf特征 TF即是词频(Term Frequency)是文本信息量统计方法之一,简单来说就是统计此文本中每个词的出现频率 def computeTF(wordDict, bow): tfDict = {} bowCount = le 阅读全文
posted @ 2020-08-24 02:16 Mr_Yun 阅读(2397) 评论(0) 推荐(0) 编辑
摘要: 网址:http://www.yy6080.cn/ 目标分析 m3u8 服务器将一个完整的视频切割成1000份;把每一小份视频存储到一个m3u8文件中; 还有一个m3u8文件存储着这个视频是否加密,以及该视频小m3u8目录存放的具体位置 而浏览器拿到的是一个大的m3u8文件 爬取思路 先请求到主页面 阅读全文
posted @ 2019-12-18 00:21 Mr_Yun 阅读(5423) 评论(0) 推荐(0) 编辑
摘要: 线性代数 阅读全文
posted @ 2019-12-12 10:51 Mr_Yun 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 地址是:https://postwoman.io/ ,不过只能使用它们自己提供的测试接口,如果你调试自己的API接口的话,你需要自己部署一套代码。 自己搭建一套Postwomen环境的话,只需要安装了node环境即可,既可以本地部署,也可以跑在docker环境,非常方便。感兴趣的可以自己动手折腾一下 阅读全文
posted @ 2019-12-04 10:57 Mr_Yun 阅读(5627) 评论(0) 推荐(0) 编辑