08 2020 档案
摘要:Python进行携程酒店评论舆情分析 第一步:分析设计 我们是对酒店进行舆情分析,所有我们的核心是酒店的评论数据;对住客的评论数据进行特征提取,通过住客对酒店的评分,对数据进行分类,并使用朴素贝叶斯算法建立数学模型 第二步:数据收集 爬取酒店的相应类型的数据,如酒店的名称,住客的评论,酒店的回复,住
阅读全文
摘要:本文介绍文本处理时比较常用且有效的tfidf特征提取方法 1. 提取tf特征 TF即是词频(Term Frequency)是文本信息量统计方法之一,简单来说就是统计此文本中每个词的出现频率 def computeTF(wordDict, bow): tfDict = {} bowCount = le
阅读全文
posted @ 2020-08-24 02:16
Mr_Yun
摘要:错误提示 selenium.common.exceptions.SessionNotCreatedException: Message: session not created: This version of ChromeDriver only supports Chrome version 此版
阅读全文
posted @ 2020-08-17 22:45
Mr_Yun
摘要:28种 SQL 查询语句的优化方法: 1、应尽量避免在 where 子句中使用 != 或者 <> 操作符,否则将引擎放弃使用索引而进行全表扫描。 2、应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如: select id from t whe
阅读全文
posted @ 2020-08-13 00:14
Mr_Yun

浙公网安备 33010602011771号