03 2021 档案
利用spaCy对中文文本分词和去除停用词处理
摘要:spaCy简介 spaCy语言模型包含了一些强大的文本分析功能,如词性标注和命名实体识别功能。目前spaCy免费支持的语言有:英文、德语、法语、西班牙语、葡萄语、意大利语和荷兰语,其他的语言也在慢慢的增长。对于spaCy处理中文文本(本文选取了《天龙八部》小说来示例)具体实现过程如下: 1、对文本进
阅读全文
利用百度API进行淘宝评论关键词提取
摘要:利用百度API自然语言处理技术中的评论观点抽取方面,对淘宝购物的评论进行分析,把关键词进行提取,方便买家快速了解该商品的相关特点,具体实现过程如下: 1、创建相关新应用 首先,需要登录百度AI平台,创建一个关于自然语言处理技术的应用(领取免费额度),获得AppID、API Key和Secret Ke
阅读全文
Python模拟简易版淘宝客服机器人
摘要:对于用Python制作一个简易版的淘宝客服机器人,大概思路是:首先从数据库中用sql语句获取相关数据信息并将其封装成函数,然后定义机器问答的主体函数,对于问题的识别可以利用正则表达式来进行分析,结合现实情况选择答案,最后在执行时可以设置循环语句,并且在每次回答间隔1s方便进一步做并发处理作为未来优化
阅读全文
深圳二手房房源市场研究(下)
摘要:PartⅡ:数据可视化 前言 根据上一篇文章,利用Python对房天下网站中深圳十个区的二手房房源信息进行了爬取,并保存到了本地。然后对数据集进行重复值检查、缺失值检查、分列处理、异常值检查等清洗操作,得到了新数据集,现对其进行可视化分析,研究深圳二手房房源的整体情况,并从分析结果给出相关建议。 数
阅读全文
深圳二手房房源市场研究(上)
摘要:PartⅠ:数据获取和数据清洗 写在前面 很早就有写博客的想法,一直对自己不自信所以没敢尝试,每次看别人的博客都很羡慕和崇拜,希望自己在未来的某一天也能给其他人给予一些力所能及的帮助。目前的我还是个小小小小白,很多东西都只懂些皮毛,这是我的第一篇博客,分享一下我在学校的一篇期末论文(轻点喷呜呜呜..
阅读全文
浙公网安备 33010602011771号