03 2020 档案

摘要:爬取网站:https://www.shujukuji.cn/guominjingjihangyefenlei/xiaolei-liebiao 一.数据:(由于文档中含有敏感词,上传失败) 网盘: 链接:https://pan.baidu.com/s/1vCUuCOEEQb786afZVhS8SQ 提 阅读全文
posted @ 2020-03-20 08:23 田智凯 阅读(1242) 评论(0) 推荐(0)
摘要:kmeans介绍学习博客:https://blog.csdn.net/sinat_30353259/article/details/80887779 kmeans代码摘自:https://www.cnblogs.com/fengfenggirl/p/k-means.html 具体的学习介绍可以参考以 阅读全文
posted @ 2020-03-19 16:55 田智凯 阅读(5059) 评论(0) 推荐(0)
摘要:推荐使用顺序:先使用方法1等十五秒没有完成就暂停(下载小库可行);然后使用方法2.②;前边的还不行再使用方法2.①;最后保底的方法3 1.在pyCharm中安装(小的库可以,大多数时候因为库有几兆或者几十兆就会失败,这时请看下一条安装方法) 2.在pip中安装(以安装pandas为例) ①官方: c 阅读全文
posted @ 2020-03-19 11:34 田智凯 阅读(2077) 评论(0) 推荐(0)
摘要:id定位:find_element_by_id(self, id_) 定位id为lUsername driver.find_element_by_id('lUsername') name定位:find_element_by_name(self, name) class定位:find_element_ 阅读全文
posted @ 2020-03-15 22:57 田智凯 阅读(224) 评论(0) 推荐(0)
摘要:题目: 提取一段文字中的关键字 思路: 先将一段文字分词处理(类似第三方库jieba分词); 我们可以发现分词结果里有许多的无用词语,这时候就要剔除形容词,动词等无用词;最后再提炼出来所需要的关键词; 这时候去网上找相关代码一大堆,而且提取到的关键词好像也达不到我的要求,还要再接着提炼; 到头来想想 阅读全文
posted @ 2020-03-13 18:49 田智凯 阅读(7943) 评论(0) 推荐(0)
摘要:题目要求:根据单位名称获取具体位置(精确到区县)以及地域行政代码等信息 解决方法:利用python,调用百度地图API: ①通过地理编码服务由得到的单位名称得到经纬度; ②再通过逆地理编码服务,由①中得到的经纬度得到单位的具体地理信息(位置,行政代码等) 一.准备工作 认证,添加应用,百度地图API 阅读全文
posted @ 2020-03-12 15:31 田智凯 阅读(6538) 评论(0) 推荐(2)
摘要:jieba安装: 下载安装包,官网地址:https://pypi.org/project/jieba// 本人网盘链接:https://pan.baidu.com/s/1ufgUyYPaBv2NTUvwybH1Ew 提取码:nxed 解压安装: 首先压到任意目录 打开cmd命令行窗口并切换到jieb 阅读全文
posted @ 2020-03-02 22:52 田智凯 阅读(2563) 评论(0) 推荐(0)
摘要:参考德拓视频学习:http://113.31.104.47/portal/#/course/courseDetail/b34d160db64624732ef152a1118af11a?courseId=1b7e84f4eb8552536e2267093dbd7972 kettle安装:下载包直接解压 阅读全文
posted @ 2020-03-01 23:54 田智凯 阅读(8066) 评论(0) 推荐(0)