随笔分类 -  python

摘要:问题: Cannot assign a device for operation 'MatMul': Operation was explicitly assigned to /device:GPU:1 but available devices are [ /job:localhost/repli 阅读全文
posted @ 2018-01-11 22:46 致林 阅读(6055) 评论(0) 推荐(0)
摘要:因公司业务需要,临时写的一段代码: 阅读全文
posted @ 2017-12-13 08:39 致林 阅读(7520) 评论(2) 推荐(0)
摘要:当要使函数接收元组或字典形式的参数 的时候,有一种特殊的方法,它分别使用*和**前缀 。这种方法在函数需要获取可变数量的参数的时候特别有用。[注意] [1] 由于在args变量前有*前缀 ,所有多余的函数参数都会作为一个元组存储在args中 。如果使用的是**前缀 ,多余的参数则会被认为是一个字典的 阅读全文
posted @ 2017-12-01 23:26 致林 阅读(4592) 评论(0) 推荐(0)
摘要:Linux在~/.pip/pip.conf文件中添加或修改, windows不存在该目录,在当前用户目录下创建pip.ini(例如 C:\Users\bin\pip\pip.ini): 临时使用: 可以在使用pip的时候加参数-i ,例如: 新版本pip需要https,可以使用: 豆瓣源: http 阅读全文
posted @ 2017-12-01 23:15 致林 阅读(280) 评论(0) 推荐(0)
摘要:最近在看深度学习,准备上手做一个项目。正好之前做短信轰炸的时候遇到验证码难以处理,想利用深度学习来识别验证码,然后和短信轰炸结合。 Web前端:使用bootstrap布局,vue写前端,手写后生成图片传到后台,后期增加爬虫管理和短信轰炸管理; Web后台:python Django框架; 深度学习: 阅读全文
posted @ 2017-11-22 10:10 致林 阅读(278) 评论(0) 推荐(0)
摘要:转载: https://www.zhihu.com/question/19918532 弱类型: > "1"+2 '12' 强类型: >>> "1"+2 Traceback (most recent call last): File "<stdin>", line 1, in <module> Ty 阅读全文
posted @ 2017-08-10 08:59 致林 阅读(657) 评论(0) 推荐(0)
摘要:一、安装Django: 因为之前安装好了python3和pip,这里直接使用: 测试是否安装好: 进入project目录,创建HelloWorld项目: 然后运行: D:\Django\HelloWorld>python manage.py runserver 0.0.0.0:8000Perform 阅读全文
posted @ 2017-08-09 21:26 致林 阅读(237) 评论(0) 推荐(0)
摘要:1. 获取关键词,返回词典(key, value)格式数据,key为关键词,value为出现次数; 2. 获取所有新闻id和content,返回词典(key, value)格式数据,key为id,value为content; 3. 对关键词排序,统计出现频率大于1的关键词 4. 以关键词为行,新闻i 阅读全文
posted @ 2017-05-31 09:49 致林 阅读(1650) 评论(0) 推荐(0)
摘要:distance = {9149: 0, 9150: 26, 9151: 24, 9152: 24, 9153: 24, 9154: 27, 9155: 25, 9156: 30, 9158: 20, 9159: 22, 9160: 25, 9161: 21, 9163: 25, 9164: 23, 9165: 25, 9166: 30, 9167: 20, 9169: 25, 9170: 24... 阅读全文
posted @ 2017-05-12 23:19 致林 阅读(6645) 评论(0) 推荐(0)
摘要:linux环境下,没有首先安装python_Levenshtein,用法如下: Python代码 重点介绍几个该包中的几个计算字串相似度的几个函数实现。 1. Levenshtein.hamming(str1, str2) 计算汉明距离。要求str1和str2必须长度一致。是描述两个等长字串之间对应 阅读全文
posted @ 2017-05-12 13:08 致林 阅读(592) 评论(0) 推荐(0)
摘要:编辑距离定义: 编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。 许可的编辑操作包括:将一个字符替换成另一个字符,插入一个字符,删除一个字符。 例如将eeba转变成abac: 所以eeba和abac的编辑距离就是3 俄罗斯科学家Vladimir L 阅读全文
posted @ 2017-05-11 21:03 致林 阅读(1125) 评论(0) 推荐(0)
摘要:因为MySQLdb不支持python3,需要导入pymysql 可以选择pip 安装pymysql,或者pycharm安装 [File] >> [settings] >> [Project: python] >> [Project Interpreter] >> "+" 阅读全文
posted @ 2017-04-30 14:48 致林 阅读(5918) 评论(0) 推荐(0)
摘要:首先安装 测试抓取baidu,其中的chromedriver.exe需要自己下载,百度有很多的 执行结果如下 进阶 如果遇到错误 原因是没有安装chrome driver,到 https://sites.google.com/a/chromium.org/chromedriver/downloads 阅读全文
posted @ 2017-04-28 22:48 致林 阅读(374) 评论(0) 推荐(0)
摘要:github: https://github.com/haibincoder/ToutiaoCrawler 1.浏览器中找到内容的接口,Network --> XHR是动态加载的,如果没有内容的话刷新当前页面,我们这里可以看到data节点下面有需要的数据。 2.找到需要的内容和url 3.返回结果 阅读全文
posted @ 2017-04-28 22:41 致林 阅读(8246) 评论(5) 推荐(0)
摘要:下载地址是:https://pypi.python.org/pypi/pip#downloads : 下载完成之后,解压到一个文件夹,用CMD控制台进入解压目录,输入: 添加环境变量,在PATH最后添加: 完整安装好了pip: 最后安装request就很方便了: 在python中import: 阅读全文
posted @ 2017-04-26 17:46 致林 阅读(637) 评论(0) 推荐(0)
摘要:1. 聚类问题 所谓聚类问题,就是给定一个元素集合D,其中每个元素具有n个可观察属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相异度尽可能低,而不同子集的元素相异度尽可能高。 2. K-均值算法简介 k-means算法,也被称为k-平均或k-均值,是一种得到最广泛使用的聚类算法。 阅读全文
posted @ 2016-05-31 12:27 致林 阅读(1200) 评论(0) 推荐(0)