摘要:
决策树 决策树(Decision Tree)是一种非参数的有监督学习方法,它能够从一系列有特征和标签的数据中总结出决策规则,并用树状图的结构来呈现这些规则,以解决分类和回归问题。 优点: 简单易懂,容易解释,可视化,适用性广 缺点: 容易过拟合, 数据中的小变化会影响结果,不稳定, 每一个节点的选择 阅读全文
摘要:
import tesserocr from PIL import Image image = Image.open('code.jpg') image = image.convert('L') threshola = 127 table = [] for i in range(256): if i < threshola: table.append(0) els... 阅读全文
摘要:
python3+selenium+chromedriver,爬取下的的结果中,由于评论中有表情等丢失了部分评论,一个榜单共99首 今日子的备忘录.txt: Cher鉛筆:鉛筆《喜欢的是》2018全国巡演将于10月启程购票详情请看歌手页艺人信息或登陆秀动app搜索“喜欢的是”微博 cher鉛筆早晨的三 阅读全文
摘要:
使用chrome代替PhantomJS,selennium3不支持PhantomJS,编码用“utf 8”,不然会报错。tesseract要添加TESSDATA_PREFIX环境变量 识别结果如下: n PENGUIN H“ :xA55\(5 LEO TOLSTOY War and Peace mm 阅读全文
摘要:
Vim编辑器基础 Vim模式 Vim模式转换 vim 文件名 打开文件 关闭文件 移动光标(编辑模式) 翻屏 删除单个字符 删除命令:d 粘贴命令 p 复制命令 y 修改:先删除内容,在转换为输入模式 替换:r 撤销编辑操作 u 重复前一次编辑操作 可视化操作 查找 查找并替换 使用vim编辑多个文 阅读全文
摘要:
编程语言 编程语言(programming language)俗称“计算机语言”,种类非常的多,总的来说可以分成机器语言、汇编语言、高级语言三大类。 机器语言 用二进制代码0和1描述的指令称为机器指令,难以记忆,不便阅读和书写,但执行效率最高,属于低级语言。不适合人来编程。 汇编语言 其实质与机器语 阅读全文
摘要:
grep及正则表达式 正则表达式 (REGular EXPression,REGEXP)是对字符串和特殊字符(元字符)操作的一种逻辑公式,使用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。通常被用来 检索、替换 那些符合某个 阅读全文
摘要:
管道符"|" 管道符"|":前一个命令的输出,作为后一个命令的输入 I/O重定向 简单的解释就是捕捉一个文件, 命令, 程序, 脚本, 或者甚至是脚本中的代码块的输出, 然后将这些输出作为输入发送到另一个文件, 命令, 程序, 或脚本中。 标准输入输出 执行一个shell命令行时通常会自动打开三个标 阅读全文