摘要: 在 Mac下,我们首先使用 Homebrew安装 ImageMagick和 tesseract库 : brew install imagemagickbrew install tesseract --all-languages 接下来再安装 tesserocr即可: pip3 install tes 阅读全文
posted @ 2018-10-10 20:09 gaknl 阅读(1755) 评论(0) 推荐(0)
摘要: 注册路由,路由负责管理URL和函数之间的映射.route()装饰器的第一个参数是URL规则,用字符串表示,必须以斜杠(/)开始 阅读全文
posted @ 2018-10-05 09:38 gaknl 阅读(85) 评论(0) 推荐(0)
摘要: 1. k-近邻算法采用测量不同特征值之间的距离方法进行分类 优点:精度高、对异常值不敏感、无数据输入假定 缺点:计算复杂度高、空间复杂度高 适用数据类型:数值型和标称行 存在一个样本数据集合,称作为训练样本集。并且样本集中每个数据都存在标签(每一数据与所属分类的对应关系)。输入没有标签的新数据后,将 阅读全文
posted @ 2018-10-01 22:45 gaknl 阅读(115) 评论(0) 推荐(0)
摘要: 1. 用于执行分类,回归,聚类和密度估计的机器学习方法: a. 监督学习的用途: b. 无监督学习的用途: 2. 选择合适的算法: 如果是想要预测目标变量的值,则可以选择监督学习算法,否则选择无监督学习算法。 确定监督学习算法之后,进一步确定目标变量类型,如果目标变量是离散型,如1/2/3,A/B/ 阅读全文
posted @ 2018-10-01 22:04 gaknl 阅读(140) 评论(0) 推荐(0)
摘要: 1. 进程和线程: 进程是一个执行中的程序,每个进程都有自己的地址空间,内存,数据栈以及其他用于追踪执行的辅助数据。 线程是在同一个进程下执行的,并共享相同的上下文。线程包括开始,执行顺序和结束三部分。一个线程中各个线程和主线程共用同一片数据空间,相比较独立的进程而言,线程间的信息共享和通信更加容易 阅读全文
posted @ 2018-09-29 10:21 gaknl 阅读(167) 评论(0) 推荐(0)
摘要: 111 阅读全文
posted @ 2018-09-26 17:11 gaknl 阅读(109) 评论(0) 推荐(0)
摘要: 正则表达式为高级的文本模式匹配、抽取、与/或文本形式的搜索和替换功能提供了基础。 简单地说,正则表达式(简称为 regex)是一些由字符和特殊符号组成的字符串,它们描述了模式的重复或者表述多个字符,于是正则表达式能按照某种模式匹配一系列有相似特征的字符串。  ?匹配零次或一次前面的分组。  *匹 阅读全文
posted @ 2018-09-26 17:01 gaknl 阅读(282) 评论(0) 推荐(0)
摘要: 爬取https://www.aqistudy.cn/historydata 网站的空气质量报告,爬取的数据以csv文件生成 scrapy startproject air_quality 创建scrapy项目 scrapy genspider api_history_spider https://w 阅读全文
posted @ 2018-09-25 17:09 gaknl 阅读(5205) 评论(3) 推荐(0)
摘要: 1. 通过行为习惯对移动用户人口属性(年龄+性别)进行预测。 2. 数据及包含~20万用户数据,分成12组,同时提供了用户行为属性,如:手机品牌、型号、APP的类型等。 3. 通过logloss评价 main.py 1 # -*- coding: utf-8 -*- 2 3 4 import pan 阅读全文
posted @ 2018-09-16 11:43 gaknl 阅读(4018) 评论(1) 推荐(0)
摘要: 1. 通过人脸检测获取海报中人脸个数及颜色均值。 2. 分析海报人脸个数,颜色均值和评分的关系。 main.py tools.py 阅读全文
posted @ 2018-09-16 11:11 gaknl 阅读(694) 评论(0) 推荐(0)