摘要: 书籍:《21个项目玩转深度学习:基于TensorFlow的实践详解》 人脸检测 FDDB FDDB是UMass的数据集,被用来做人脸检测(Face Detection)。这个数据集比较大,比较有挑战性。而且作者提供了程序用来评估检测结果,所以在这个数据上面比较算法也相对公平。 2845 张图片,其中 阅读全文
posted @ 2018-10-22 15:51 笨拙的忍者 阅读(795) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-09-18 11:39 笨拙的忍者 阅读(1) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2018-09-18 11:24 笨拙的忍者 阅读(2) 评论(0) 推荐(0) 编辑
摘要: jieba 并行处理进行测试,注意:并行分词仅支持默认分词器 jieba.dt 和 jieba.posseg.dt 测试结果: 加了并行,快很多哟!!! 阅读全文
posted @ 2018-09-12 11:30 笨拙的忍者 阅读(645) 评论(0) 推荐(0) 编辑
摘要: POST zeppelin/examples/AV6nU7M9HTZ4wJwaOOJj/_update { "name": "新闻主题分布", "url": "notebook/2CTNKD25S" } PUT test/type1/1{ "counter" : 1, "tags" : ["red" 阅读全文
posted @ 2018-08-21 11:07 笨拙的忍者 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 根据id删除某条记录 DELETE database/table/AV63VMPCDFvmw9AORKyi 删除数据库 DELETE database 清空数据表 DELETE database/table/_query { "query": { "match_all": {} } } 根据条件删除 阅读全文
posted @ 2018-08-21 11:03 笨拙的忍者 阅读(113) 评论(0) 推荐(0) 编辑
摘要: conf/zeppelin-env.sh 添加行: 阅读全文
posted @ 2018-08-20 17:04 笨拙的忍者 阅读(114) 评论(0) 推荐(0) 编辑
摘要: 数据集来源:http://www.sogou.com/labs/resource/cs.php 目的:得到title集合文本,content集合文本 代码: 解码编码上花了点时间:原本用chardet.detect可以得到文本编码是gb2312,但是decode的时候会报错: UnicodeDeco 阅读全文
posted @ 2018-08-17 12:21 笨拙的忍者 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 1.百度图像识别 文章链接 初赛数据集——链接:https://pan.baidu.com/s/1cT4cjK3Qc3C6Fc_t2uAGEA 密码:ftzk 初赛和决赛代码 2.多标签文本分类 6th博客,1th知乎 阅读全文
posted @ 2018-08-10 17:54 笨拙的忍者 阅读(105) 评论(0) 推荐(0) 编辑
摘要: 1.tensorflow机器学习实战指南 2017.9 曾益强译 源码:地址1,地址2 2.python神经网络编程 2018.4 林赐译 讲的很通俗易懂,围绕主干流程讲述神经网络的计算过程和需要某些参数的理由,然后以MNIST数字识别为例子,简单代码实现(代码是自己写的,不是调别人的库,印象会比较 阅读全文
posted @ 2018-08-10 17:54 笨拙的忍者 阅读(115) 评论(0) 推荐(0) 编辑