正文内容加载中...
posted @ 2016-05-09 09:16 Charlotte77 阅读(2895) 评论(10) 编辑
正文内容加载中...
posted @ 2016-05-09 09:14 Charlotte77 阅读(2914) 评论(25) 编辑
摘要: 前言:本文同步发布于公众号:Charlotte数据挖掘,欢迎关注,获得最新干货~ 昨天看到几篇不同的文章写关于机器学习的to do & not to do,有些观点赞同,有些不赞同,是现在算法岗位这么热门,已经不像几年前一样,可能跑过一些项目、懂点原理就可以了,现在对大家的要求更高,尤其工程能力更不阅读全文
posted @ 2019-07-22 11:16 Charlotte77 阅读(228) 评论(1) 编辑
摘要: 前言:之前在公众号写了一篇如何高效利用参加技术分享的文章,现在分享给大家~ 上周在北五环咖啡举办了AI快车道3期-推荐系统的技术分享,活动很成功,坚持到最后的基本上收获都不小,完成我们布置的Coding实验任务,大家交流的也非常开心。活动分三个环节,分别是:PaddlePaddle的全景介绍、推荐系阅读全文
posted @ 2019-07-02 14:27 Charlotte77 阅读(532) 评论(2) 编辑
摘要: 前言:我在github上创建了一个新的repo:PaddleAI, 准备用Paddle做的一系列有趣又实用的案例,所有的案例都会上传数据代码和预训练模型,下载后可以在30s内上手,跑demo出结果,让大家尽快看到训练结果,用小批量数据调试,再用全量数据跑模型,当然,也可以基于我上传的预训练模型进行迁阅读全文
posted @ 2019-05-21 11:05 Charlotte77 阅读(616) 评论(1) 编辑
摘要: 更新:气死了,挂个傻逼: 每次做个分享、组织个活动,就会有一些傻逼冒泡生怕别人不知道他是傻逼,气死我了!自己好好看看非法集资的概念,我办这个活动,一分钱都没收,入群99元是督促大家完成刷题任务,最后完成的会平分奖金,自愿参加原则。没事多读点书,别到处彰显自己有多傻逼,气死了!!! 刚翻了下之前的文章阅读全文
posted @ 2019-05-13 10:29 Charlotte77 阅读(3071) 评论(30) 编辑
摘要: 在机器学习的实践中,我们通常会遇到实际数据中正负样本比例不平衡的情况,也叫数据倾斜。对于数据倾斜的情况,如果选取的算法不合适,或者评价指标不合适,那么对于实际应用线上时效果往往会不尽人意,所以如何解决数据不平衡问题是实际生产中非常常见且重要的问题。 什么是类别不平衡问题 我们拿到一份数据时,如果是二阅读全文
posted @ 2019-03-01 13:32 Charlotte77 阅读(2520) 评论(3) 编辑
摘要: 昨天是元宵节,过完元宵节相当于这个年正式过完了。不知道大家有没有投入继续投入紧张的学习工作中。年前我想开一个Leetcode刷题专栏,于是发了一个投票想了解大家的需求征集意见。投票于2019年2月1日截止,共有204人参加,根据投票结果显示,大多数人希望通过刷LeetCode能够提高代码水平,在工作阅读全文
posted @ 2019-02-20 21:38 Charlotte77 阅读(4775) 评论(22) 编辑
摘要: 在机器学习中,我们经常会分类为有监督学习和无监督学习,但是尝尝会忽略一个重要的分支,强化学习。有监督学习和无监督学习非常好去区分,学习的目标,有无标签等都是区分标准。如果说监督学习的目标是预测,那么强化学习就是决策,它通过对周围的环境不断的更新状态,给出奖励或者惩罚的措施,来不断调整并给出新的策略。阅读全文
posted @ 2019-01-23 20:26 Charlotte77 阅读(1572) 评论(3) 编辑
摘要: 2018年的总结迟迟没有写,因为觉得是人生中最低谷的一年,受到了很多打击,接触到了很多人,也直面了很多人性最黑暗的东西。这一年做了一些事,也做了不少错事,所以迟迟不愿意面对自己承认错误,于是不愿意提笔写总结。但是该来的总是要来的,总结是为了更好的前行,所以今天决定提笔细数自己在2018年的成长与教训阅读全文
posted @ 2019-01-17 16:25 Charlotte77 阅读(8202) 评论(80) 编辑
摘要: PaddlePaddle垃圾邮件处理实战(二) 前文回顾   在上篇文章中我们讲了如何用支持向量机对垃圾邮件进行分类,auc为73.3%,本篇讲继续讲如何用PaddlePaddle实现邮件分类,将深度学习方法运用到文本分类中。 构建网络模型   用Paddle阅读全文
posted @ 2018-06-06 09:56 Charlotte77 阅读(2104) 评论(6) 编辑
摘要: PaddlePaddle垃圾邮件处理实战(一) 背景介绍   在我们日常生活中,经常会受到各种垃圾邮件,譬如来自商家的广告、打折促销信息、澳门博彩邮件、理财推广信息等,一般来说邮件客户端都会设置一定的关键词屏蔽这种垃圾邮件,或者对邮件进行归类,但是总会有一些漏网之鱼。 &emsp阅读全文
posted @ 2018-05-22 14:14 Charlotte77 阅读(2527) 评论(9) 编辑
摘要: 上节我们讲了第一部分,如何用生成简易的车牌,这节课中我们会用PaddlePaddle来识别生成的车牌。 数据读取 在上一节生成车牌时,我们可以分别生成训练数据和测试数据,方法如下(完整代码在这里): 生成好数据后,我们写一个reader来读取数据 ( reador.py ) 灌入模型时,我们需要调用阅读全文
posted @ 2018-03-25 21:56 Charlotte77 阅读(4349) 评论(12) 编辑
摘要: 小伙伴们,终于到了实战部分了!今天给大家带来的项目是用PaddlePaddle进行车牌识别。车牌识别其实属于比较常见的图像识别的项目了,目前也属于比较成熟的应用,大多数老牌厂家能做到准确率99%+。传统的方法需要对图像进行多次预处理再用机器学习的分类算法进行分类识别,然而深度学习发展起来以后,我们可阅读全文
posted @ 2018-02-26 10:42 Charlotte77 阅读(10435) 评论(14) 编辑
摘要: 在前面的文章中,我们通常是拿到一个任务,譬如图像分类、识别等,搜集好数据后就开始直接用模型进行训练,但是现实情况中,由于设备的局限性、时间的紧迫性等导致我们无法从头开始训练,迭代一两百万次来收敛模型,所以这个时候迁移学习就派上用场了。 什么是迁移学习? 迁移学习通俗来讲,就是运用已有的知识来学习新的阅读全文
posted @ 2018-02-01 16:54 Charlotte77 阅读(4685) 评论(9) 编辑
摘要: 上篇文章我们讲了如何对模型进行可视化,用的keras手动绘图输出CNN训练的中途结果,本篇文章将讲述如何用PaddlePaddle新开源的VisualDL来进行可视化。在讲VisualDL之前,我们先了解一下常用的Tensorflow的可视化工具 Tensorboard。 Tensorflow的可视阅读全文
posted @ 2018-01-26 11:09 Charlotte77 阅读(3769) 评论(7) 编辑
摘要: 前面几篇文章讲到了卷积神经网络CNN,但是对于它在每一层提取到的特征以及训练的过程可能还是不太明白,所以这节主要通过模型的可视化来神经网络在每一层中是如何训练的。我们知道,神经网络本身包含了一系列特征提取器,理想的feature map应该是稀疏的以及包含典型的局部信息。通过模型可视化能有一些直观的阅读全文
posted @ 2018-01-24 22:47 Charlotte77 阅读(7651) 评论(10) 编辑