摘要: 上个月对一个小项目的效果进行改进,时间紧,只有不到一周的时间,所以思考了一下就用了最简单的方法来做,效果针对上一版提升了5%左右,跟大家分享一下(项目场景用的类似的场景) 项目场景:分析一个产品的竞品,譬如app的竞品、网站的竞品等等 项目分析:简单来说就是竞品分析,竞品分析有很多比较成熟的方法,但 阅读全文
posted @ 2017-09-11 14:32 Charlotte77 阅读(5397) 评论(3) 推荐(3) 编辑
摘要: 今天刚从医院复查回来,有时间更一下博客,就趁这个时候总结一下坑爹的2016吧 这个博客是去年年底的时候建的,但是今年3月才开始正式写,但是7月份开始又没有写了,原因很简单,因为我换工作了。7月底开始有换工作的想法,8月中旬开始面试,9月初入职,可惜新公司的部门技术氛围与我想想的差别有点大,做的业务也 阅读全文
posted @ 2016-12-14 11:52 Charlotte77 阅读(12285) 评论(57) 推荐(37) 编辑
摘要: 前几天用CNN识别手写数字集,后来看到kaggle上有一个比赛是识别手写数字集的,已经进行了一年多了,目前有1179个有效提交,最高的是100%,我做了一下,用keras做的,一开始用最简单的MLP,准确率只有98.19%,然后不断改进,现在是99.78%,然而我看到排名第一是100%,心碎 = = 阅读全文
posted @ 2016-07-18 21:11 Charlotte77 阅读(39954) 评论(21) 推荐(17) 编辑
摘要: #————————————————————————本文禁止转载,禁止用于各类讲座及ppt中,违者必究————————————————————————# 前几天看到一个有意思的分享,大意是讲如何用Tensorflow教神经网络自动创造音乐。听起来好好玩有木有!作为一个Coldplay死忠粉,第一想法就 阅读全文
posted @ 2016-07-12 18:30 Charlotte77 阅读(30244) 评论(26) 推荐(22) 编辑
摘要: 写在前面:本来这篇应该是上周四更新,但是上周四写了一篇深度学习的反向传播法的过程,就推迟更新了。本来想参考PRML来写,但是发现里面涉及到比较多的数学知识,写出来可能不好理解,我决定还是用最通俗的方法解释PCA,并举一个实例一步步计算,然后再进行数学推导,最后再介绍一些变种以及相应的程序。(数学推导 阅读全文
posted @ 2016-07-06 11:33 Charlotte77 阅读(23945) 评论(23) 推荐(15) 编辑
摘要: 最近在看深度学习的东西,一开始看的吴恩达的UFLDL教程,有中文版就直接看了,后来发现有些地方总是不是很明确,又去看英文版,然后又找了些资料看,才发现,中文版的译者在翻译的时候会对省略的公式推导过程进行补充,但是补充的又是错的,难怪觉得有问题。反向传播法其实是神经网络的基础了,但是很多人在学的时候总 阅读全文
posted @ 2016-06-30 16:23 Charlotte77 阅读(422890) 评论(175) 推荐(212) 编辑
摘要: 本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢! 系列目录: 1 第一部分 模型的评估与数据处理 2 3 机器学习基础与实践(一) 数据清洗 4 5 机器学习基础与实践(二) 数据转换 6 7 机器学习基础与实践(三) 数据降维 8 9 10 11 阅读全文
posted @ 2016-06-28 16:46 Charlotte77 阅读(34978) 评论(8) 推荐(10) 编辑
摘要: 本博客所有内容以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,并且是非商业用途,谢谢! 想写这个系列很久了,最近刚好项目结束了闲下来有点时间,于是决定把之前学过的东西做个总结。之前看过一些机器学习方面的书,每本书都各有侧重点,机器学习实战和集体智慧编程更偏向与实战,侧重于对每个算法的实 阅读全文
posted @ 2016-06-23 13:25 Charlotte77 阅读(64554) 评论(19) 推荐(24) 编辑
摘要: 写这个系列是因为最近公司在搞技术分享,学习Spark,我的任务是讲PySpark的应用,因为我主要用Python,结合Spark,就讲PySpark了。然而我在学习的过程中发现,PySpark很鸡肋(至少现在我觉得我不会拿PySpark做开发)。为什么呢?原因如下: 1.PySpark支持的算法太少 阅读全文
posted @ 2016-05-31 15:33 Charlotte77 阅读(12343) 评论(4) 推荐(6) 编辑
摘要: 本来这篇是准备5.15更的,但是上周一直在忙签证和工作的事,没时间就推迟了,现在终于有时间来写写Learning Spark最后一部分内容了。 第10-11 章主要讲的是Spark Streaming 和MLlib方面的内容。我们知道Spark在离线处理数据上的性能很好,那么它在实时数据上的表现怎么 阅读全文
posted @ 2016-05-30 12:24 Charlotte77 阅读(11323) 评论(7) 推荐(3) 编辑
摘要: 昨天总结了深度学习的资料,今天把机器学习的资料也总结一下(友情提示:有些网站需要"科学上网"^_^) 推荐几本好书: 1.Pattern Recognition and Machine Learning (by Hastie, Tibshirani, and Friedman's ) 2.Eleme 阅读全文
posted @ 2016-05-13 10:29 Charlotte77 阅读(13759) 评论(5) 推荐(7) 编辑
摘要: 最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books Courses Video and Lectures Papers Tutorials WebSites Datasets Frameworks Miscellaneous Github 几 阅读全文
posted @ 2016-05-12 14:18 Charlotte77 阅读(28944) 评论(11) 推荐(33) 编辑
摘要: 为了方便大家阅读,我把博文目录梳理了一下,里面会有已完成和计划写的博文,希望大家多多交流,有错误的地方请随时指正^_^ 深度学习入门系列 (每周三发一篇,计划11月~6月更完) 三个月教你从零入门深度学习 (10.26更新) 【深度学习系列】手写数字识别实战(10.23更新) 【深度学习系列】卷积神 阅读全文
posted @ 2016-05-09 09:16 Charlotte77 阅读(4027) 评论(10) 推荐(7) 编辑
摘要: 为了记录自己度过的书,写个帖子总结一下,不定时更新。以前度过的书有些不记得了,就先记录一下我记得的吧:) PS:现在读过的书(2016.4月以后),我会做读书总结。以前看的书,会再抽时间回顾一下,做个简单的总结。跟数据挖掘相关的书我另写了一个帖子,可以参考这个: 【原】数据分析/数据挖掘/机器学习 阅读全文
posted @ 2016-05-09 09:14 Charlotte77 阅读(3469) 评论(25) 推荐(5) 编辑
摘要: 周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =。这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark SQL相关的知识,如果对Spark不熟的同学可以先看看之前总结的两篇文章: 【原】Learning 阅读全文
posted @ 2016-05-08 21:42 Charlotte77 阅读(9928) 评论(5) 推荐(5) 编辑