随笔分类 -  深度学习

逻辑回归(Logistic Regression)
摘要:逻辑回归(Logistic Regression)是一种用于解决二分类(0 or 1)问题的机器学习方法,用于估计某种事物的可能性。比如某用户购买某商品的可能性,某病人患有某种疾病的可能性,以及某广告被用户点击的可能性等。 注意,这里用的是“可能性”,而非数学上的“概率”,logisitc回归的结果 阅读全文

posted @ 2019-08-31 16:22 TMatrix52 阅读(534) 评论(0) 推荐(0)

Factorization Machines
摘要: 阅读全文

posted @ 2019-07-14 18:19 TMatrix52 阅读(140) 评论(0) 推荐(0)

深度学习在美团搜索广告排序的应用实践
摘要:深度学习在美团搜索广告排序的应用实践 阅读全文

posted @ 2019-07-14 17:52 TMatrix52 阅读(130) 评论(0) 推荐(0)

两个经典问题
摘要:为什么在CNN等结构中将原先的sigmoid、tanh换成ReLU可以取得比较好的效果? 为什么在RNN中,将tanh换成ReLU不能取得类似的效果? 链接 阅读全文

posted @ 2019-05-19 21:59 TMatrix52 阅读(90) 评论(0) 推荐(0)

基于深度学习和迁移学习的识花实践
摘要:基于深度学习和迁移学习的识花实践 transfer_learning.py代码如下 training.py代码如下 结果: 阅读全文

posted @ 2018-09-17 18:57 TMatrix52 阅读(405) 评论(0) 推荐(0)

xgboost中XGBClassifier()参数详解
摘要:http://www.cnblogs.com/wanglei5205/p/8579244.html 常规参数 模型参数 学习任务参数 阅读全文

posted @ 2018-09-10 21:27 TMatrix52 阅读(13085) 评论(0) 推荐(0)

xgboost使用经验总结
摘要:xgboost使用经验总结 xgboost入门与实战(原理篇) 阅读全文

posted @ 2018-09-04 17:45 TMatrix52 阅读(357) 评论(0) 推荐(0)

特征选择之Chi卡方检验
摘要:特征选择之Chi卡方检验 卡方值越大,说明对原假设的偏离越大,选择的过程也变成了为每个词计算它与类别Ci的卡方值,从大到小排个序(此时开方值越大越相关),取前k个就可以。 针对英文纯文本的实验结果表明:作为特征选择方法时,开方检验和信息增益的效果最佳(相同的分类算法,使用不同的特征选择算法来得到比较 阅读全文

posted @ 2018-09-04 16:40 TMatrix52 阅读(1065) 评论(0) 推荐(0)

paddle——docker实践
摘要:在Docker中执行PaddlePaddle训练程序: 阅读全文

posted @ 2018-08-24 14:23 TMatrix52 阅读(314) 评论(0) 推荐(0)

paddle实践
摘要:Docker image阅读:https://github.com/PaddlePaddle/book/blob/develop/README.cn.md docker run -d -p 8888:8888 paddlepaddle/book 阅读全文

posted @ 2018-08-24 11:31 TMatrix52 阅读(116) 评论(0) 推荐(0)

用conda创建python虚拟环境
摘要:1、首先在所在系统中安装Anaconda。可以打开命令行输入conda -V检验是否安装以及当前conda的版本。 2、conda常用的命令。 1)conda list 查看安装了哪些包。 2)conda env list 或 conda info -e 查看当前存在哪些虚拟环境 3)conda u 阅读全文

posted @ 2018-07-06 16:08 TMatrix52 阅读(242) 评论(0) 推荐(0)

网络表示学习
摘要:网络表示学习 阅读全文

posted @ 2018-06-29 19:36 TMatrix52 阅读(99) 评论(0) 推荐(0)

Micro- and macro-averages
摘要:https://datascience.stackexchange.com/questions/15989/micro-average-vs-macro-average-performance-in-a-multiclass-classification-settin/16001 Micro- an 阅读全文

posted @ 2018-05-23 10:24 TMatrix52 阅读(204) 评论(0) 推荐(0)

ROC曲线和AUC值
摘要:链接:https://www.zhihu.com/question/39840928/answer/146205830来源:知乎 一、混淆矩阵 混淆矩阵如图1分别用”0“和”1“代表负样本和正样本。FP代表实际类标签为”0“,但预测类标签为”1“的样本数量。其余,类似推理。 二、假正率和真正率 假正 阅读全文

posted @ 2018-05-02 14:35 TMatrix52 阅读(361) 评论(0) 推荐(0)

mxnet 动手学深度学习
摘要:http://zh.gluon.ai/chapter_crashcourse/introduction.html 强化学习(Reinforcement Learning) 如果你真的有兴趣用机器学习开发一个能与周围环境交互并产生影响的智能体,你大概需要专注于强化学习(以下简称RL)。包括机器人程序、 阅读全文

posted @ 2018-04-06 20:26 TMatrix52 阅读(272) 评论(0) 推荐(0)

RNN 通过字符语言模型 理解BPTT
摘要:链接:https://github.com/karpathy/char-rnn http://karpathy.github.io/2015/05/21/rnn-effectiveness/ https://github.com/Teaonly/beginlearning/tree/master/j 阅读全文

posted @ 2018-02-12 17:08 TMatrix52 阅读(287) 评论(0) 推荐(0)

models.doc2vec – Deep learning with paragraph2vec
摘要:参考: 用 Doc2Vec 得到文档/段落/句子的向量表达 https://radimrehurek.com/gensim/models/doc2vec.html Gensim Doc2vec Tutorial on the IMDB Sentiment Dataset 基于gensim的Doc2V 阅读全文

posted @ 2018-01-04 11:28 TMatrix52 阅读(325) 评论(0) 推荐(0)

TF-IDF
摘要:参考:http://www.cnblogs.com/ybjourney/p/4793370.html http://www.cnblogs.com/ybjourney/p/4824903.html https://janav.wordpress.com/2013/10/27/tf-idf-and-c 阅读全文

posted @ 2017-11-23 20:08 TMatrix52 阅读(165) 评论(0) 推荐(0)

特征工程
摘要:参考:http://blog.sciencenet.cn/blog-995625-803323.html 原始集:概率分布为A训练集:概率分布为B测试集:概率分布为C特征工程:处理A,得到更接近C的B机器学习:拟合B,用以预测C 一.四类特征 特征工程是个过程,包括三个子模块:特征构建->特征提取- 阅读全文

posted @ 2017-11-22 19:50 TMatrix52 阅读(129) 评论(0) 推荐(0)

标签传播算法
摘要:参考:http://blog.csdn.net/zouxy09/article/details/49105265 因为标注成本比较高,当你的训练数据集只有一部分数据是有标注的情况下,使用监督学习你只能扔掉那些没有标注的X。而实际上,有标注的样本和无标注的样本之间是有关系的,这种关系信息也可以用来帮助 阅读全文

posted @ 2017-11-21 20:14 TMatrix52 阅读(264) 评论(0) 推荐(0)

导航