| | | |

2017年8月14日

摘要： 1、MP(马尔科夫过程) 1.1、MDP介绍 1）MDP形式化地表达强化学习的过程(此时假设环境完全可以观察) 2) 几乎所有强化学习问题都可以形式化为MDP 1.2、MDP定义 MDP是一个二元组<S，P>，其中S是状态集合；P是状态转移概率 2、MRP(马尔科夫奖励过程) 在MP中加入了Rewa 阅读全文

posted @ 2017-08-14 05:15 _1024 阅读(679) 评论(0) 推荐(0)

2017年8月13日

【论文阅读-DL】《Understanding Black-box Predictions via Influence Functions》阅读

摘要：从模型角度出发解释模型： 1、在测试点周围拟合一个简单模型 2、扰动测试集，看预估值如何变化如何解释模型如何产生呢？使用影响函数来解释使用困难在于： 1、影响函数需要求二阶导； 2、需要模型凸且可微分；解决方案：二阶优化技术 Question：这篇文章里面的training point是指什阅读全文

posted @ 2017-08-13 23:24 _1024 阅读(349) 评论(0) 推荐(0)

强化学习(David Silver)1：简介

摘要： 1、书《An introduction to Reforcement Learning》Sutton and Barto, 1998，400页《Algorithms for Reforcement Learning》Szepesvari，2010，偏数学，不到100页 2、强化学习的特点不存在阅读全文

posted @ 2017-08-13 21:49 _1024 阅读(1387) 评论(0) 推荐(0)

2017年8月10日

【论文阅读-DL】《Understanding Black-box Predictions via Influence Functions》阅读

摘要：摘要：基于robust statistics中的影响函数的学习，提出一套方案： 1）只需要梯度和二阶导； 2）非凸不可微问题也有一定意义； 3）对于香型模型和CNN：理解模型行为；debug模型；检测数据错误；如果发现文中有问题，敬请联系作者批评指正，真诚欢迎您的指教，谢谢！微信: legel 阅读全文

posted @ 2017-08-10 11:38 _1024 阅读(1066) 评论(0) 推荐(0)

2017年8月6日

生成模型和判别模型

摘要： 1、定义：生成模型（或称产生式模型）和判别模型（或称判别式模型）的本质区别在于模型中观测序列x和状态序列y的决定关系。前者假设y决定x，后者假设x决定y。 2、生成模型特点 2.1、生成模型以“状态序列y按照一定的规律生成观察输入序列x”为假设，针对联合分布p(x,y)建模，通过估计生成概率最大的阅读全文

posted @ 2017-08-06 05:27 _1024 阅读(349) 评论(0) 推荐(0)

第6章：概率图模型

摘要：非常重要：逻辑归回模型与最大熵模型的等价性：逻辑回归模型，本质上就是一个最大熵模型最大熵模型，是基于最大熵原理的判别模型最大熵原理，在满足约束条件的情况下，选择熵最大的模型 1概率图模型分类 1.1有向图模型 1.1.1静态贝叶斯网络 1.1.2动态贝叶斯网络 1.1.2.1隐马尔科夫模型：用阅读全文

posted @ 2017-08-06 01:46 _1024 阅读(168) 评论(0) 推荐(0)

2017年8月1日

基础算法问题

摘要：找出字符串的最长不重复子串，输出长度公共祖先节点：http://blog.csdn.net/yangrujing/article/details/51985860 即在父串中寻找子串首次出现的位置求两个串中的第一个最长子串求子数组的最大和在二元树中找出和为某一值的所有路径在二元树中找出和为阅读全文

posted @ 2017-08-01 17:42 _1024 阅读(137) 评论(0) 推荐(0)

2017年6月28日

【论文阅读-CTR】<<Optimized Cost per Click in Taobao Display Advertising>>阅读

摘要： 0、摘要传统广告按cpm/cpc计费；广告主出价固定，不能充分优化广告主汇报和流量。使用ocpc优化。 1、介绍 1.1、两种形式 Banner CPC Item CPC:200个中有3个广告位 1.2、和RTB差别同时具有需求方和供给方的特点，数据闭环，用户行为更加完整；大部分广告主都比较小阅读全文

posted @ 2017-06-28 15:01 _1024 阅读(604) 评论(0) 推荐(0)

2017年6月25日

【论文阅读-对话系统】<<Neural Responding Machine for Short-Text Conversation>>阅读

摘要： 1、介绍 1.0.1、自然语言对话的传统方案：基于规则or基于学习；缺点：人工构建规则或者模型，在小数据上运行，不好迁移 1.0.2、STC：Short-Text Conversation——只考虑一轮对话 STC解决方案：基于检索or基于SMT(statistical machine tra 阅读全文

posted @ 2017-06-25 15:57 _1024 阅读(455) 评论(0) 推荐(0)

2017年6月15日

【读书笔记】——终极算法

摘要： Note1:网飞的推荐倾向于长尾 Note2: 符号学派：逆向演绎，从哲学、心理学、逻辑学寻求洞见——>逆向演绎连接学派：对大脑进行逆向分析，来源于神经科学和物理学——>反向传播进化学派：在计算机上进行模拟，利用遗传学和进化生物学——>遗传编程贝叶斯学派：概率推理，理论基础是统计学——>贝叶斯阅读全文

posted @ 2017-06-15 04:08 _1024 阅读(212) 评论(0) 推荐(0)