• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






_1024

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理
上一页 1 2 3 4 5 6 ··· 8 下一页

2018年7月12日

【论文阅读-Embedding】《GloVe: Global Vectors for Word Representation》
摘要: 0、摘要 GloVe综合了全局矩阵分解和局部窗口方法 1、介绍 词向量评估方法: 1)一般的词向量评估需要依赖pairwise的词向量的距离或者角度作为内在质量的评估; 2)w2v评估方式是使用了类比。 之前模型的缺点: 矩阵分解模型:利用了统计信息,但是在词模拟任务上表现不好,所以它只有次优的向量 阅读全文
posted @ 2018-07-12 15:11 _1024 阅读(294) 评论(0) 推荐(0)
 

2018年6月5日

机器学习的问题总结
摘要: 1、什么是ill-conditioned问题,会造成什么影响? 2、Momentum如何解决ill-conditioned问题?Momentum有何作用(减少方向上的波动)? 3、Xavier如何解决梯度爆炸问题?各种初始化方法的作用? 4、如何解决梯度消失问题? 阅读全文
posted @ 2018-06-05 14:16 _1024 阅读(96) 评论(0) 推荐(0)
 

2018年6月4日

预算平滑
摘要: 论文:<<Real Time Bid Optimization with Smooth Budget Delivery in Online Advertising>> 介绍两个部分: 1、预估未来消耗率 2、基于消耗率和先验分布来挑选展现和调整bid pacing-rate=bids/reqs 1、 阅读全文
posted @ 2018-06-04 18:53 _1024 阅读(187) 评论(0) 推荐(0)
 

2018年1月25日

ML基础番外篇-距离度量
摘要: 不同距离度量的不同含义 阅读全文
posted @ 2018-01-25 19:01 _1024 阅读(174) 评论(0) 推荐(0)
 

2018年1月10日

vim配置使用
摘要: ctags mac上的ctags配置 1、http://ctags.sourceforge.net从download源码,源码安装 2、which -a ctags查看ctags版本,观察到有两个版本 /usr/bin/ctags => orginal ctags /usr/local/bin/ct 阅读全文
posted @ 2018-01-10 14:56 _1024 阅读(142) 评论(0) 推荐(0)
 

2017年10月30日

强化学习 Note
摘要: 1、这篇note来自https://www.zybuluo.com/tinadu/note/629229 1.1、初步 作者认为,DRL可以用于解决通用人工智能问题,通用人工智能包含3部分: 通用任务:解决一般性任务,减少对领域知识的依赖;非线性的神经网络可以表征这一问题; 学习能力:学习分为归纳和 阅读全文
posted @ 2017-10-30 18:46 _1024 阅读(458) 评论(0) 推荐(0)
 

2017年10月23日

强化学习(David Silver)9:探索与利用
摘要: 1、介绍 1.1、探索方案的策略 1) 随机探索 2) 面对不确定性保持乐观: 估计不确定的值; 选择不确定最大的探索 3) 信息状态空间: 把代理的信息看做值的一部分; 考虑那些有助于提高reward的收益 1.2、探索的方式 1) 在状态-动作空间泰索 2) 在参数空间探索 优势: 连续探索 劣 阅读全文
posted @ 2017-10-23 19:04 _1024 阅读(1680) 评论(0) 推荐(0)
 

2017年10月22日

强化学习(David Silver)8:集成学习和计划
摘要: 1、介绍 这课中的规划就是预测 1.1、Model-Based的两层含义 agent学习环境从一个状态向另一个状态的转移 agent学习状态转移收益 ps: model的学习主体是agent 1.2、利弊 利: 通过监督学习高效学习; 解释model的不确定原因 弊: 学习模型+构造值函数, 叠加两 阅读全文
posted @ 2017-10-22 23:25 _1024 阅读(982) 评论(0) 推荐(0)
 

2017年10月20日

强化学习(David Silver)7:策略梯度算法
摘要: 1、简介 1.1、PolicyBased方法优劣 优势: 更好的收敛特性 在高维或者连续的action空间里面有效 可以学习随机策略 劣势: 收敛到局部最优,而非全局最优 policy估计训练慢、高方差,有时候没有值函数有效:ValueBased方法使用Max贪心优化跑得快; 策略梯度方法在梯度方向 阅读全文
posted @ 2017-10-20 19:52 _1024 阅读(1752) 评论(0) 推荐(0)
 

2017年10月16日

数学基础01-最优化(梯度下降法、牛顿法、拟牛顿法等)
摘要: 1、最优化问题分类 按照约束条件分,可以分为:无约束优化问题、有不等式优化问题、有不等式优化问题。 按照是否线性,可以分为线性优化问题(目标函数和约束均线性)、非线性优化问题(目标函数和约束中任意部分非线性)。 按是否凸,可以分为凸优化问题、非凸优化问题。 对于有约束优化问题,常见的做法是转换到无约 阅读全文
posted @ 2017-10-16 22:08 _1024 阅读(2508) 评论(0) 推荐(1)
 
上一页 1 2 3 4 5 6 ··· 8 下一页