• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






_1024

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2017年8月14日

【论文阅读-DL】《One Model To Learn Them All》阅读
摘要: 概念:One/Zero-shot learning 训练集中没有样本的学习;和transfer learning/domain adoption有关 NN很成功,但是每个领域都有自己的model;本文尝试搞一个统一的模型 之前也有人尝试过NLP/语音识别/人脸检测的多任务学习,但是不是跨域地 目前的 阅读全文
posted @ 2017-08-14 06:00 _1024 阅读(169) 评论(0) 推荐(0)
 
强化学习(David Silver)2:MDP
摘要: 1、MP(马尔科夫过程) 1.1、MDP介绍 1)MDP形式化地表达强化学习的过程(此时假设环境完全可以观察) 2) 几乎所有强化学习问题都可以形式化为MDP 1.2、MDP定义 MDP是一个二元组<S,P>,其中S是状态集合;P是状态转移概率 2、MRP(马尔科夫奖励过程) 在MP中加入了Rewa 阅读全文
posted @ 2017-08-14 05:15 _1024 阅读(676) 评论(0) 推荐(0)