汀、人工智能

摘要： 1.原因：选择动作值只在-1 1之间取值 actor网络输出用tanh，将动作规范在[-1,1]，然后线性变换到具体的动作范围。其次，tanh激活区是有范围的，你的预激活变量（输入tanh的）范围太大，进入了tanh的饱和区，会导致梯度消失，而且tan... 阅读全文

posted @ 2022-10-27 21:33 汀、人工智能阅读(707) 评论(0) 推荐(0)

摘要： 1.机器学习面试： 1.1 内部面试要求：基础：统计学习深度学习：NLP、CV、强化学习【算法岗位】985，211硕士顶会论文，大厂实习经验要求一般是这样的 1、985 2、还不错的论文 3、比赛还不错的名次：kaggle，阿里天池比赛... 阅读全文

posted @ 2022-10-27 21:33 汀、人工智能阅读(429) 评论(0) 推荐(0)

摘要： 1. 单机多卡启动并行训练飞桨2.0增加paddle.distributed.spawn函数来启动单机多卡训练，同时原有的padd... 阅读全文

posted @ 2022-10-27 21:33 汀、人工智能阅读(523) 评论(0) 推荐(0)

摘要： 1.参数服务器训练简介参数服务器训练是分布式训练领域普遍采用的编程架构，主要解决以下两类问题：模型参数过大：单机内存空间不足，需... 阅读全文

posted @ 2022-10-27 21:33 汀、人工智能阅读(614) 评论(0) 推荐(0)

摘要： 1.分布式训练简介分布式训练的核心目的：加快模型的训练速度。通过对训练任务按照一定方法拆分分配到多个计算节点进行计算，再按照一定的方法对需要汇总的信息进行聚合，从而实现加快训练速度的目的。 1.1 分布式训练的并行方式在实际应用中，对训练任务的... 阅读全文

posted @ 2022-10-27 21:33 汀、人工智能阅读(2607) 评论(0) 推荐(0)

摘要： 1.PaddleNLP PaddleNLP是一款简单易用且功能强大的自然语言处理开发库。聚合业界优质预训练模型并提供开箱即用的开发体验，覆盖NLP多场景的模型库搭配产业实践范例可满足开发者灵活定制的需求。 PaddleNLP v2.4发布！Release ... 阅读全文

posted @ 2022-10-27 21:32 汀、人工智能阅读(554) 评论(0) 推荐(0)

摘要：相关文章：【一】MADDPG-单智能体|多智能体总结（理论、算法）【二】MADDPG多智能体深度强化学习算法算法实现(parl)--【追逐游戏复现】程序链接：直接fork：MADDPG多智能体深度强化学习算法算法实现(parl)--【追逐游戏复现】 - ... 阅读全文

posted @ 2022-10-27 21:32 汀、人工智能阅读(1207) 评论(0) 推荐(0)

摘要： 0.引言在机器学习(Machine learning)领域，监督学习(Supervised learning)、非监督学习(Uns... 阅读全文

posted @ 2022-10-27 21:32 汀、人工智能阅读(352) 评论(0) 推荐(0)

摘要： 1.Focal Loss focal loss是最初由何恺明提出的，最初用于图像领域解决数据不平衡造成的模型性能问题。本文试图从交叉... 阅读全文

posted @ 2022-10-27 21:32 汀、人工智能阅读(355) 评论(0) 推荐(0)

摘要： 1.常见NLP任务信息抽取：从给定文本中抽取重要的信息，比如时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。... 阅读全文

posted @ 2022-10-27 21:32 汀、人工智能阅读(113) 评论(0) 推荐(0)

✨汀、