摘要:相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_8944599187128112347"}&n_type=1&p_from=4 具体见原文: 茶派科技发布:78款国产人形机器人全纪录
阅读全文
摘要:相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9723466264962965374"}&n_type=-1&p_from=-1 自己是搞AI的,而且是人形机器人的下属领域,所以就没事会去看看相
阅读全文
摘要:地址: https://www.youtube.com/watch?v=BnoMTeKxwBQ 🚀当Deepseek v3遇上贪吃蛇:一个简单游戏实现背后,揭示最新开源大模型在复杂编程场景下的短板与不足 🚀本期视频我们详细测试了Deepseek最新发布的开源大模型Deepseek V3的综合能力
阅读全文
摘要:原地址: https://www.corsair.com/us/en/explorer/gamer/gaming-pcs/intel-core-ultra-9-285k-vs-14900kks-which-is-better/ 个人的观点: 14900k 和 14900ks CPU在近一年来报出了多
阅读全文
摘要:相关: https://ai-bot.cn/psi-r0/ 灵初智能发布首个基于强化学习(RL)的端到端具身模型Psi R0。该模型支持双灵巧手协同进行复杂操作,将多个技能串联混训,生成具有推理能力的智能体,从而完成并闭环长程灵巧操作任务。并且,Psi R0还可以实现跨物品、跨场景级别的泛化。
阅读全文
摘要:运行强化学习pcl算法,报错,原因是gym版本过高,gym停止维护版本为0.26版本,降低版本到0.18,运行成功。 pcl算法的官方地址: https://github.com/tensorflow/models/blob/master/research/pcl_rl
阅读全文
摘要:相关: Docker存储(三)绑定挂载和tmpfs的使用 docker-tmpfs挂载 docker中tmpfs占用磁盘 Docker 基础知识 - 使用 tmpfs 挂载(tmpfs mounts)管理应用程序数据 【docker常用命令系列】docker run示例选项用法大全权威详解 tmpf
阅读全文
摘要:官方实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 在SAC算法的官方实现中有一个论文中没有介绍的部分,这就是SAC中的alpha_losse,在SAC论文中alpha是以超参数的形式存在的,但是在论文作者发布的具体实现
阅读全文
摘要:完整的官方代码地址如下: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 核心代码实现: 点击查看代码 from copy import deepcopy from collections import OrderedDict fr
阅读全文
摘要:本文只讲命令行模式下的设置: 设置为性能模式: powerprofilesctl set performance 设置为均衡模式: powerprofilesctl set balanced 设置为节能模式: powerprofilesctl set power-saver PS: 性能模式就是CP
阅读全文
摘要:相关: 容器魔方安装和升级教程 一、 什么是网心云容器版产品「容器魔方」? 「容器魔方」由网心云推出的一款docker容器镜像软件,通过简单安装后即可快速加入网心云边缘云计算生态网络,为网心科技星域云贡献带宽和存储资源,用户根据每日的贡献量可获得相应的现金收益回报。网心科技星域云通过先进的边缘编排技
阅读全文
摘要:相关: 轰动美国!高校精英枪杀CEO,却被一些人视为“英雄”,游街照疯狂出圈
阅读全文
摘要:相关: https://www.douyin.com/video/7283392275898469692 https://baijiahao.baidu.com/s?id=1817600784333238762&wfr=spider&for=pc 公器私用是对社会危险极大的一种行为,如何在没有相关规
阅读全文
摘要:机器学习理论中的渐进最优化是指无限时间运行下算法最终收敛到最优值,而在强化学习中这个无限时间下的运行是为了保证所有状态空间均可以被访问无限次,从而实现无限次的优化。
阅读全文
摘要:区块链技术已经好多年没有听到有人提了,不过比特币却一直是不是的又新闻出现,当然国内已经把比特币交易归入到了不合法的地位了。区块链技术是国家战略的技术,但是这个技术说实话确实不是很高深,或者说蛮easy的,找几个C++技术好的人就完全可以从零开始手撸一个新版比特币出来,但是之所以区块链被归入到国家战略
阅读全文
摘要:Drake 是一个用于机器人系统的模型驱动设计和验证的开源项目。它由麻省理工学院(MIT)开发,旨在为机器人研究人员和工程师提供一个强大的工具集,用于模拟、分析和验证机器人系统的行为。Drake 支持多种机器人应用,包括但不限于运动规划、控制、感知和仿真。 项目源码地址: https://githu
阅读全文
摘要:网上找到的一个实现: 地址: https://gist.github.com/HenryJia/23db12d61546054aa43f8dc587d9dc2c 稍微修改后的代码: import numpy as np import gym def sigmoid(x): return 1.0 /
阅读全文
摘要:原文地址: http://deeprl.neurondance.com/d/154 美国 Stanford:Benjamin Van Roy (摘自 http://deeprl.neurondance.com/d/154) 伯克利:Sergey Levine(论文高产作者)、Pieter Abbel
阅读全文
摘要:SQL算法的官方实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 提两个问题: SQL算法的原始论文中在计算Q loss function的时候建议使用重要性采样,而实际代码中却使用的是均匀采样,同时也没有采样重要性采样的
阅读全文
摘要:代码实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning/src/branch/master/softlearning/misc/kernel.py SVGD 是一种高效、灵活的推断方法,尤其适合高维度复杂分布的近似问题。 f
阅读全文
摘要:前文: 强化学习算法中的log_det_jacobian —— 概率分布的仿射变换(Bijector) 前文说到概率分布的仿射变换(Bijector)在贝叶斯、变分推断等领域有很重要的作用,但是在强化学习中呢,其实在强化学习中也会用到,但是最为普遍的应用场景其实只是做简单的tanh变换。 在强化学习
阅读全文
摘要:关于TensorFlow的probability模块的教程: https://tensorflow.google.cn/probability/examples/A_Tour_of_TensorFlow_Probability?hl=zh-cn 相关: https://colab.research.
阅读全文
摘要:相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9588328155434867865"}&n_type=-1&p_from=-1
阅读全文
摘要:高斯分布微分熵的推导 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/raby_gyl/article/details/73477043
阅读全文
摘要:视频地址: https://www.bilibili.com/video/BV13qBNYqExW/ 【完整演讲视频】OpenAI前首席科学家Ilya Sutskever在全球AI顶会NeurIPS2024上发表领奖演讲,并表示:「我们获得的数据已经到头,不会再有更多了。」 自然界中,体质量和大脑质
阅读全文
摘要:相关视频: https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a7c33851d2f0a4e69aa50fae3038d63-sd.mp4
阅读全文
摘要:新买域名地址: http://www.angrypanda.top/ 域名管理地址: https://console.huaweicloud.com/
阅读全文
摘要:最近几年已经不太在意国内的deep learning的框架发展了,尤其是硬件发展,因为我的华为昇腾的使用权限已经过期了,没有了国产硬件使用权限后我也就自然不太关注国内国产AI硬件的事情了,不过最近看到特朗普又要回来了,然后NVIDIA又要搞什么限制了,于是也就又想起谈谈国内AI硬件和deep lea
阅读全文
摘要:softlearning原始项目: https://github.com/rail-berkeley/softlearning 国内地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 相关: 强化学习:人形机器人 —— soft
阅读全文
摘要:项目源码地址: https://github.com/rail-berkeley/softlearning 调试这个代码其实没有什么实际意义,这里只是做了个尝试,纯属“恶趣味”。 安装时候的一个重点就是需要安装gcc-9,不能安装过高版本的GCC,否则报错。 mujoco版本为200,地址: htt
阅读全文
摘要:来源: https://www.cnblogs.com/boydfd/p/18606571 这里给熟悉游戏显卡的同学稍微科普一下Nvidia的架构历史,从Maxwell开始: Maxwell 架构 发布时间:2014年 游戏卡命名:GTX 9xx 系列,如 GTX 970, GTX 980 数据卡命
阅读全文
摘要:来源: https://www.cnblogs.com/boydfd/p/18606571
阅读全文
摘要:首先在你的Windows主机上编写你的python代码或python应用: 编写完成后选择该文件的属性配置,然后配置执行方式,并选择python执行,我这里的python命令的地址是: D:\anaconda3\pythonw.exe 为刚刚设置执行应用设置的代码设置快捷方式 在Window11系统
阅读全文
摘要:操作系统一般都有这种设定,不论是windows还是Linux系统,那就是主机开机不插屏幕不能自动进入桌面操作系统一般都有这种设定,不论是windows还是Linux系统,那就是主机开机不插屏幕不能自动进入桌面。 如何解决: 给主机插上“屏幕欺骗器” 操作系统在启动的过程中,在进入系统之前会读取连接的
阅读全文
摘要:视频地址: https://www.youtube.com/watch?v=Z9eV9mbB6uY 相关地址: https://huggingface.co/spaces/hf-accelerate/model-memory-usage 详细内容: https://techdiylife.githu
阅读全文
摘要:SAC和SQL算法的项目地址: https://github.com/rail-berkeley/softlearning SAC和SQL算法的mujoco模型文件地址: https://github.com/rail-berkeley/softlearning/tree/master/models
阅读全文
摘要:报错: cymj.pyx:67:5: Exception check on 'c_warning_callback' will always require the GIL to be acquired. 相关: https://github.com/openai/mujoco-py/issues/
阅读全文
摘要:相关: https://arxiv.org/pdf/1702.08165 首先,要知道soft-learning是一个很老的算法,其实就是在q-learning的基础上加了个soft变换,然后在探索阶段不使用epsilon-greedy探索,而是使用soft-q作为探索方法,而在训练参数时候使用的u
阅读全文
摘要:相关: https://github.com/tensorflow/tensorflow/issues/62210 解决方法: 更换TensorFlow版本,安装2.13版本。 TF version 2.13
阅读全文
摘要:相关地址: https://github.com/readthedocs/readthedocs.org/issues/10286 问题: 解决方法: pip install setuptools==65.5.0
阅读全文
摘要:相关: https://www.reddit.com/r/learnmachinelearning/comments/1gy86nl/am_i_allowed_to_say_that_i_kinda_hate/ 我能这样说吗?我有点讨厌强化学习 讨论 我所有的机器学习工作经验都集中在监督学习上。我很
阅读全文
摘要:地址: https://www.wandelbots.com/blog/machine-learning-in-robotics 机器学习在机器人技术中的应用 机器人视觉系统 机器人视觉系统(也称为机器视觉)将传感器和摄像头与机器学习算法结合使用。这些传感器和摄像头采集物理数据,机器学习算法处理这些
阅读全文
摘要:相关: 【北京公交】怎样才算一套健全的BRT系统?为何北京的BRT走向沦落?浅谈与介绍快速公交系统及其构成【聊公交-19】 BRT 就是拥有独有路权、专用设施、高效乘降的公交车,因为有这三个特点,因此BRT又不是简单的在公交车系统上的升级,可以说BRT不是公交车但又是公交车,或者说是一种特殊的公交车
阅读全文
摘要:奖励景观(机器学习、强化学习) 在强化学习中,Reward Landscape 指的是奖励函数随着状态和行为的变化所形成的空间结构。它可以帮助理解智能体如何通过探索奖励的分布来优化策略。 翻译: 奖励景观;奖励分布图。 例句: The agent learns to navigate the rew
阅读全文
摘要:强化学习算法是人工智能领域发展最为强劲的一个分支,但是很多人都将注意力放在了算法模型的发展上而忽略了其基本理论上的一些概念,本文就讨论一下强化学习算法的一些基本概念的界定上。 来源: https://ai.stackexchange.com/questions/39545/why-is-soft-q
阅读全文
摘要:原文: https://ai.stackexchange.com/questions/39545/why-is-soft-q-learning-not-an-actor-critic-method I've been reading these two papers from Haarnoja et
阅读全文
摘要:机器学习中的 energy-based model 是什么? 低能量对应高概率,高能量对应低概率。
阅读全文
摘要:参考: 大连理工大学——延期博士、结业博士——如何在离校后个人缴纳医疗保险 大连的门诊医保——在大连门诊就医可以使用医保了 【转载】辽宁省大连市“某高校”在校大学生医保缴费方式 沈阳市城市居民参保,见: 大连理工大学——延期博士、结业博士——如何在离校后个人缴纳医疗保险 大连市城市居民参保,见: 【
阅读全文
摘要:地址: https://www.youtube.com/watch?v=pg-lKy7JIRk
阅读全文
摘要:地址: https://www.tesble.com/10.1109/ICTC.2018.8539438 我们在四种不同的奖励函数和终止条件下对行走者进行了训练,以评估结合奖励塑形和课程学习的效果。具体如下。 1)距离稀疏奖励:行走者到达目标时给予1个奖励,否则为0。 2)距离课程奖励:给予行走者的
阅读全文
摘要:登录地址: https://www.belief1008.com/
阅读全文
摘要:这里谈谈立场不正确的问题,那就是中美高教的分析。 可以说中国的教育是平民教育,而美国的教育是精英教育,但是在我看来其实并没有什么完全意义上的平民教育和精英教育,一切都是相对而言的。 中国的教育是公立教育,而美国的教育是私立教育,因此美国的教育成了有钱人才可以参与的游戏,而中国的教育呢,其实随着中国经
阅读全文
摘要:相关: https://docs.zeroth.bot/ml/rl Reward Shaping General Configuration for Standing A general configuration for standing involves ensuring that the or
阅读全文
摘要:说下个人对这部分的理解,这个就是说要机器人去在人类的控制下学习动作,或者说在人类的遥控下进行操作,然后记录下这部分操作的数据,然后再用这部分收集到的数据来对机器人进行训练。 其他相关: https://github.com/kscalelabs/teleop
阅读全文
摘要:我理想中的网络结构示意图: FCN-8 VCG-16 工具介绍: tikz_cnn 地址: https://github.com/jettan/tikz_cnn PlotNeuralNet https://github.com/HarisIqbal88/PlotNeuralNet draw_conv
阅读全文
摘要:相关: https://www.youtube.com/watch?v=77990wI3LZk https://anythingllm.com/ https://ollama.com/
阅读全文
摘要:地址: http://www.co-journal.com/CN/rich_html/10.12382/bgxb.2023.0827 利用领域知识、专家知识等先验知识对巡飞弹避障模型进行探索引导,能够使算法快速学会基础规则与策略,降低算法在无效状态空间中的探索时间。模仿学习是其中最为行之有效的引导技
阅读全文
摘要:

地址: http://www.co-journal.com/CN/10.12382/bgxb.2022.0711 这个论文主要是看如何处理所谓的SAC强化学习算法在军事上的应用和其中提出的元策略算法 + option-critic分层强化学习的组合,不过这个论文看完感觉不知道是如何做的,其中的描述也
阅读全文
摘要:相关: https://aschrein.github.io/jekyll/update/2019/06/13/whatsup-with-my-branches-on-gpu.html#tldr 具体内容参照原文: https://aschrein.github.io/jekyll/update/2
阅读全文
摘要:视频: https://www.youtube.com/watch?v=YM9DJ8-tU78&list=PLXgxz3qIE6AmcMV9qzsJz1kVAU792LgE3&index=1 相关: https://openvla.github.io/ https://arxiv.org/abs/2
阅读全文
摘要:地址: https://zalo.github.io/mujoco_wasm/
阅读全文
摘要:在2017年后,Google的TensorFlow在与Facebook的pytorch的竞争中落败,于是为了重夺业内位置,Google在将开放重点从TensorFlow转为新开发一种新的工具框架,那就是jax。虽然在某种意义上来说Google已经放弃了TensorFlow,但是在Google内部依然
阅读全文
摘要:The command above loads MuJoCo’s GUI, which allows you to simulate the model, manually specify joints, and save keyframes. 命令: python3 -m mujoco.viewe
阅读全文
摘要:相关: https://github.com/wandb/wandb/issues/8971 解决方法: pip install -U moviepy==1.0.3
阅读全文
摘要:游戏项目的源码地址: https://openi.pcl.ac.cn/devilmaycry812839668/Tank_Game_1990 pygame:python编写的坦克大战游戏(多年前网上找到的资源,来源已不可考),本人小的时候最喜欢玩的就是小霸王学习机上的黄卡游戏,而在这些72合一的黄卡
阅读全文
摘要:介绍视频: https://www.bilibili.com/video/BV1in6PY7E1B 项目地址: https://docs.zeroth.bot/ 项目的开源代码地址: https://github.com/zeroth-robotics 机器人外壳:
阅读全文
摘要:标题建议,例如:英伟达 Isaac Sim仿真平台体验 运行的商品名称 产品名称及版本: Isaac Sim 版本信息及相关配置: 运行的过程记录 【GPU加速仿真】 请描述您在使用Isaac Sim进行GPU加速仿真的具体操作步骤和过程。 可以创建一些简单的任务,例如: 创建一个简单的多球体下落场
阅读全文
摘要:标题建议,例如:英伟达 Isaac ROS 产品体验 运行的商品名称 产品名称: Isaac ROS 版本信息及相关配置: 运行的过程记录 【GPU加速仿真】 请描述您在使用Isaac ROS进行GPU加速不同任务的具体操作步骤和过程,如之前有使用ROS/ROS2框架的经验,可以做一个对比记录。 【
阅读全文
摘要:标题建议,例如:英伟达 Isaac Manipulator产品体验 运行的商品名称 产品名称及版本: Isaac Manipulator 版本信息及相关配置: 运行的过程记录 【GPU加速任务】 请描述您在使用Isaac Manipulator时,调用cuMotion加速库来进行机器人运动规划和轨迹
阅读全文
摘要:回忆下历史: 关键词: “袁世凯围堵国会” 活久见,韩国从中国独立之后经历了日本殖民和美国殖民,虽然现在的韩国依旧在美国的殖民之下,但是并没有影响韩国国民的生活,而且随着美国资金的注入加上韩国财阀的产业发展反而使韩国进入到了发达国家队伍,但是这几十年来韩国倒是频繁发生政变。没想到,就在此时此刻,韩国
阅读全文
摘要:总会遇到有国内的富裕家庭的孩子去海外留学后不会写代码,完不成作业的,搞不定论文的,等等吧,想想这货还挺赚钱,于是考虑单独把这个活当做一门副业,哈哈哈!!! 这些年除了海外留学的还有不少国内的各所大学的找来的,有的是看到blogs上的文章感觉能干的了的,也有朋友和领导给推过来的活,想想也是有意思,计算
阅读全文
摘要:本文主要介绍NVIDIA公司推出的人形机器人仿真平台Isaac sim的历史和技术特征,内容源自NVIDIA公司的视频及PPT内容:
阅读全文
摘要:● Sim2Real gap - The domain gap between simulated data and real world data ● Models trained in simulation without proper configurations fail in the re
阅读全文
摘要:论文地址: http://xwxt.sict.ac.cn/CN/Y2024/V45/I7/1552 PS: 这个学习率有些奇怪,用数据量占一次优化的总数据量的大小作为学习率,这或许也是真的有独创性的操作了,不过这么做是否真的可行呢,或者这只是纸上谈兵呢。 PS: 这里的状态转移概率怎么和策略的动作选
阅读全文
摘要:相关: https://blogs.nvidia.com/blog/robot-learning-humanoid-development/ 根据NVIDIA公司的Groot项目给出的定义,我们可以知道人形机器人在软件层面上需要具备或者说需要完成的几种功能: GR00T-Gen for buildi
阅读全文
摘要:title: 人形机器人—圈子里的鄙视链 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: 谈谈「机器人创业」圈子里的鄙视链丨智涌分析 “搞软件的,鄙视搞硬件的,搞大模型的,看不起强化学习的”
阅读全文