12 2024 档案

人形机器人 —— 78款国产人形机器人全纪录
摘要:相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_8944599187128112347"}&n_type=1&p_from=4 具体见原文: 茶派科技发布:78款国产人形机器人全纪录 阅读全文

posted @ 2024-12-31 15:19 Angry_Panda 阅读(41) 评论(0) 推荐(0)

人形机器人的目前发展水平靠谱吗?
摘要:相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9723466264962965374"}&n_type=-1&p_from=-1 自己是搞AI的,而且是人形机器人的下属领域,所以就没事会去看看相 阅读全文

posted @ 2024-12-31 15:17 Angry_Panda 阅读(34) 评论(0) 推荐(0)

Deepseek V3 —— 6850亿参数混合专家(MoE)架构开源大模型!Deepseek V3全方位客观评测文档处理、逻辑推理、算法编程等多维度的真实能力水平
摘要:地址: https://www.youtube.com/watch?v=BnoMTeKxwBQ 🚀当Deepseek v3遇上贪吃蛇:一个简单游戏实现背后,揭示最新开源大模型在复杂编程场景下的短板与不足 🚀本期视频我们详细测试了Deepseek最新发布的开源大模型Deepseek V3的综合能力 阅读全文

posted @ 2024-12-31 09:38 Angry_Panda 阅读(413) 评论(0) 推荐(0)

英特尔酷睿 Ultra 9 285K 与 14900K/KS:哪个更好?
摘要:原地址: https://www.corsair.com/us/en/explorer/gamer/gaming-pcs/intel-core-ultra-9-285k-vs-14900kks-which-is-better/ 个人的观点: 14900k 和 14900ks CPU在近一年来报出了多 阅读全文

posted @ 2024-12-30 21:32 Angry_Panda 阅读(6472) 评论(0) 推荐(1)

人形机器人 —— 具身智能大模型(强化学习)—— 灵初智能发布首个端到端具身模型Psi R0
摘要:相关: https://ai-bot.cn/psi-r0/ 灵初智能发布首个基于强化学习(RL)的端到端具身模型Psi R0。该模型支持双灵巧手协同进行复杂操作,将多个技能串联混训,生成具有推理能力的智能体,从而完成并闭环长程灵巧操作任务。并且,Psi R0还可以实现跨物品、跨场景级别的泛化。 阅读全文

posted @ 2024-12-30 20:52 Angry_Panda 阅读(135) 评论(0) 推荐(0)

强化学习算法环境报错:python报错 —— gym DuplicatedInput doesn't exist
摘要:运行强化学习pcl算法,报错,原因是gym版本过高,gym停止维护版本为0.26版本,降低版本到0.18,运行成功。 pcl算法的官方地址: https://github.com/tensorflow/models/blob/master/research/pcl_rl 阅读全文

posted @ 2024-12-30 20:49 Angry_Panda 阅读(48) 评论(0) 推荐(0)

容器:Docker存储——绑定挂载和tmpfs的使用( --mount 和 --tmpfs 和 -v )
摘要:相关: Docker存储(三)绑定挂载和tmpfs的使用 docker-tmpfs挂载 docker中tmpfs占用磁盘 Docker 基础知识 - 使用 tmpfs 挂载(tmpfs mounts)管理应用程序数据 【docker常用命令系列】docker run示例选项用法大全权威详解 tmpf 阅读全文

posted @ 2024-12-28 16:23 Angry_Panda 阅读(191) 评论(0) 推荐(0)

强化学习算法:soft actor-critic (SAC)—— SAC中的alpha_losse是什么?
摘要:官方实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 在SAC算法的官方实现中有一个论文中没有介绍的部分,这就是SAC中的alpha_losse,在SAC论文中alpha是以超参数的形式存在的,但是在论文作者发布的具体实现 阅读全文

posted @ 2024-12-28 13:14 Angry_Panda 阅读(203) 评论(0) 推荐(0)

强化学习算法:soft actor-critic (SAC)—— 官方发布的核心代码
摘要:完整的官方代码地址如下: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 核心代码实现: 点击查看代码 from copy import deepcopy from collections import OrderedDict fr 阅读全文

posted @ 2024-12-28 12:44 Angry_Panda 阅读(301) 评论(0) 推荐(0)

ubuntu22.04 修改电源模式 —— 性能模式、节能模式、均衡模式 —— 电源选项设置
摘要:本文只讲命令行模式下的设置: 设置为性能模式: powerprofilesctl set performance 设置为均衡模式: powerprofilesctl set balanced 设置为节能模式: powerprofilesctl set power-saver PS: 性能模式就是CP 阅读全文

posted @ 2024-12-25 17:32 Angry_Panda 阅读(2599) 评论(0) 推荐(0)

使用docker镜像运行迅雷的pcdn——迅雷容器魔方
摘要:相关: 容器魔方安装和升级教程 一、 什么是网心云容器版产品「容器魔方」? 「容器魔方」由网心云推出的一款docker容器镜像软件,通过简单安装后即可快速加入网心云边缘云计算生态网络,为网心科技星域云贡献带宽和存储资源,用户根据每日的贡献量可获得相应的现金收益回报。网心科技星域云通过先进的边缘编排技 阅读全文

posted @ 2024-12-25 12:24 Angry_Panda 阅读(1023) 评论(0) 推荐(0)

路易吉·曼吉奥内是否是英雄?
摘要:相关: 轰动美国!高校精英枪杀CEO,却被一些人视为“英雄”,游街照疯狂出圈 阅读全文

posted @ 2024-12-25 11:20 Angry_Panda 阅读(86) 评论(0) 推荐(0)

行程码和天网如何从公器成为了私人工具 —— “贺某阳是如何利用天网系统查找小谢的去向的”—— 公器私用才是最大的恶
摘要:相关: https://www.douyin.com/video/7283392275898469692 https://baijiahao.baidu.com/s?id=1817600784333238762&wfr=spider&for=pc 公器私用是对社会危险极大的一种行为,如何在没有相关规 阅读全文

posted @ 2024-12-25 11:13 Angry_Panda 阅读(195) 评论(0) 推荐(0)

机器学习中的渐进最优化是指什么 —— (强化学习为例)
摘要:机器学习理论中的渐进最优化是指无限时间运行下算法最终收敛到最优值,而在强化学习中这个无限时间下的运行是为了保证所有状态空间均可以被访问无限次,从而实现无限次的优化。 阅读全文

posted @ 2024-12-25 09:25 Angry_Panda 阅读(49) 评论(0) 推荐(0)

区块链技术已经衰落了吗?(区块链已die)
摘要:区块链技术已经好多年没有听到有人提了,不过比特币却一直是不是的又新闻出现,当然国内已经把比特币交易归入到了不合法的地位了。区块链技术是国家战略的技术,但是这个技术说实话确实不是很高深,或者说蛮easy的,找几个C++技术好的人就完全可以从零开始手撸一个新版比特币出来,但是之所以区块链被归入到国家战略 阅读全文

posted @ 2024-12-24 16:40 Angry_Panda 阅读(1196) 评论(2) 推荐(9)

工业机器人仿真工具 —— Drake
摘要:Drake 是一个用于机器人系统的模型驱动设计和验证的开源项目。它由麻省理工学院(MIT)开发,旨在为机器人研究人员和工程师提供一个强大的工具集,用于模拟、分析和验证机器人系统的行为。Drake 支持多种机器人应用,包括但不限于运动规划、控制、感知和仿真。 项目源码地址: https://githu 阅读全文

posted @ 2024-12-22 22:00 Angry_Panda 阅读(274) 评论(0) 推荐(0)

强化学习:使用自动控制方法PID来解决强化学习问题中的cartpole问题(小车平衡杆问题)
摘要:网上找到的一个实现: 地址: https://gist.github.com/HenryJia/23db12d61546054aa43f8dc587d9dc2c 稍微修改后的代码: import numpy as np import gym def sigmoid(x): return 1.0 / 阅读全文

posted @ 2024-12-22 21:36 Angry_Panda 阅读(404) 评论(0) 推荐(0)

强化学习:很全面的国内外著名强化学习研究小组总结
摘要:原文地址: http://deeprl.neurondance.com/d/154 美国 Stanford:Benjamin Van Roy (摘自 http://deeprl.neurondance.com/d/154) 伯克利:Sergey Levine(论文高产作者)、Pieter Abbel 阅读全文

posted @ 2024-12-22 19:41 Angry_Panda 阅读(309) 评论(0) 推荐(0)

强化学习SQL算法(soft q leanring)中的squash_correction是否存疑?
摘要:SQL算法的官方实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 提两个问题: SQL算法的原始论文中在计算Q loss function的时候建议使用重要性采样,而实际代码中却使用的是均匀采样,同时也没有采样重要性采样的 阅读全文

posted @ 2024-12-22 14:22 Angry_Panda 阅读(41) 评论(0) 推荐(0)

强化学习SQL算法(soft q learning)—— SVGD的实现(Stein Variational Gradient Descent: A General Purpose Bayesian Inference Algorithm)
摘要:代码实现地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning/src/branch/master/softlearning/misc/kernel.py SVGD 是一种高效、灵活的推断方法,尤其适合高维度复杂分布的近似问题。 f 阅读全文

posted @ 2024-12-22 13:28 Angry_Panda 阅读(50) 评论(0) 推荐(0)

强化学习算法中的log_det_jacobian —— 概率分布的仿射变换(Bijector)(续)
摘要:前文: 强化学习算法中的log_det_jacobian —— 概率分布的仿射变换(Bijector) 前文说到概率分布的仿射变换(Bijector)在贝叶斯、变分推断等领域有很重要的作用,但是在强化学习中呢,其实在强化学习中也会用到,但是最为普遍的应用场景其实只是做简单的tanh变换。 在强化学习 阅读全文

posted @ 2024-12-21 18:19 Angry_Panda 阅读(104) 评论(0) 推荐(0)

强化学习算法中的log_det_jacobian —— 概率分布的仿射变换(Bijector)
摘要:关于TensorFlow的probability模块的教程: https://tensorflow.google.cn/probability/examples/A_Tour_of_TensorFlow_Probability?hl=zh-cn 相关: https://colab.research. 阅读全文

posted @ 2024-12-21 16:19 Angry_Panda 阅读(143) 评论(0) 推荐(0)

沈阳直达北京的快速铁路 —— 一路睡到北京 —— “从沈阳到北京,中间一站不停”
摘要:相关: https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9588328155434867865"}&n_type=-1&p_from=-1 阅读全文

posted @ 2024-12-21 10:31 Angry_Panda 阅读(32) 评论(0) 推荐(0)

高斯分布的信息熵的计算公式
摘要:高斯分布微分熵的推导 版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 本文链接:https://blog.csdn.net/raby_gyl/article/details/73477043 阅读全文

posted @ 2024-12-20 23:04 Angry_Panda 阅读(206) 评论(0) 推荐(0)

人工智能:"我们获得的数据已经到头,不会再有更多了" —— OpenAI前首席科学家Ilya Sutskever在全球AI顶会NeurIPS2024上发表领奖演讲
摘要:视频地址: https://www.bilibili.com/video/BV13qBNYqExW/ 【完整演讲视频】OpenAI前首席科学家Ilya Sutskever在全球AI顶会NeurIPS2024上发表领奖演讲,并表示:「我们获得的数据已经到头,不会再有更多了。」 自然界中,体质量和大脑质 阅读全文

posted @ 2024-12-19 12:09 Angry_Panda 阅读(31) 评论(0) 推荐(0)

强化学习训练的关键因素之一:高精度的模拟器 or 高泛化的模拟器(仿真环境)—— 高精度不如高泛化
摘要:相关视频: https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a7c33851d2f0a4e69aa50fae3038d63-sd.mp4 阅读全文

posted @ 2024-12-18 17:09 Angry_Panda 阅读(61) 评论(0) 推荐(0)

新买一个域名:angrypanda.top —— 华为云
摘要:新买域名地址: http://www.angrypanda.top/ 域名管理地址: https://console.huaweicloud.com/ 阅读全文

posted @ 2024-12-18 16:01 Angry_Panda 阅读(32) 评论(0) 推荐(0)

突发奇想:有没有可能搞一个AI工具来自动实现pytorch代码和mindspore代码之间的迁移 —— deap learning时代不使用NVIDIA的替代选择
摘要:最近几年已经不太在意国内的deep learning的框架发展了,尤其是硬件发展,因为我的华为昇腾的使用权限已经过期了,没有了国产硬件使用权限后我也就自然不太关注国内国产AI硬件的事情了,不过最近看到特朗普又要回来了,然后NVIDIA又要搞什么限制了,于是也就又想起谈谈国内AI硬件和deep lea 阅读全文

posted @ 2024-12-18 12:01 Angry_Panda 阅读(41) 评论(0) 推荐(0)

强化学习:softlearning 算法的官方实现 —— 源码阅读list(完成)
摘要:softlearning原始项目: https://github.com/rail-berkeley/softlearning 国内地址: https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 相关: 强化学习:人形机器人 —— soft 阅读全文

posted @ 2024-12-18 08:51 Angry_Panda 阅读(22) 评论(0) 推荐(0)

强化学习:人形机器人 —— soft-q-leanring的官方实现的配置环境
摘要:项目源码地址: https://github.com/rail-berkeley/softlearning 调试这个代码其实没有什么实际意义,这里只是做了个尝试,纯属“恶趣味”。 安装时候的一个重点就是需要安装gcc-9,不能安装过高版本的GCC,否则报错。 mujoco版本为200,地址: htt 阅读全文

posted @ 2024-12-16 13:02 Angry_Panda 阅读(68) 评论(0) 推荐(0)

Nvidia的架构历史,从Maxwell开始
摘要:来源: https://www.cnblogs.com/boydfd/p/18606571 这里给熟悉游戏显卡的同学稍微科普一下Nvidia的架构历史,从Maxwell开始: Maxwell 架构 发布时间:2014年 游戏卡命名:GTX 9xx 系列,如 GTX 970, GTX 980 数据卡命 阅读全文

posted @ 2024-12-15 16:12 Angry_Panda 阅读(231) 评论(0) 推荐(0)

大语言模型:Qwen的架构图
摘要:来源: https://www.cnblogs.com/boydfd/p/18606571 阅读全文

posted @ 2024-12-15 15:59 Angry_Panda 阅读(977) 评论(0) 推荐(0)

如何实现:Windows11开机自动执行python代码
摘要:首先在你的Windows主机上编写你的python代码或python应用: 编写完成后选择该文件的属性配置,然后配置执行方式,并选择python执行,我这里的python命令的地址是: D:\anaconda3\pythonw.exe 为刚刚设置执行应用设置的代码设置快捷方式 在Window11系统 阅读全文

posted @ 2024-12-15 13:54 Angry_Panda 阅读(973) 评论(0) 推荐(0)

问题解决:windows主机开机不插屏幕不能自动进入桌面
摘要:操作系统一般都有这种设定,不论是windows还是Linux系统,那就是主机开机不插屏幕不能自动进入桌面操作系统一般都有这种设定,不论是windows还是Linux系统,那就是主机开机不插屏幕不能自动进入桌面。 如何解决: 给主机插上“屏幕欺骗器” 操作系统在启动的过程中,在进入系统之前会读取连接的 阅读全文

posted @ 2024-12-15 13:26 Angry_Panda 阅读(417) 评论(0) 推荐(0)

如何知道一个大模型在推理和训练时需要多少显存?
摘要:视频地址: https://www.youtube.com/watch?v=Z9eV9mbB6uY 相关地址: https://huggingface.co/spaces/hf-accelerate/model-memory-usage 详细内容: https://techdiylife.githu 阅读全文

posted @ 2024-12-14 17:51 Angry_Panda 阅读(153) 评论(0) 推荐(0)

强化学习:SAC和SQL算法的mujoco模型文件
摘要:SAC和SQL算法的项目地址: https://github.com/rail-berkeley/softlearning SAC和SQL算法的mujoco模型文件地址: https://github.com/rail-berkeley/softlearning/tree/master/models 阅读全文

posted @ 2024-12-14 16:39 Angry_Panda 阅读(92) 评论(0) 推荐(0)

python报错:cymj.pyx:67:5: Exception check on 'c_warning_callback' will always require the GIL to be acquired.
摘要:报错: cymj.pyx:67:5: Exception check on 'c_warning_callback' will always require the GIL to be acquired. 相关: https://github.com/openai/mujoco-py/issues/ 阅读全文

posted @ 2024-12-14 16:15 Angry_Panda 阅读(101) 评论(0) 推荐(0)

强化学习算法:soft q-learning —— 《Reinforcement Learning with Deep Energy-Based Policies》
摘要:相关: https://arxiv.org/pdf/1702.08165 首先,要知道soft-learning是一个很老的算法,其实就是在q-learning的基础上加了个soft变换,然后在探索阶段不使用epsilon-greedy探索,而是使用soft-q作为探索方法,而在训练参数时候使用的u 阅读全文

posted @ 2024-12-14 15:32 Angry_Panda 阅读(90) 评论(0) 推荐(0)

python报错:Missing 'tensorflow.python.training.tracking' in version 2.14.0; cannot load pickled model
摘要:相关: https://github.com/tensorflow/tensorflow/issues/62210 解决方法: 更换TensorFlow版本,安装2.13版本。 TF version 2.13 阅读全文

posted @ 2024-12-14 15:27 Angry_Panda 阅读(69) 评论(0) 推荐(0)

python安装报错:'extras_require' must be a dictionary whose values are strings or lists of strings containing valid project/version requirement specifiers
摘要:相关地址: https://github.com/readthedocs/readthedocs.org/issues/10286 问题: 解决方法: pip install setuptools==65.5.0 阅读全文

posted @ 2024-12-14 14:35 Angry_Panda 阅读(149) 评论(0) 推荐(0)

【转载】我能这样说吗?我有点讨厌强化学习
摘要:相关: https://www.reddit.com/r/learnmachinelearning/comments/1gy86nl/am_i_allowed_to_say_that_i_kinda_hate/ 我能这样说吗?我有点讨厌强化学习 讨论 我所有的机器学习工作经验都集中在监督学习上。我很 阅读全文

posted @ 2024-12-14 12:35 Angry_Panda 阅读(29) 评论(0) 推荐(0)

机器学习在机器人技术中的应用 —— Machine Learning Applications in Robotics
摘要:地址: https://www.wandelbots.com/blog/machine-learning-in-robotics 机器学习在机器人技术中的应用 机器人视觉系统 机器人视觉系统(也称为机器视觉)将传感器和摄像头与机器学习算法结合使用。这些传感器和摄像头采集物理数据,机器学习算法处理这些 阅读全文

posted @ 2024-12-14 12:24 Angry_Panda 阅读(118) 评论(0) 推荐(0)

快速公交系统(Bus Rapid Transit),简称BRT
摘要:相关: 【北京公交】怎样才算一套健全的BRT系统?为何北京的BRT走向沦落?浅谈与介绍快速公交系统及其构成【聊公交-19】 BRT 就是拥有独有路权、专用设施、高效乘降的公交车,因为有这三个特点,因此BRT又不是简单的在公交车系统上的升级,可以说BRT不是公交车但又是公交车,或者说是一种特殊的公交车 阅读全文

posted @ 2024-12-12 11:06 Angry_Panda 阅读(202) 评论(0) 推荐(0)

强化学习(ChatGPT回答):Reward Landscape —— 奖励分布图
摘要:奖励景观(机器学习、强化学习) 在强化学习中,Reward Landscape 指的是奖励函数随着状态和行为的变化所形成的空间结构。它可以帮助理解智能体如何通过探索奖励的分布来优化策略。 翻译: 奖励景观;奖励分布图。 例句: The agent learns to navigate the rew 阅读全文

posted @ 2024-12-11 14:16 Angry_Panda 阅读(85) 评论(0) 推荐(0)

强化学习(人工智能) —— DDPG、TD3、SAC、SQL算法是不是Actor-Critic算法?
摘要:强化学习算法是人工智能领域发展最为强劲的一个分支,但是很多人都将注意力放在了算法模型的发展上而忽略了其基本理论上的一些概念,本文就讨论一下强化学习算法的一些基本概念的界定上。 来源: https://ai.stackexchange.com/questions/39545/why-is-soft-q 阅读全文

posted @ 2024-12-11 12:00 Angry_Panda 阅读(79) 评论(0) 推荐(0)

人工智能(强化学习)—— Why is Soft Q Learning not an Actor Critic method? —— SQL算法为什么不是Actor-Critic算法
摘要:原文: https://ai.stackexchange.com/questions/39545/why-is-soft-q-learning-not-an-actor-critic-method I've been reading these two papers from Haarnoja et 阅读全文

posted @ 2024-12-11 10:51 Angry_Panda 阅读(42) 评论(0) 推荐(0)

ChatGPT回答:机器学习中的 energy-based model 是什么?
摘要:机器学习中的 energy-based model 是什么? 低能量对应高概率,高能量对应低概率。 阅读全文

posted @ 2024-12-11 09:06 Angry_Panda 阅读(41) 评论(0) 推荐(0)

辽宁省:沈阳市和大连市的2025年城市居民医保缴费(个人缴费方式)
摘要:参考: 大连理工大学——延期博士、结业博士——如何在离校后个人缴纳医疗保险 大连的门诊医保——在大连门诊就医可以使用医保了 【转载】辽宁省大连市“某高校”在校大学生医保缴费方式 沈阳市城市居民参保,见: 大连理工大学——延期博士、结业博士——如何在离校后个人缴纳医疗保险 大连市城市居民参保,见: 【 阅读全文

posted @ 2024-12-10 10:06 Angry_Panda 阅读(84) 评论(0) 推荐(0)

强化学习算法DDPG and SAC 讲解视频 —— L5 DDPG and SAC (Foundations of Deep RL Series)
摘要:地址: https://www.youtube.com/watch?v=pg-lKy7JIRk 阅读全文

posted @ 2024-12-09 15:49 Angry_Panda 阅读(33) 评论(0) 推荐(0)

强化学习:基于课程学习的强化学习算法 —— 《Combining Reward Shaping and Curriculum Learning for Training Agents with High Dimensional Continuous Action Spaces》
摘要:地址: https://www.tesble.com/10.1109/ICTC.2018.8539438 我们在四种不同的奖励函数和终止条件下对行走者进行了训练,以评估结合奖励塑形和课程学习的效果。具体如下。 1)距离稀疏奖励:行走者到达目标时给予1个奖励,否则为0。 2)距离课程奖励:给予行走者的 阅读全文

posted @ 2024-12-09 14:38 Angry_Panda 阅读(112) 评论(0) 推荐(0)

副业创收:代码编程、课程辅导、论文辅导、作业辅导 —— https://www.belief1008.com/
摘要:登录地址: https://www.belief1008.com/ 阅读全文

posted @ 2024-12-09 13:52 Angry_Panda 阅读(24) 评论(0) 推荐(0)

中美高等教育的对比分析 —— 精英教育和平民教育的巅峰对决
摘要:这里谈谈立场不正确的问题,那就是中美高教的分析。 可以说中国的教育是平民教育,而美国的教育是精英教育,但是在我看来其实并没有什么完全意义上的平民教育和精英教育,一切都是相对而言的。 中国的教育是公立教育,而美国的教育是私立教育,因此美国的教育成了有钱人才可以参与的游戏,而中国的教育呢,其实随着中国经 阅读全文

posted @ 2024-12-07 09:50 Angry_Panda 阅读(197) 评论(0) 推荐(0)

人形机器人 —— 强化学习:站立和行走的奖励函数设置
摘要:相关: https://docs.zeroth.bot/ml/rl Reward Shaping General Configuration for Standing A general configuration for standing involves ensuring that the or 阅读全文

posted @ 2024-12-06 23:17 Angry_Panda 阅读(535) 评论(0) 推荐(0)

人形机器人 —— 示教学习 —— 远程操作系统(Teleoperation System)
摘要:说下个人对这部分的理解,这个就是说要机器人去在人类的控制下学习动作,或者说在人类的遥控下进行操作,然后记录下这部分操作的数据,然后再用这部分收集到的数据来对机器人进行训练。 其他相关: https://github.com/kscalelabs/teleop 阅读全文

posted @ 2024-12-06 19:17 Angry_Panda 阅读(51) 评论(0) 推荐(0)

如何画神经网络结构示意图
摘要:我理想中的网络结构示意图: FCN-8 VCG-16 工具介绍: tikz_cnn 地址: https://github.com/jettan/tikz_cnn PlotNeuralNet https://github.com/HarisIqbal88/PlotNeuralNet draw_conv 阅读全文

posted @ 2024-12-06 16:11 Angry_Panda 阅读(118) 评论(0) 推荐(0)

大语言模型 —— 使用RAG工具Anything LLM䢎本地部署AI大模型投喂数据,创建本地私有AI知识库
摘要:相关: https://www.youtube.com/watch?v=77990wI3LZk https://anythingllm.com/ https://ollama.com/ 阅读全文

posted @ 2024-12-06 13:57 Angry_Panda 阅读(665) 评论(0) 推荐(0)

读论文——《基于知识辅助深度强化学习的巡飞弹组动态突防决策》
摘要:地址: http://www.co-journal.com/CN/rich_html/10.12382/bgxb.2023.0827 利用领域知识、专家知识等先验知识对巡飞弹避障模型进行探索引导,能够使算法快速学会基础规则与策略,降低算法在无效状态空间中的探索时间。模仿学习是其中最为行之有效的引导技 阅读全文

posted @ 2024-12-06 12:14 Angry_Panda 阅读(69) 评论(0) 推荐(0)

论文 —— 《基于分层强化学习的无人机空战多维决策》
摘要:论文 —— 《基于分层强化学习的无人机空战多维决策》地址: http://www.co-journal.com/CN/10.12382/bgxb.2022.0711 这个论文主要是看如何处理所谓的SAC强化学习算法在军事上的应用和其中提出的元策略算法 + option-critic分层强化学习的组合,不过这个论文看完感觉不知道是如何做的,其中的描述也 阅读全文

posted @ 2024-12-06 10:31 Angry_Panda 阅读(49) 评论(0) 推荐(0)

GPU运行模式下(SIMD)—— 为什么在GPU下分支运算的效率极为低下 —— What's up with my branch on GPU?
摘要:相关: https://aschrein.github.io/jekyll/update/2019/06/13/whatsup-with-my-branches-on-gpu.html#tldr 具体内容参照原文: https://aschrein.github.io/jekyll/update/2 阅读全文

posted @ 2024-12-06 10:25 Angry_Panda 阅读(33) 评论(0) 推荐(0)

人形机器人 —— openVLA
摘要:视频: https://www.youtube.com/watch?v=YM9DJ8-tU78&list=PLXgxz3qIE6AmcMV9qzsJz1kVAU792LgE3&index=1 相关: https://openvla.github.io/ https://arxiv.org/abs/2 阅读全文

posted @ 2024-12-06 10:12 Angry_Panda 阅读(150) 评论(0) 推荐(0)

人形机器人 —— web环境下的mujoco可视化
摘要:地址: https://zalo.github.io/mujoco_wasm/ 阅读全文

posted @ 2024-12-05 22:59 Angry_Panda 阅读(350) 评论(0) 推荐(0)

为什么不推荐使用jax ( jax vs pytorch)—— google推出jax后为什么迟迟没有得到业界接受——jax是否会重蹈TensorFlow的覆辙
摘要:在2017年后,Google的TensorFlow在与Facebook的pytorch的竞争中落败,于是为了重夺业内位置,Google在将开放重点从TensorFlow转为新开发一种新的工具框架,那就是jax。虽然在某种意义上来说Google已经放弃了TensorFlow,但是在Google内部依然 阅读全文

posted @ 2024-12-05 12:05 Angry_Panda 阅读(1285) 评论(0) 推荐(0)

人形机器人 —— MuJoCo's GUI —— 通过命令调用mujoco的GUI界面
摘要:The command above loads MuJoCo’s GUI, which allows you to simulate the model, manually specify joints, and save keyframes. 命令: python3 -m mujoco.viewe 阅读全文

posted @ 2024-12-04 23:46 Angry_Panda 阅读(255) 评论(0) 推荐(0)

python报错:wandb报错 —— wandb.Video requires moviepy when passing raw data. Install with "pip install wandb[media]"
摘要:相关: https://github.com/wandb/wandb/issues/8971 解决方法: pip install -U moviepy==1.0.3 阅读全文

posted @ 2024-12-04 23:40 Angry_Panda 阅读(117) 评论(0) 推荐(0)

pygame:python编写的坦克大战游戏(多年前网上找到的资源,来源已不可考)
摘要:游戏项目的源码地址: https://openi.pcl.ac.cn/devilmaycry812839668/Tank_Game_1990 pygame:python编写的坦克大战游戏(多年前网上找到的资源,来源已不可考),本人小的时候最喜欢玩的就是小霸王学习机上的黄卡游戏,而在这些72合一的黄卡 阅读全文

posted @ 2024-12-04 14:05 Angry_Panda 阅读(130) 评论(0) 推荐(0)

人形机器人:从零开发人形机器人 —— 某开源的个人DIY版本(2500元DIY世界最小,开源端到端人形机器人)—— 人形机器人走向科普化
摘要:介绍视频: https://www.bilibili.com/video/BV1in6PY7E1B 项目地址: https://docs.zeroth.bot/ 项目的开源代码地址: https://github.com/zeroth-robotics 机器人外壳: 阅读全文

posted @ 2024-12-04 13:10 Angry_Panda 阅读(887) 评论(0) 推荐(0)

人形机器人 —— IsaacSim
摘要:标题建议,例如:英伟达 Isaac Sim仿真平台体验 运行的商品名称 产品名称及版本: Isaac Sim 版本信息及相关配置: 运行的过程记录 【GPU加速仿真】 请描述您在使用Isaac Sim进行GPU加速仿真的具体操作步骤和过程。 可以创建一些简单的任务,例如: 创建一个简单的多球体下落场 阅读全文

posted @ 2024-12-04 12:22 Angry_Panda 阅读(188) 评论(0) 推荐(0)

人形机器人 —— IsaacROS
摘要:标题建议,例如:英伟达 Isaac ROS 产品体验 运行的商品名称 产品名称: Isaac ROS 版本信息及相关配置: 运行的过程记录 【GPU加速仿真】 请描述您在使用Isaac ROS进行GPU加速不同任务的具体操作步骤和过程,如之前有使用ROS/ROS2框架的经验,可以做一个对比记录。 【 阅读全文

posted @ 2024-12-04 12:20 Angry_Panda 阅读(92) 评论(0) 推荐(0)

人形机器人 —— IsaacManipulator
摘要:标题建议,例如:英伟达 Isaac Manipulator产品体验 运行的商品名称 产品名称及版本: Isaac Manipulator 版本信息及相关配置: 运行的过程记录 【GPU加速任务】 请描述您在使用Isaac Manipulator时,调用cuMotion加速库来进行机器人运动规划和轨迹 阅读全文

posted @ 2024-12-04 12:12 Angry_Panda 阅读(102) 评论(0) 推荐(0)

尹锡悦围攻国会瘫痪执政党和在野党是不是一种政变 ——“袁世凯围堵国会”
摘要:回忆下历史: 关键词: “袁世凯围堵国会” 活久见,韩国从中国独立之后经历了日本殖民和美国殖民,虽然现在的韩国依旧在美国的殖民之下,但是并没有影响韩国国民的生活,而且随着美国资金的注入加上韩国财阀的产业发展反而使韩国进入到了发达国家队伍,但是这几十年来韩国倒是频繁发生政变。没想到,就在此时此刻,韩国 阅读全文

posted @ 2024-12-04 10:07 Angry_Panda 阅读(26) 评论(0) 推荐(0)

赚些外快:(RL方向)承接国内985/211高校大论文、小论文撰写,课程设计,考试辅导,国际海外top高校、常青藤高校的作业,程序设计,小project,小组作业
摘要:总会遇到有国内的富裕家庭的孩子去海外留学后不会写代码,完不成作业的,搞不定论文的,等等吧,想想这货还挺赚钱,于是考虑单独把这个活当做一门副业,哈哈哈!!! 这些年除了海外留学的还有不少国内的各所大学的找来的,有的是看到blogs上的文章感觉能干的了的,也有朋友和领导给推过来的活,想想也是有意思,计算 阅读全文

posted @ 2024-12-03 12:22 Angry_Panda 阅读(26) 评论(0) 推荐(0)

人形机器人——NVIDIA公司(isaac sim)Sim to Real with Isaac Sim’s new features
摘要:本文主要介绍NVIDIA公司推出的人形机器人仿真平台Isaac sim的历史和技术特征,内容源自NVIDIA公司的视频及PPT内容: 阅读全文

posted @ 2024-12-03 08:13 Angry_Panda 阅读(93) 评论(0) 推荐(0)

具身智能中的sim2real的gap是什么?
摘要:● Sim2Real gap - The domain gap between simulated data and real world data ● Models trained in simulation without proper configurations fail in the re 阅读全文

posted @ 2024-12-02 20:39 Angry_Panda 阅读(411) 评论(0) 推荐(0)

使用联邦学习法训练强化学习算法以实现对抗攻击性:读论文——小型微型计算机系统(中文CCF B)《面向深度强化学习的鲁棒性增强方法》
摘要:论文地址: http://xwxt.sict.ac.cn/CN/Y2024/V45/I7/1552 PS: 这个学习率有些奇怪,用数据量占一次优化的总数据量的大小作为学习率,这或许也是真的有独创性的操作了,不过这么做是否真的可行呢,或者这只是纸上谈兵呢。 PS: 这里的状态转移概率怎么和策略的动作选 阅读全文

posted @ 2024-12-02 18:38 Angry_Panda 阅读(337) 评论(2) 推荐(0)

人形机器人——具身智能——需要完成的几种功能——有哪几种能力(功能)所组成
摘要:相关: https://blogs.nvidia.com/blog/robot-learning-humanoid-development/ 根据NVIDIA公司的Groot项目给出的定义,我们可以知道人形机器人在软件层面上需要具备或者说需要完成的几种功能: GR00T-Gen for buildi 阅读全文

posted @ 2024-12-02 18:27 Angry_Panda 阅读(52) 评论(0) 推荐(0)

人形机器人—圈子里的鄙视链
摘要:title: 人形机器人—圈子里的鄙视链 description: #多个标签请使用英文逗号分隔或使用数组语法 tags: 杂谈 #多个分类请使用英文逗号分隔或使用数组语法,暂不支持多级分类 相关: 谈谈「机器人创业」圈子里的鄙视链丨智涌分析 “搞软件的,鄙视搞硬件的,搞大模型的,看不起强化学习的” 阅读全文

posted @ 2024-12-02 12:22 Angry_Panda 阅读(52) 评论(0) 推荐(0)

导航