2024 年 12月随笔档案 - Angry_Panda

人形机器人 —— 78款国产人形机器人全纪录

摘要：相关： https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_8944599187128112347"}&n_type=1&p_from=4 具体见原文：茶派科技发布：78款国产人形机器人全纪录阅读全文

posted @ 2024-12-31 15:19 Angry_Panda 阅读(41) 评论(0) 推荐(0)

人形机器人的目前发展水平靠谱吗？

摘要：相关： https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9723466264962965374"}&n_type=-1&p_from=-1 自己是搞AI的，而且是人形机器人的下属领域，所以就没事会去看看相阅读全文

posted @ 2024-12-31 15:17 Angry_Panda 阅读(34) 评论(0) 推荐(0)

Deepseek V3 —— 6850亿参数混合专家(MoE)架构开源大模型！Deepseek V3全方位客观评测文档处理、逻辑推理、算法编程等多维度的真实能力水平

摘要：地址： https://www.youtube.com/watch?v=BnoMTeKxwBQ 🚀当Deepseek v3遇上贪吃蛇：一个简单游戏实现背后，揭示最新开源大模型在复杂编程场景下的短板与不足 🚀本期视频我们详细测试了Deepseek最新发布的开源大模型Deepseek V3的综合能力阅读全文

posted @ 2024-12-31 09:38 Angry_Panda 阅读(413) 评论(0) 推荐(0)

英特尔酷睿 Ultra 9 285K 与 14900K/KS：哪个更好？

摘要：原地址： https://www.corsair.com/us/en/explorer/gamer/gaming-pcs/intel-core-ultra-9-285k-vs-14900kks-which-is-better/ 个人的观点： 14900k 和 14900ks CPU在近一年来报出了多阅读全文

posted @ 2024-12-30 21:32 Angry_Panda 阅读(6472) 评论(0) 推荐(1)

人形机器人 —— 具身智能大模型（强化学习）—— 灵初智能发布首个端到端具身模型Psi R0

摘要：相关： https://ai-bot.cn/psi-r0/ 灵初智能发布首个基于强化学习（RL）的端到端具身模型Psi R0。该模型支持双灵巧手协同进行复杂操作，将多个技能串联混训，生成具有推理能力的智能体，从而完成并闭环长程灵巧操作任务。并且，Psi R0还可以实现跨物品、跨场景级别的泛化。阅读全文

posted @ 2024-12-30 20:52 Angry_Panda 阅读(135) 评论(0) 推荐(0)

强化学习算法环境报错：python报错 —— gym DuplicatedInput doesn't exist

摘要：运行强化学习pcl算法，报错，原因是gym版本过高，gym停止维护版本为0.26版本，降低版本到0.18，运行成功。 pcl算法的官方地址： https://github.com/tensorflow/models/blob/master/research/pcl_rl 阅读全文

posted @ 2024-12-30 20:49 Angry_Panda 阅读(48) 评论(0) 推荐(0)

容器：Docker存储——绑定挂载和tmpfs的使用（ --mount 和 --tmpfs 和 -v ）

摘要：相关： Docker存储（三）绑定挂载和tmpfs的使用 docker-tmpfs挂载 docker中tmpfs占用磁盘 Docker 基础知识 - 使用 tmpfs 挂载(tmpfs mounts)管理应用程序数据【docker常用命令系列】docker run示例选项用法大全权威详解 tmpf 阅读全文

posted @ 2024-12-28 16:23 Angry_Panda 阅读(191) 评论(0) 推荐(0)

强化学习算法：soft actor-critic （SAC）—— SAC中的alpha_losse是什么？

摘要：官方实现地址： https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 在SAC算法的官方实现中有一个论文中没有介绍的部分，这就是SAC中的alpha_losse，在SAC论文中alpha是以超参数的形式存在的，但是在论文作者发布的具体实现阅读全文

posted @ 2024-12-28 13:14 Angry_Panda 阅读(203) 评论(0) 推荐(0)

强化学习算法：soft actor-critic （SAC）—— 官方发布的核心代码

摘要：完整的官方代码地址如下： https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 核心代码实现：点击查看代码 from copy import deepcopy from collections import OrderedDict fr 阅读全文

posted @ 2024-12-28 12:44 Angry_Panda 阅读(301) 评论(0) 推荐(0)

ubuntu22.04 修改电源模式 —— 性能模式、节能模式、均衡模式 —— 电源选项设置

摘要：本文只讲命令行模式下的设置：设置为性能模式： powerprofilesctl set performance 设置为均衡模式： powerprofilesctl set balanced 设置为节能模式： powerprofilesctl set power-saver PS: 性能模式就是CP 阅读全文

posted @ 2024-12-25 17:32 Angry_Panda 阅读(2599) 评论(0) 推荐(0)

使用docker镜像运行迅雷的pcdn——迅雷容器魔方

摘要：相关：容器魔方安装和升级教程一、什么是网心云容器版产品「容器魔方」？「容器魔方」由网心云推出的一款docker容器镜像软件，通过简单安装后即可快速加入网心云边缘云计算生态网络，为网心科技星域云贡献带宽和存储资源，用户根据每日的贡献量可获得相应的现金收益回报。网心科技星域云通过先进的边缘编排技阅读全文

posted @ 2024-12-25 12:24 Angry_Panda 阅读(1023) 评论(0) 推荐(0)

路易吉·曼吉奥内是否是英雄？

摘要：相关：轰动美国！高校精英枪杀CEO，却被一些人视为“英雄”，游街照疯狂出圈阅读全文

posted @ 2024-12-25 11:20 Angry_Panda 阅读(86) 评论(0) 推荐(0)

行程码和天网如何从公器成为了私人工具 —— “贺某阳是如何利用天网系统查找小谢的去向的”—— 公器私用才是最大的恶

摘要：相关： https://www.douyin.com/video/7283392275898469692 https://baijiahao.baidu.com/s?id=1817600784333238762&wfr=spider&for=pc 公器私用是对社会危险极大的一种行为，如何在没有相关规阅读全文

posted @ 2024-12-25 11:13 Angry_Panda 阅读(195) 评论(0) 推荐(0)

机器学习中的渐进最优化是指什么 —— （强化学习为例）

摘要：机器学习理论中的渐进最优化是指无限时间运行下算法最终收敛到最优值，而在强化学习中这个无限时间下的运行是为了保证所有状态空间均可以被访问无限次，从而实现无限次的优化。阅读全文

posted @ 2024-12-25 09:25 Angry_Panda 阅读(49) 评论(0) 推荐(0)

区块链技术已经衰落了吗？（区块链已die）

摘要：区块链技术已经好多年没有听到有人提了，不过比特币却一直是不是的又新闻出现，当然国内已经把比特币交易归入到了不合法的地位了。区块链技术是国家战略的技术，但是这个技术说实话确实不是很高深，或者说蛮easy的，找几个C++技术好的人就完全可以从零开始手撸一个新版比特币出来，但是之所以区块链被归入到国家战略阅读全文

posted @ 2024-12-24 16:40 Angry_Panda 阅读(1196) 评论(2) 推荐(9)

工业机器人仿真工具 —— Drake

摘要：Drake 是一个用于机器人系统的模型驱动设计和验证的开源项目。它由麻省理工学院（MIT）开发，旨在为机器人研究人员和工程师提供一个强大的工具集，用于模拟、分析和验证机器人系统的行为。Drake 支持多种机器人应用，包括但不限于运动规划、控制、感知和仿真。项目源码地址： https://githu 阅读全文

posted @ 2024-12-22 22:00 Angry_Panda 阅读(274) 评论(0) 推荐(0)

强化学习：使用自动控制方法PID来解决强化学习问题中的cartpole问题（小车平衡杆问题）

摘要：网上找到的一个实现：地址： https://gist.github.com/HenryJia/23db12d61546054aa43f8dc587d9dc2c 稍微修改后的代码： import numpy as np import gym def sigmoid(x): return 1.0 / 阅读全文

posted @ 2024-12-22 21:36 Angry_Panda 阅读(404) 评论(0) 推荐(0)

强化学习：很全面的国内外著名强化学习研究小组总结

摘要：原文地址： http://deeprl.neurondance.com/d/154 美国 Stanford：Benjamin Van Roy （摘自 http://deeprl.neurondance.com/d/154）伯克利：Sergey Levine(论文高产作者)、Pieter Abbel 阅读全文

posted @ 2024-12-22 19:41 Angry_Panda 阅读(309) 评论(0) 推荐(0)

强化学习SQL算法（soft q leanring）中的squash_correction是否存疑？

摘要：SQL算法的官方实现地址： https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 提两个问题: SQL算法的原始论文中在计算Q loss function的时候建议使用重要性采样，而实际代码中却使用的是均匀采样，同时也没有采样重要性采样的阅读全文

posted @ 2024-12-22 14:22 Angry_Panda 阅读(41) 评论(0) 推荐(0)

强化学习SQL算法（soft q learning）—— SVGD的实现（Stein Variational Gradient Descent: A General Purpose Bayesian Inference Algorithm）

摘要：代码实现地址： https://openi.pcl.ac.cn/devilmaycry812839668/softlearning/src/branch/master/softlearning/misc/kernel.py SVGD 是一种高效、灵活的推断方法，尤其适合高维度复杂分布的近似问题。 f 阅读全文

posted @ 2024-12-22 13:28 Angry_Panda 阅读(50) 评论(0) 推荐(0)

强化学习算法中的log_det_jacobian —— 概率分布的仿射变换（Bijector）（续）

摘要：前文：强化学习算法中的log_det_jacobian —— 概率分布的仿射变换（Bijector）前文说到概率分布的仿射变换（Bijector）在贝叶斯、变分推断等领域有很重要的作用，但是在强化学习中呢，其实在强化学习中也会用到，但是最为普遍的应用场景其实只是做简单的tanh变换。在强化学习阅读全文

posted @ 2024-12-21 18:19 Angry_Panda 阅读(104) 评论(0) 推荐(0)

强化学习算法中的log_det_jacobian —— 概率分布的仿射变换（Bijector）

摘要：关于TensorFlow的probability模块的教程： https://tensorflow.google.cn/probability/examples/A_Tour_of_TensorFlow_Probability?hl=zh-cn 相关： https://colab.research. 阅读全文

posted @ 2024-12-21 16:19 Angry_Panda 阅读(143) 评论(0) 推荐(0)

沈阳直达北京的快速铁路 —— 一路睡到北京 —— “从沈阳到北京，中间一站不停”

摘要：相关： https://mbd.baidu.com/newspage/data/landingsuper?context={"nid"%3A"news_9588328155434867865"}&n_type=-1&p_from=-1 阅读全文

posted @ 2024-12-21 10:31 Angry_Panda 阅读(32) 评论(0) 推荐(0)

高斯分布的信息熵的计算公式

posted @ 2024-12-20 23:04 Angry_Panda 阅读(206) 评论(0) 推荐(0)

人工智能："我们获得的数据已经到头，不会再有更多了" —— OpenAI前首席科学家Ilya Sutskever在全球AI顶会NeurIPS2024上发表领奖演讲

摘要：视频地址： https://www.bilibili.com/video/BV13qBNYqExW/ 【完整演讲视频】OpenAI前首席科学家Ilya Sutskever在全球AI顶会NeurIPS2024上发表领奖演讲，并表示：「我们获得的数据已经到头，不会再有更多了。」自然界中，体质量和大脑质阅读全文

posted @ 2024-12-19 12:09 Angry_Panda 阅读(31) 评论(0) 推荐(0)

强化学习训练的关键因素之一：高精度的模拟器 or 高泛化的模拟器（仿真环境）—— 高精度不如高泛化

摘要：相关视频： https://bizwebcast.smarket.com.cn/b975d6d9969a42cba9626adb7669676b/2a1fc2d76a65403cb76f99acd5b025da-8a7c33851d2f0a4e69aa50fae3038d63-sd.mp4 阅读全文

posted @ 2024-12-18 17:09 Angry_Panda 阅读(61) 评论(0) 推荐(0)

新买一个域名：angrypanda.top —— 华为云

摘要：新买域名地址： http://www.angrypanda.top/ 域名管理地址： https://console.huaweicloud.com/ 阅读全文

posted @ 2024-12-18 16:01 Angry_Panda 阅读(32) 评论(0) 推荐(0)

突发奇想：有没有可能搞一个AI工具来自动实现pytorch代码和mindspore代码之间的迁移 —— deap learning时代不使用NVIDIA的替代选择

摘要：最近几年已经不太在意国内的deep learning的框架发展了，尤其是硬件发展，因为我的华为昇腾的使用权限已经过期了，没有了国产硬件使用权限后我也就自然不太关注国内国产AI硬件的事情了，不过最近看到特朗普又要回来了，然后NVIDIA又要搞什么限制了，于是也就又想起谈谈国内AI硬件和deep lea 阅读全文

posted @ 2024-12-18 12:01 Angry_Panda 阅读(41) 评论(0) 推荐(0)

强化学习：softlearning 算法的官方实现 —— 源码阅读list（完成）

摘要：softlearning原始项目： https://github.com/rail-berkeley/softlearning 国内地址： https://openi.pcl.ac.cn/devilmaycry812839668/softlearning 相关：强化学习：人形机器人 —— soft 阅读全文

posted @ 2024-12-18 08:51 Angry_Panda 阅读(22) 评论(0) 推荐(0)

强化学习：人形机器人 —— soft-q-leanring的官方实现的配置环境

摘要：项目源码地址： https://github.com/rail-berkeley/softlearning 调试这个代码其实没有什么实际意义，这里只是做了个尝试，纯属“恶趣味”。安装时候的一个重点就是需要安装gcc-9，不能安装过高版本的GCC，否则报错。 mujoco版本为200，地址： htt 阅读全文

posted @ 2024-12-16 13:02 Angry_Panda 阅读(68) 评论(0) 推荐(0)

Nvidia的架构历史，从Maxwell开始

摘要：来源： https://www.cnblogs.com/boydfd/p/18606571 这里给熟悉游戏显卡的同学稍微科普一下Nvidia的架构历史，从Maxwell开始： Maxwell 架构发布时间：2014年游戏卡命名：GTX 9xx 系列，如 GTX 970, GTX 980 数据卡命阅读全文

posted @ 2024-12-15 16:12 Angry_Panda 阅读(231) 评论(0) 推荐(0)

大语言模型：Qwen的架构图

摘要：来源： https://www.cnblogs.com/boydfd/p/18606571 阅读全文

posted @ 2024-12-15 15:59 Angry_Panda 阅读(977) 评论(0) 推荐(0)

如何实现：Windows11开机自动执行python代码

摘要：首先在你的Windows主机上编写你的python代码或python应用：编写完成后选择该文件的属性配置，然后配置执行方式，并选择python执行，我这里的python命令的地址是： D:\anaconda3\pythonw.exe 为刚刚设置执行应用设置的代码设置快捷方式在Window11系统阅读全文

posted @ 2024-12-15 13:54 Angry_Panda 阅读(973) 评论(0) 推荐(0)

问题解决：windows主机开机不插屏幕不能自动进入桌面

摘要：操作系统一般都有这种设定，不论是windows还是Linux系统，那就是主机开机不插屏幕不能自动进入桌面操作系统一般都有这种设定，不论是windows还是Linux系统，那就是主机开机不插屏幕不能自动进入桌面。如何解决：给主机插上“屏幕欺骗器” 操作系统在启动的过程中，在进入系统之前会读取连接的阅读全文

posted @ 2024-12-15 13:26 Angry_Panda 阅读(417) 评论(0) 推荐(0)

如何知道一个大模型在推理和训练时需要多少显存？

摘要：视频地址： https://www.youtube.com/watch?v=Z9eV9mbB6uY 相关地址： https://huggingface.co/spaces/hf-accelerate/model-memory-usage 详细内容： https://techdiylife.githu 阅读全文

posted @ 2024-12-14 17:51 Angry_Panda 阅读(153) 评论(0) 推荐(0)

强化学习：SAC和SQL算法的mujoco模型文件

摘要：SAC和SQL算法的项目地址： https://github.com/rail-berkeley/softlearning SAC和SQL算法的mujoco模型文件地址: https://github.com/rail-berkeley/softlearning/tree/master/models 阅读全文

posted @ 2024-12-14 16:39 Angry_Panda 阅读(92) 评论(0) 推荐(0)

python报错：cymj.pyx:67:5: Exception check on 'c_warning_callback' will always require the GIL to be acquired.

摘要：报错： cymj.pyx:67:5: Exception check on 'c_warning_callback' will always require the GIL to be acquired. 相关： https://github.com/openai/mujoco-py/issues/ 阅读全文

posted @ 2024-12-14 16:15 Angry_Panda 阅读(101) 评论(0) 推荐(0)

强化学习算法：soft q-learning —— 《Reinforcement Learning with Deep Energy-Based Policies》

摘要：相关： https://arxiv.org/pdf/1702.08165 首先，要知道soft-learning是一个很老的算法，其实就是在q-learning的基础上加了个soft变换，然后在探索阶段不使用epsilon-greedy探索，而是使用soft-q作为探索方法，而在训练参数时候使用的u 阅读全文

posted @ 2024-12-14 15:32 Angry_Panda 阅读(90) 评论(0) 推荐(0)

python报错：Missing 'tensorflow.python.training.tracking' in version 2.14.0; cannot load pickled model

摘要：相关： https://github.com/tensorflow/tensorflow/issues/62210 解决方法：更换TensorFlow版本，安装2.13版本。 TF version 2.13 阅读全文

posted @ 2024-12-14 15:27 Angry_Panda 阅读(69) 评论(0) 推荐(0)

python安装报错：'extras_require' must be a dictionary whose values are strings or lists of strings containing valid project/version requirement specifiers

摘要：相关地址： https://github.com/readthedocs/readthedocs.org/issues/10286 问题：解决方法： pip install setuptools==65.5.0 阅读全文

posted @ 2024-12-14 14:35 Angry_Panda 阅读(149) 评论(0) 推荐(0)

【转载】我能这样说吗？我有点讨厌强化学习

摘要：相关： https://www.reddit.com/r/learnmachinelearning/comments/1gy86nl/am_i_allowed_to_say_that_i_kinda_hate/ 我能这样说吗？我有点讨厌强化学习讨论我所有的机器学习工作经验都集中在监督学习上。我很阅读全文

posted @ 2024-12-14 12:35 Angry_Panda 阅读(29) 评论(0) 推荐(0)

机器学习在机器人技术中的应用 —— Machine Learning Applications in Robotics

摘要：地址： https://www.wandelbots.com/blog/machine-learning-in-robotics 机器学习在机器人技术中的应用机器人视觉系统机器人视觉系统（也称为机器视觉）将传感器和摄像头与机器学习算法结合使用。这些传感器和摄像头采集物理数据，机器学习算法处理这些阅读全文

posted @ 2024-12-14 12:24 Angry_Panda 阅读(118) 评论(0) 推荐(0)

快速公交系统（Bus Rapid Transit），简称BRT

摘要：相关：【北京公交】怎样才算一套健全的BRT系统？为何北京的BRT走向沦落？浅谈与介绍快速公交系统及其构成【聊公交-19】 BRT 就是拥有独有路权、专用设施、高效乘降的公交车，因为有这三个特点，因此BRT又不是简单的在公交车系统上的升级，可以说BRT不是公交车但又是公交车，或者说是一种特殊的公交车阅读全文

posted @ 2024-12-12 11:06 Angry_Panda 阅读(202) 评论(0) 推荐(0)

强化学习（ChatGPT回答）：Reward Landscape —— 奖励分布图

摘要：奖励景观（机器学习、强化学习）在强化学习中，Reward Landscape 指的是奖励函数随着状态和行为的变化所形成的空间结构。它可以帮助理解智能体如何通过探索奖励的分布来优化策略。翻译：奖励景观；奖励分布图。例句： The agent learns to navigate the rew 阅读全文

posted @ 2024-12-11 14:16 Angry_Panda 阅读(85) 评论(0) 推荐(0)

强化学习(人工智能) —— DDPG、TD3、SAC、SQL算法是不是Actor-Critic算法？

摘要：强化学习算法是人工智能领域发展最为强劲的一个分支，但是很多人都将注意力放在了算法模型的发展上而忽略了其基本理论上的一些概念，本文就讨论一下强化学习算法的一些基本概念的界定上。来源： https://ai.stackexchange.com/questions/39545/why-is-soft-q 阅读全文

posted @ 2024-12-11 12:00 Angry_Panda 阅读(79) 评论(0) 推荐(0)

人工智能（强化学习）—— Why is Soft Q Learning not an Actor Critic method? —— SQL算法为什么不是Actor-Critic算法

摘要：原文： https://ai.stackexchange.com/questions/39545/why-is-soft-q-learning-not-an-actor-critic-method I've been reading these two papers from Haarnoja et 阅读全文

posted @ 2024-12-11 10:51 Angry_Panda 阅读(42) 评论(0) 推荐(0)

ChatGPT回答：机器学习中的 energy-based model 是什么?

摘要：机器学习中的 energy-based model 是什么？低能量对应高概率，高能量对应低概率。阅读全文

posted @ 2024-12-11 09:06 Angry_Panda 阅读(41) 评论(0) 推荐(0)

辽宁省：沈阳市和大连市的2025年城市居民医保缴费（个人缴费方式）

摘要：参考：大连理工大学——延期博士、结业博士——如何在离校后个人缴纳医疗保险大连的门诊医保——在大连门诊就医可以使用医保了【转载】辽宁省大连市“某高校”在校大学生医保缴费方式沈阳市城市居民参保，见：大连理工大学——延期博士、结业博士——如何在离校后个人缴纳医疗保险大连市城市居民参保，见：【阅读全文

posted @ 2024-12-10 10:06 Angry_Panda 阅读(84) 评论(0) 推荐(0)

强化学习算法DDPG and SAC 讲解视频 —— L5 DDPG and SAC (Foundations of Deep RL Series)

摘要：地址： https://www.youtube.com/watch?v=pg-lKy7JIRk 阅读全文

posted @ 2024-12-09 15:49 Angry_Panda 阅读(33) 评论(0) 推荐(0)

强化学习：基于课程学习的强化学习算法 —— 《Combining Reward Shaping and Curriculum Learning for Training Agents with High Dimensional Continuous Action Spaces》

摘要：地址： https://www.tesble.com/10.1109/ICTC.2018.8539438 我们在四种不同的奖励函数和终止条件下对行走者进行了训练，以评估结合奖励塑形和课程学习的效果。具体如下。 1）距离稀疏奖励：行走者到达目标时给予1个奖励，否则为0。 2）距离课程奖励：给予行走者的阅读全文

posted @ 2024-12-09 14:38 Angry_Panda 阅读(112) 评论(0) 推荐(0)

副业创收：代码编程、课程辅导、论文辅导、作业辅导 —— https://www.belief1008.com/

摘要：登录地址： https://www.belief1008.com/ 阅读全文

posted @ 2024-12-09 13:52 Angry_Panda 阅读(24) 评论(0) 推荐(0)

中美高等教育的对比分析 —— 精英教育和平民教育的巅峰对决

摘要：这里谈谈立场不正确的问题，那就是中美高教的分析。可以说中国的教育是平民教育，而美国的教育是精英教育，但是在我看来其实并没有什么完全意义上的平民教育和精英教育，一切都是相对而言的。中国的教育是公立教育，而美国的教育是私立教育，因此美国的教育成了有钱人才可以参与的游戏，而中国的教育呢，其实随着中国经阅读全文

posted @ 2024-12-07 09:50 Angry_Panda 阅读(197) 评论(0) 推荐(0)

人形机器人 —— 强化学习：站立和行走的奖励函数设置

摘要：相关： https://docs.zeroth.bot/ml/rl Reward Shaping General Configuration for Standing A general configuration for standing involves ensuring that the or 阅读全文

posted @ 2024-12-06 23:17 Angry_Panda 阅读(535) 评论(0) 推荐(0)

人形机器人 —— 示教学习 —— 远程操作系统（Teleoperation System）

摘要：说下个人对这部分的理解，这个就是说要机器人去在人类的控制下学习动作，或者说在人类的遥控下进行操作，然后记录下这部分操作的数据，然后再用这部分收集到的数据来对机器人进行训练。其他相关： https://github.com/kscalelabs/teleop 阅读全文

posted @ 2024-12-06 19:17 Angry_Panda 阅读(51) 评论(0) 推荐(0)

如何画神经网络结构示意图

摘要：我理想中的网络结构示意图： FCN-8 VCG-16 工具介绍： tikz_cnn 地址： https://github.com/jettan/tikz_cnn PlotNeuralNet https://github.com/HarisIqbal88/PlotNeuralNet draw_conv 阅读全文

posted @ 2024-12-06 16:11 Angry_Panda 阅读(118) 评论(0) 推荐(0)

大语言模型 —— 使用RAG工具Anything LLM䢎本地部署AI大模型投喂数据，创建本地私有AI知识库

摘要：相关： https://www.youtube.com/watch?v=77990wI3LZk https://anythingllm.com/ https://ollama.com/ 阅读全文

posted @ 2024-12-06 13:57 Angry_Panda 阅读(665) 评论(0) 推荐(0)

读论文——《基于知识辅助深度强化学习的巡飞弹组动态突防决策》

摘要：地址： http://www.co-journal.com/CN/rich_html/10.12382/bgxb.2023.0827 利用领域知识、专家知识等先验知识对巡飞弹避障模型进行探索引导,能够使算法快速学会基础规则与策略,降低算法在无效状态空间中的探索时间。模仿学习是其中最为行之有效的引导技阅读全文

posted @ 2024-12-06 12:14 Angry_Panda 阅读(69) 评论(0) 推荐(0)

论文 —— 《基于分层强化学习的无人机空战多维决策》

摘要：

地址： http://www.co-journal.com/CN/10.12382/bgxb.2022.0711 这个论文主要是看如何处理所谓的SAC强化学习算法在军事上的应用和其中提出的元策略算法 + option-critic分层强化学习的组合，不过这个论文看完感觉不知道是如何做的，其中的描述也阅读全文

posted @ 2024-12-06 10:31 Angry_Panda 阅读(49) 评论(0) 推荐(0)

12 2024 档案

公告

导航