Fork me on GitHub
1 2 3 4 5 ··· 27 下一页
摘要: 面向6G的多站多智能超表面(Multi-RIS for 6G)的 原理机制 和 系统架构。 🧩 一、基础概念:RIS 是什么? RIS(Reconfigurable Intelligent Surface,可重构智能超表面)是一种由大量可调单元(Meta-atoms)组成的超薄电磁表面。 这些单元 阅读全文
posted @ 2025-10-09 15:13 stardsd 阅读(79) 评论(0) 推荐(0)
摘要: DeepSeek-V3.2-Exp 是一个基于稀疏注意力机制(DSA,DeepSeek Sparse Attention)优化的长上下文处理模型,其核心创新在于高效地处理长序列输入,同时保持模型性能。 🧠 什么是 DSA(DeepSeek Sparse Attention)? DSA 是 Deep 阅读全文
posted @ 2025-09-30 10:59 stardsd 阅读(141) 评论(0) 推荐(0)
摘要: 深度学习编译器 TVM 在深度学习的训练和推理过程中,性能优化是一个永恒的主题。不同的硬件(CPU、GPU、NPU、FPGA 等)有不同的计算特性,如果每次都手写 CUDA 内核或 ARM 汇编,不仅耗时,而且难以维护。 这时,一个跨平台的深度学习编译器——Apache TVM (Tensor Vi 阅读全文
posted @ 2025-09-30 09:24 stardsd 阅读(363) 评论(0) 推荐(0)
摘要: 本文是一份面向工程师的 Apache SeaTunnel 上手文档,内容覆盖: SeaTunnel 的定位与原理 架构组成 安装与快速上手 配置文件说明(含示例) 典型应用场景(如日志采集、数据库同步、湖仓一体场景) Apache SeaTunnel 上手文档 1. SeaTunnel 简介与定位 阅读全文
posted @ 2025-08-29 14:31 stardsd 阅读(306) 评论(0) 推荐(0)
摘要: RDMA (Remote Direct Memory Access) 和 RoCE (RDMA over Converged Ethernet)。 1. 背景:为什么需要 RDMA? 在传统网络通信(TCP/IP 协议栈)中: 内核协议栈开销大:每次传输都要在用户态和内核态之间切换,涉及拷贝、上下文 阅读全文
posted @ 2025-08-28 16:03 stardsd 阅读(199) 评论(0) 推荐(0)
摘要: 本文先讲清楚 NL2SQL 与 NL2DSL 的本质差异,再用一个从中文到 DSL、再到 SQL 的完整闭环示例,展示 LLM 是如何生成 DSL 的。 一、NL2SQL vs NL2DSL:核心差异 维度 NL2SQL(自然语言→SQL) NL2DSL(自然语言→领域专用语言,再编译到SQL/其他 阅读全文
posted @ 2025-08-28 15:22 stardsd 阅读(239) 评论(0) 推荐(0)
摘要: 电动垂直起降 (eVTOL) 飞机市场有望在未来几年实现显著增长,这将彻底改变城市空中交通,并彻底改变我们现有的交通方式。本报告深入探讨了 eVTOL 制造的现状,探索了塑造这一新兴行业的关键趋势、挑战和机遇。报告还探讨了复合材料等先进材料以及增材制造等尖端制造技术在推动创新和实现此类革命性飞机量产 阅读全文
posted @ 2025-08-13 15:49 stardsd 阅读(96) 评论(0) 推荐(0)
摘要: 开源实现: 1. Apache Superset 官网:https://superset.apache.org/ 介绍:Apache Superset 是 Apache 基金会维护的现代数据可视化和数据探索平台,支持实时数据连接和大屏仪表盘展示。 特点: 丰富的图表类型(折线、柱状、饼图、地图等) 阅读全文
posted @ 2025-08-08 15:42 stardsd 阅读(98) 评论(0) 推荐(0)
摘要: 执行摘要 概要 低空经济正在迅速崛起,成为一个由技术融合和战略政策共同驱动的、价值万亿美元的全球性机遇。它不仅仅是一个新兴行业,更是一种综合性的经济形态,旨在将经济活动从传统的二维地面延伸至三维的低空空域。本报告深入剖析了低空经济的技术基础、市场动态、产业格局和监管环境,旨在为战略投资者、企业高管和 阅读全文
posted @ 2025-08-08 09:29 stardsd 阅读(177) 评论(0) 推荐(0)
摘要: 技术维度 无人机和电动垂直起降飞行器(eVTOL)是低空经济的核心技术支撑。无人机技术已进入相对成熟阶段,被广泛应用于农业植保、物流配送、基础设施巡检等领域。eVTOL结合航空复合材料、高性能电池和智能飞行控制等尖端技术,目前多处于试飞和认证阶段。与此同时,5G/6G通信导航定位、AI自主飞行算法、 阅读全文
posted @ 2025-08-08 09:20 stardsd 阅读(239) 评论(0) 推荐(0)
摘要: 低空经济发展全景分析报告(基于Wind数据及行业动态) 一、产业定义与政策环境 低空经济指距地1000米以下空域的经济活动,涵盖eVTOL(电动垂直起降飞行器)、无人机、低空服务等。政策层面,国家将其纳入战略性新兴产业,30余省份出台专项规划(如安徽、湖南空域改革试点),推动空域开放、适航认证和场景 阅读全文
posted @ 2025-08-07 16:31 stardsd 阅读(153) 评论(0) 推荐(0)
摘要: 一、使用 PyInstaller 打包 PyQt 程序 PyInstaller 是最简单高效的打包工具之一,支持大部分主流库(如 PyQt5/PyQt6、requests、numpy 等),适合快速封装桌面 GUI 应用。 安装 PyInstaller pip install pyinstaller 阅读全文
posted @ 2025-07-18 19:15 stardsd 阅读(891) 评论(0) 推荐(0)
摘要: Table 4: Levels of agent automation 表4:智能体自动化级别 Level 等级 Description 描述 Key characteristics 关键特征 Examples 示例 Level 0: Manual (no automation) 0级:手动(无自动 阅读全文
posted @ 2025-07-08 15:53 stardsd 阅读(306) 评论(0) 推荐(0)
摘要: 一段话总结:6G预计于2027-2030年部署,2037年成为主导技术,行业对10年迭代周期存在争议(欧美倾向打破,亚洲加速创新)。Omdia预测,2030年6G RAN投资达$40亿,订阅量2.89亿;2035年RAN投资增至$250亿,订阅量达35亿(占全球22.3%)。6G将实现更高容量、速率 阅读全文
posted @ 2025-07-08 15:23 stardsd 阅读(124) 评论(0) 推荐(0)
摘要: 大型语言模型算法前沿:当前AI格局下的架构、方法与评估 1. 架构的基石:从Transformer到专业化专家 本节解构了驱动现代大型语言模型(LLM)的核心架构范式。我们将从基础的Transformer模型入手,分析其固有的局限性,然后系统地探索为应对这些挑战而涌现的创新解决方案,即专家混合模型( 阅读全文
posted @ 2025-07-01 16:03 stardsd 阅读(404) 评论(0) 推荐(0)
摘要: 摘要 本报告旨在全面深入地探讨大型语言模型(LLM)的前沿技术和发展趋势,并结合最新的国际AI前沿进展进行更新。报告涵盖了LLM的主流技术路线、数据集、预训练、微调、部署与优化,以及多模态模型和性能评估等多个关键方面。我们特别关注国际AI前沿的最新进展,兼顾通用模型和开源模型,并对多模态LLM和性能 阅读全文
posted @ 2025-07-01 15:23 stardsd 阅读(561) 评论(0) 推荐(0)
摘要: DeepSpeed Chat:轻松、快速且经济地在所有规模上对 ChatGPT 类模型进行 RLHF 训练 要引用 DeepSpeed Chat,请引用我们的arxiv 报告: @article{yao2023dschat, title={{DeepSpeed-Chat: Easy, Fast an 阅读全文
posted @ 2025-05-08 16:02 stardsd 阅读(99) 评论(0) 推荐(0)
摘要: https://github.com/NVIDIA/DALI DALI库的核心优势在于其GPU加速能力。传统的数据预处理过程大多在CPU上执行,包括数据的加载、解码、裁剪、调整大小等操作,这些操作往往是计算密集型的,且受限于CPU的计算能力。而DALI库通过将部分或全部数据预处理任务卸载到GPU上执 阅读全文
posted @ 2025-05-08 15:38 stardsd 阅读(146) 评论(0) 推荐(0)
摘要: 在大模型训练中,通信成本是影响训练效率的关键瓶颈之一。数据并行(Data Parallelism) 和 张量并行(Tensor Parallelism) 通过各自的策略来降低通信开销、提升效率。下面从它们的通信特点和优化方式来分析。 一、数据并行(Data Parallelism) 原理: 每个 G 阅读全文
posted @ 2025-05-08 15:29 stardsd 阅读(867) 评论(0) 推荐(0)
摘要: 一、问题背景 随着AIGC领域的兴起,各大厂商都在训练和推出自研的大模型结构,并结合业务进行落地和推广。在大模型分布式训练场景中,主流的主要是基于英伟达GPU进行训练(如A100),如何有效地压榨GPU的计算能力,提升训练效率,降低训练成本,是一个非常重要的实践优化问题。 1.1 直接目标 最直接地 阅读全文
posted @ 2025-05-08 14:58 stardsd 阅读(1516) 评论(0) 推荐(0)
摘要: 使用 uv 管理多个虚拟环境(venv)时,可以做到 快速、高效、干净地切换项目环境。 🎯 一、最佳实践:每个项目一个虚拟环境 建议把虚拟环境放在项目目录内或统一放在一个专用目录,比如: 项目目录下的 .venv/ 统一放到 ~/.venvs/<项目名>/ 🚀 二、uv 管理多个 venv 的基 阅读全文
posted @ 2025-04-21 10:25 stardsd 阅读(3527) 评论(0) 推荐(0)
摘要: 【深度解析】谷歌A2A(Agent2Agent)协议:AI智能体协作的未来基石 📝 摘要:谷歌A2A(Agent2Agent)协议为AI智能体之间的开放协作与通信提供了标准化框架。本文系统梳理A2A协议的设计理念、核心机制、典型实现与应用场景,结合完整代码示例,深入剖析其在多智能体系统中的价值与未 阅读全文
posted @ 2025-04-18 17:18 stardsd 阅读(491) 评论(0) 推荐(0)
摘要: OpenAI Codex Cli 在您的终端中运行的轻量级编码代理 npm i -g @openai/codex 快速入门 全局安装: npm install -g @openai/codex 接下来,将您的 OpenAI API 密钥设置为环境变量: export OPENAI_API_KEY=" 阅读全文
posted @ 2025-04-17 15:09 stardsd 阅读(1413) 评论(0) 推荐(0)
摘要: 截至2025年第一季度,国际AI研究呈现技术深化、行业融合加速、基础设施需求旺盛三大趋势。以下从学术突破、技术应用、硬件创新、行业挑战四个维度展开分析: 一、学术研究:模型能力与效率双重突破 知识图谱与大模型融合 蚂蚁集团在NeurIPS 2024提出的KGL(知识图谱语言),通过将知识图谱三元组结 阅读全文
posted @ 2025-03-21 13:20 stardsd 阅读(316) 评论(0) 推荐(0)
摘要: 多智能体系统 (MAS) 由多个人工智能 (AI) 智能体组成,它们共同代表用户或其他系统执行任务。 MAS 中的每个代理都具有各自的属性,但所有代理都会协同工作以实现所需的全局属性。1多 代理系统在完成可能涉及数百甚至数千个代理的大规模复杂任务方面很有价值。2 这一理念的核心是人工智能 (AI)  阅读全文
posted @ 2025-03-06 11:02 stardsd 阅读(956) 评论(0) 推荐(0)
摘要: AI到AI通信:Gibberlink https://github.com/PennyroyalTea/gibberlink 在 ElevenLabs 伦敦黑客马拉松的一次开创性演示中,开发人员推出了 GibberLink,这是一种新颖的协议,可让人工智能语音助手使用针对机器而非人类优化的语言进行交 阅读全文
posted @ 2025-02-27 16:46 stardsd 阅读(318) 评论(0) 推荐(0)
摘要: Transformer体系结构已经成为大型语言模型(llm)成功的主要组成部分。为了进一步改进llm,人们正在研发可能优于Transformer体系结构的新体系结构。其中一种方法是Mamba(一种状态空间模型)。 Mamba: Linear-Time Sequence Modeling with S 阅读全文
posted @ 2025-02-27 14:35 stardsd 阅读(719) 评论(0) 推荐(0)
摘要: MCP全称是Model Context Protocol, 也就是”模型上下文协议”, 是Anthropic这家公司搞的一个AI应用协议。这个东西服务于AI应用(而不是AI模型),之所以强调这个,是因为很多人分不清楚大语言模型与大语言模型应用的差别。 那AI应用为什么需要MCP呢? 大部分大语言模型 阅读全文
posted @ 2025-02-26 14:58 stardsd 阅读(3832) 评论(2) 推荐(1)
摘要: 大模型一体机行业内幕 DeepSeek大模型一体机特点:私有化部署、交付容易、价格低廉,适合内网IT改造和CIO们的创新选择,也是目前被疯抢的原因。 大模型一体机从功能上要分ABC三类:A类:主要是硬件就是机头+AI卡,组成的纯纯的AI硬件服务器。B类:在A类的技术上加上Deepseek模型和开发平 阅读全文
posted @ 2025-02-21 10:56 stardsd 阅读(1396) 评论(0) 推荐(0)
摘要: GPQA The following are 10 questions. Answer each of the multiple choice question. Only use the letter for the answer. What is the world's largest livi 阅读全文
posted @ 2025-02-21 09:42 stardsd 阅读(185) 评论(0) 推荐(0)
摘要: 基本数据并行(DP)在训练模型时,不会降低每个设备的内存占用。在当前配备 32GB 内存的 GPU 上,当模型参数超过 14 亿时,使用 DP 就会出现内存不足的情况。这是因为 DP 会在每个设备上复制完整的模型参数、梯度和优化器状态等模型状态数据。以一个参数规模较大的模型为例,每个设备都要存储完整 阅读全文
posted @ 2025-02-10 15:26 stardsd 阅读(984) 评论(0) 推荐(0)
摘要: 在 DeepSeek 模型中,多头潜在注意力(Multi-Head Latent Attention,MLA) 是一种关键技术,旨在通过低秩压缩方法优化注意力机制的计算效率和内存使用。MLA 通过对键(Key)和值(Value)进行低秩联合压缩,显著减少了推理过程中的键值缓存(KV Cache),在 阅读全文
posted @ 2025-02-05 16:51 stardsd 阅读(3275) 评论(0) 推荐(0)
摘要: 看到DeepSeek-V3使用了多token预测(Multi-token Prediction, MTP)技术,该技术原始论文是由Meta 发在ICML 2024的一篇Poster。 论文: [2404.19737] Better & Faster Large Language Models via 阅读全文
posted @ 2025-01-17 09:35 stardsd 阅读(2512) 评论(0) 推荐(0)
摘要: Generalist AI (AGI) framework based on the principles of embodiment, grounding, causality and memory 图:通用 AGI 系统的功能框图。概念模型由以下部分组成:(1)核心框架、体现,提供与世界接口和交 阅读全文
posted @ 2025-01-14 17:10 stardsd 阅读(87) 评论(0) 推荐(0)
摘要: 类型 主要功能 在LLMs中的实现方法 感官记忆 短暂存储感官信息以供认知系统访问。 缓冲输入/输出系统;感官输入的锁存机制;仿生感官记忆技术。 作为一种缓冲机制,允许认知处理组件在不同速度下工作而不丢失信息。 过滤信息(例如,通过注意机制)以供长期存储。 在线记忆 暂时存储活跃信息以支持认知处理。 阅读全文
posted @ 2025-01-14 16:48 stardsd 阅读(123) 评论(0) 推荐(0)
摘要: 符号嵌入问题(Symbol Grounding Problem)是认知科学、心灵哲学和人工智能中的一个关键问题。它探讨的是符号(或词语)是如何在一个系统中获得意义的。换句话说,抽象符号(如单词或概念)是如何代表现实世界中的对象、行为或经验的? 关键概念 符号表示:指的是将意义编码为抽象符号的理念,例 阅读全文
posted @ 2025-01-14 15:48 stardsd 阅读(408) 评论(0) 推荐(0)
摘要: 空间思考:多模态大型语言模型如何看待、记忆和回忆空间 VSI-Bench:我们引入了一个高质量的基准,用于评估 MLLM 的 3D、基于视频的视觉空间智能 评估:我们在开源和闭源 MLLM 上对 VSI-Bench 进行了评估,发现 MLLM 表现出有竞争力的(尽管不如人类)视觉空间智能。 语言分析 阅读全文
posted @ 2025-01-08 17:07 stardsd 阅读(249) 评论(0) 推荐(0)
摘要: 本文介绍了 NEC 公司研发的利用人工智能自主优化 5G 网络的技术,该技术可实时分析应用状态和无线质量,自主优化 5G 网络,以确保机器人和汽车远程控制所需的可靠性和实时性能。具体内容如下: 技术背景与目标 重要性与问题:5G 网络对数字化转型和高级应用至关重要,但多数应用在通信质量下降时生产力会 阅读全文
posted @ 2024-12-25 15:18 stardsd 阅读(199) 评论(0) 推荐(0)
摘要: 与主要专注于文本生成和回复的传统 LLMs 不同,LAMs 旨在在物理和数字环境中执行动作。 核心观点 LAMs 是 AI 发展的重要方向,能够将 AI 从被动语言理解转变为主动任务完成,在人工智能发展进程中具有重要意义。 LAMs 通过在物理和数字环境中执行动作,实现了从语言交互到实际行动的跨越, 阅读全文
posted @ 2024-12-24 15:46 stardsd 阅读(288) 评论(0) 推荐(0)
摘要: 1. 视频编解码协议和视频传输协议的区别: 视频编解码协议是指在视频采集、压缩、存储、传输和显示过程中,对视频数据进行编码和解码的规则和方法。视频编解码协议的目的是为了减少视频数据的冗余,提高视频质量,降低视频码率,节省网络带宽和存储空间。常见的视频编解码协议有 MPEG-4、H.264、H.265 阅读全文
posted @ 2024-01-06 09:38 stardsd 阅读(1298) 评论(0) 推荐(0)
1 2 3 4 5 ··· 27 下一页