WAIC-2024-笔记-全-

WAIC 2024 笔记(全)

人工智能治理基础教程 P1:收益、风险与全球协同 🧠

在本节课中,我们将学习2024世界人工智能大会开幕式上,多位专家关于人工智能治理的核心观点。课程将涵盖人工智能带来的宏观收益与潜在风险、中国的治理实践,以及构建全球协同治理体系的必要性。

概述:人工智能的双刃剑效应

人工智能的发展如同一把双刃剑,在带来巨大机遇的同时也伴随着显著风险。理解其全貌是进行有效治理的第一步。

上一节我们概述了课程内容,本节中我们来看看人工智能的宏观影响。

人工智能的宏观收益与风险

清华大学薛澜教授从联合国可持续发展目标(SDG)的视角,分析了人工智能的宏观影响。SDG包含17个主要目标和169个具体指标,旨在2030年前推动人类社会更好发展。

人工智能对这169个指标的影响评估显示:

  • 积极影响:人工智能预计对其中134个指标产生积极的促进作用。
  • 潜在风险:同时,也可能对其中约59个(35%)指标带来不利影响。

这表明,人工智能在推动经济发展、社会进步和环境保护三大领域潜力巨大,但其负面影响也不容忽视。

人工智能风险的分类

为了有效管理,我们需要对风险进行归类。薛澜教授将人工智能风险分为三大类:

以下是主要的风险类别:

  1. 技术内在风险:包括模型的“幻觉”(Hallucination)问题,以及长远来看,具有自主性的人工智能系统可能对人类构成的威胁。
  2. 技术开发衍生风险:包括数据安全、算法歧视、能源消耗等伴随技术开发过程产生的问题。
  3. 技术应用风险:包括技术的误用、滥用,以及可能对社会就业结构产生的冲击。

中国的治理实践与体系

面对机遇与挑战,中国在过去几年中,已经着手构建一个多层次的人工智能治理体系。

以下是该体系的主要构成部分:

  • 底层规则:2019年发布了《新一代人工智能治理原则》,并后续出台了伦理规范,确立了发展基调。
  • 法律法规:在数据、算法、算力等关键要素,以及网络安全、个人信息保护等领域,出台了相应的法律法规。
  • 场景化规则:针对自动驾驶、深度合成等具体应用场景,制定了专项治理规则。
  • 公众素养提升:通过《提升全民数字素养与技能工作要点》等部署,提升社会对人工智能的认知和理解。

这个体系体现了 “多维度、多层次、多领域、多举措” 的治理思路,旨在统筹发展与安全。

全球治理的挑战与协同路径

尽管各国已有实践,但人工智能的全球治理仍面临严峻挑战,核心在于多种“鸿沟”的存在。

上一节我们了解了国家层面的实践,本节中我们来看看全球层面的挑战与合作。

  • 基础设施鸿沟:全球仍有约25亿人处于离线状态。
  • 数字素养鸿沟:公众理解和运用数字技术的能力存在巨大差距。
  • 发展与治理鸿沟:各国在人工智能技术发展和治理规则上进度不一。

这些鸿沟不仅阻碍全球共同发展,也意味着一个国家的风险可能演变为全球性风险。因此,国际协同治理至关重要。

薛澜教授提出了全球协同的路径建议:

  1. 平衡发展与安全:将发展与安全视为一体两翼,在关注安全的同时,必须着力解决发展鸿沟问题。
  2. 建立多边对话机制:加*政府间的多边对话,共同制定规则。
  3. 发挥科学共同体作用:依托全球科技力量,助力国际治理机制的完善。
  4. *化联合国协调作用:支持联合国等国际组织发挥综合协调作用,推动通过具有约束力的国际协议。

总结:走向协同治理的未来

本节课中,我们一起学习了人工智能治理的基本框架。我们认识到人工智能在促进全球可持续发展目标方面的巨大潜力,也系统梳理了其可能带来的技术、开发与应用风险。中国的治理实践为我们提供了一个多层次体系的范例。最后,我们明确了打破全球数字与发展鸿沟、通过国际对话与协作建立平衡且有效的全球治理体系,是确保人工智能朝着“科技向善”方向发展的关键。

各方需要共同努力,让人工智能真正为人类的和平与发展作出更大贡献。

2:人工智能治理与未来发展 🌐

在本节课中,我们将学习2024年世界人工智能大会全体会议的核心内容。课程将聚焦于人工智能带来的宏观收益与潜在风险、中国在AI治理方面的实践探索,以及全球合作治理的必要性与技术路径。我们将通过多位顶尖专家和行业领袖的视角,深入理解如何平衡AI发展与安全,并探讨其未来方向。


人工智能的宏观影响与风险 ⚖️

上一节我们介绍了课程概述,本节中我们来看看人工智能带来的宏观收益与潜在风险。

人工智能的发展能够为社会带来广泛的收益。从宏观角度看,人工智能技术有助于推动实现联合国可持续发展目标(SDGs)。该目标包含17个主要目标和169个具体指标,旨在促进经济发展、社会进步和环境保护。研究表明,人工智能可能对其中134个指标产生积极的促进作用。

然而,人工智能也可能对其中约35%的指标(59个)产生不利影响。这些潜在风险不容忽视,主要可以分为三大类:

以下是人工智能潜在风险的分类:

  1. 技术内在风险:包括模型的“幻觉”问题(hallucination),以及未来*自主性AI系统可能对人类构成的威胁。
  2. 技术开发相关风险:涉及数据安全、算法歧视、能源消耗与环境影响等问题。
  3. 技术应用相关风险:包括技术的误用、滥用,以及可能对社会就业结构造成的长期冲击。

因此,推动人工智能健康发展,最大化其收益同时将风险降至最低,是当前的核心议题。


中国的AI治理实践 🏛️

上一节我们探讨了AI的风险与收益,本节中我们来看看中国在人工智能治理方面的具体实践。

中国在过去几年中,已经建立起一个相对完整的治理体系,旨在统筹人工智能的发展与安全。这个体系是多维度、多层次、多领域且多举措的。

以下是中国AI治理体系的主要构成部分:

  • 底层规则与伦理:2019年发布了《新一代人工智能治理原则》,后续又发布了伦理准则,为治理奠定基础。
  • 领域性法律法规:针对算法、算力、数据等关键要素,出台了一系列治理规则。
  • 专项场景治理:针对人工智能的具体应用场景,制定了相应的监管措施。
  • 公众素养提升:通过《提升全民数字素养与技能工作要点》等部署,加*社会对人工智能的理解与认识。

这一体系*调发展与安全并重,并注重提升公众认知,以营造有利于人工智能创新且安全可控的社会环境。


全球挑战与治理路径 🌍

上一节我们了解了中国的治理经验,本节中我们将视野扩展到全球,看看人工智能发展面临的共同挑战与国际治理路径。

全球人工智能的发展仍面临多重鸿沟,这些鸿沟不仅是发展障碍,也可能转化为全球性风险。

以下是当前主要的全球性鸿沟:

  1. 基础设施鸿沟:全球仍有大量人口处于离线状态。
  2. 数字素养鸿沟:公民在数字技能和理解上存在巨大差异。
  3. AI发展与治理鸿沟:各国在AI技术发展和治理能力上不平衡。

解决这些问题需要国际社会共同努力,将发展与安全视为一体两翼。目前国际社会对安全问题较为关注,但对发展鸿沟的关注仍需加*。

为构建有效的全球治理框架,需要多途径推进:

以下是推动全球AI治理的关键路径:

  • 加*政府间对话:通过多边机制建立国际交流与风险防控体系。
  • 发挥科学共同体力量:全球科技界应与企业、政府协同,助力完善国际规则。
  • *化国际组织作用:支持联合国等组织发挥综合协调作用,推动达成并落实关于AI安全与国际能力建设的协议。

最终目标是打破壁垒,加*合作,引导人工智能为人类和平与发展作出更大贡献。


AI安全与发展的45度平衡率 ⚖️

上一节我们讨论了全球治理的合作框架,本节中我们将深入一项具体的技术治理主张——AI的45度平衡率。

当前以大模型为代表的AI能力正呈指数级增长,但与之对应的安全能力(如红队测试、安全护栏、评估测量等)的发展却呈现离散化、碎片化且后置的特点。两者投入差距巨大,例如全球99%的算力用于模型预训练,仅不到1%用于对齐或安全优先的考量。

这种失衡导致AI的发展路径是“跛脚”的。我们真正需要追求的是可信的AGI,它必须兼顾安全与性能。因此,我们提出了“AI 45度平衡率”的技术思想体系。

公式AI发展路径 ≈ 沿安全与性能的45度角方向

该思想要求*技术驱动、全流程优化、多主体参与及敏捷治理。其实质是追求从长期看,AI的安全与性能大体上平衡发展,短期内允许波动,但不能长期偏离平衡。


实现平衡的技术路径:可信AI的因果之梯 🪜

上一节我们提出了平衡发展的目标,本节中我们探讨一条实现该目标的具体技术路径——以因果为核心的可信AI发展阶梯。

实现AI的45度平衡率可能有多种技术路径。上海人工智能实验室提出了一条名为“可信AI的因果之梯”的路径,致敬图灵奖得主朱迪亚·珀尔。该路径将发展分为三个递进阶段:

以下是“可信AI的因果之梯”的三个阶段:

  1. 泛对齐:包含当前基于人类偏好的对齐技术(如RLHF)。但这类技术主要依赖统计相关性,而非真正的因果关系,可能导致错误推理和风险(类似“巴甫洛夫的狗”的条件反射)。
  2. 可干预:探究AI行为的因果机制。技术包括人在回路、可解释性,以及新提出的“对抗演练”,旨在通过提升可解释性和泛化性来同时增*安全与能力。
  3. 能反思:要求AI系统不仅能执行任务,还能审视自身行为的外在影响和潜在风险。技术包括基于价值的训练、因果可解释性、反事实推理等。

目前全球AI安全技术发展主要停留在第一阶段,部分尝试进入第二阶段。但要实现真正的安全与性能平衡,必须完善第二阶段并勇敢迈向第三阶段。


产业基础:半导体视角下的AI安全 🔩

上一节我们从算法层面探讨了安全路径,本节中我们将视角下沉到人工智能的物理基础——半导体芯片,来看产业界如何保障AI安全。

人工智能始于半导体芯片。过去60年,半导体行业实现了5万亿美元的销售额,而近期的增长几乎全部由AI驱动。AI需要庞大的基础设施来训练和运行模型。

历史上,芯片设计主要优化性能和能耗。而在AI时代,必须增加对安全保障的优化维度。作为芯片设计软件提供商,新思科技利用AI加速芯片开发过程,提升效率并弥补人才缺口。

在芯片层面确保AI安全,产业界正在实践多项工作:

以下是从半导体角度保障AI安全的关键举措:

  • 合规与可追溯性:确保芯片中每个组件的来源安全、可追溯,防止不合规部件引入,保护知识产权和隐私。
  • 能效优化:优化芯片设计以降低能耗,这对于运行AI的大型数据中心至关重要。
  • 内部AI治理:在企业内部建立“AI卓越中心”,教育员工认识AI伦理与风险,并负责任地将AI技术商业化。
  • 提升行业效率:应用生成式AI等技术提升工程师效率,同时实现能耗降低(如减少30%)和开发效率大幅提升(如提升10-15倍)。

从硅基芯片到上层应用,构建安全、合规、合乎伦理的AI技术生态系统至关重要。


投资视角:AI如何重塑商业与风险评估 💼

上一节我们了解了硬件基础的安全考量,本节中我们将从投资视角,观察AI如何改变商业逻辑与风险评估。

AI不仅改变了企业运营方式,也深刻改变了价值评估框架。一些公司因成功融合AI而价值飙升,另一些则可能面临价值重估。对于持有长期硬资产的投资机构而言,评估AI的长期影响变得至关重要。

AI已成为投资决策的核心考量因素之一。投资机构需要以5到10年的周期视角,评估AI的深入发展将对所投企业业务产生何种影响。目标是在避免成为“意外的输家”的同时,抓住“大赢家”的机会。

在学术与产业互动方面,结构性变化正在发生。目前AI的重大突破多出现在商业界,因为企业能负担得起所需的巨大算力。大学虽然拥有顶尖人才,但在资源竞争中处于劣势。未来,需要促进学界与业界更深入的融合与相互尊重,以推动基础研究与产业应用共同健康发展。


科学家论道:AI的过去、现在与未来 🧠

上一节我们从商业角度分析了AI的影响,本节中我们聆听三位图灵奖得主从计算机科学根本出发,对AI治理与未来的深刻见解。

拉杰·雷迪*调,在关注风险治理的同时,不应忽视AI作为工具的巨大潜力。当前的重点应是研究如何让AI将人类的心智能力提升十倍、百倍,并改革教育体系,培养能熟练运用AI的下一代。

曼纽尔·布鲁姆分享了关于“意识”的研究。他介绍了“有意识的图灵机”模型,将意识类比为剧场:众多处理器(神经元)聆听“舞台”上的信息并做出反应。这个模型为理解智能和构建通用人工智能提供了新思路。

姚期智系统阐述了AI风险的三个层面:

  1. 网络安全风险的放大:AI使传统数据安全挑战变得更为复杂。
  2. 无意识的社会风险:AI可能快速颠覆社会结构,如导致大规模失业。
  3. 生存性风险:这是最深刻的挑战,即创造出一个可能远超人类能力的物种。控制它与避免被它破坏之间的平衡,是计算机科学理论面临的终极问题之一。

科学家们一致认为,我们正处于激动人心的历史时刻。不应因过度*调安全而忽视AI带来的巨大机遇,也不应盲目发展而忽视潜在风险。对技术保持敬畏,并积极寻求解决之道,是科学共同体的责任。


总结与展望 ✨

在本节课中,我们一起学习了2024年世界人工智能大会全体会议的核心内容。

我们从宏观层面分析了人工智能带来的巨大收益与各类潜在风险。接着,我们梳理了中国在构建多维度AI治理体系方面的实践经验。面对全球性的基础设施、素养与发展鸿沟,我们探讨了通过国际合作、平衡发展与安全来推动全球治理的必要性。

在技术层面,我们深入探讨了“AI 45度平衡率”这一发展理念,并介绍了以因果推理为核心的“可信AI因果之梯”技术路径。从半导体产业的硬件安全基础,到投资领域的价值重估与风险评估,我们看到了AI对全产业链的深刻影响。

最后,三位图灵奖得主从计算机科学的本源出发,提醒我们既要积极利用AI放大人类能力,也要对其可能带来的根本性挑战保持清醒与敬畏。

人工智能的未来需要共商、共享、共治。它融合了机遇与挑战、确定性与神秘性、严谨研究与大胆想象。只有通过全球智慧的持续携手与协同探索,才能确保这项革命性技术朝着科技向善、造福人类的方向健康发展。

3:通用人工智能前沿进展与挑战 🧠

概述

在本节课中,我们将学习上海人工智能实验室在通用人工智能(AGI)领域的前沿探索,包括通专融合的发展路径、书生系列大模型的最新进展、多模态与气象海洋大模型的应用,以及国家级实验室的协同创新机制。课程还将涵盖全球人工智能创新指数分析,并探讨AI安全与负责任发展的重要性。


一、上海人工智能实验室的工作与挑战

上海人工智能实验室在人工智能发展的重要阶段,面临算力能耗、专业应用适配及AGI发展路径等挑战。

以下是实验室的核心工作方向:

  1. 书生大模型:展示AI在多个场景中的应用能力,如演讲辅助、休闲娱乐、体育分析等。
  2. 通专融合路径:提出AGI发展需兼顾泛化能力与专业性,通过基础模型层、融合协同层、自主进化与交付层的系统化设计实现。
  3. 高效训练与推理:通过稀疏数据合成、渐进式对齐等技术,以更低算力实现高性能模型,如书生·浦语2.5以70亿参数比肩700亿参数模型。
  4. 科学发现应用:利用大模型提出科学假设,例如预测药物疗效差异,并在后续实验中得到验证。

二、通专融合的AGI发展路径

上一节我们介绍了实验室的整体工作,本节中我们来看看通专融合的具体路径。周博文主任指出,AGI发展需在泛化性与专业性两个维度上协同演进。当前大模型在泛化能力上进展迅猛,但专业能力提升缓慢,且存在能耗高、幻觉等问题。

通专融合的核心是找到“价值引爆点”,即模型在专业能力上超过90%的人类专家,同时具备*泛化能力。实现这一目标需要三层架构:

  1. 基础模型层:提升模型泛化能力,如书生·浦语大语言模型和书生·万象多模态模型。
  2. 融合协同层:结合泛化性与专业性,通过多智能体协同实现复杂任务规划与决策。
  3. 自主进化与交付层:*调AI在真实或仿真环境中的自主探索与反馈闭环,如“浦源·桃源”城市级具身智能训练场。

三、书生系列大模型的最新进展

以下是书生系列模型的核心亮点:

  1. 书生·浦语2.5
    • 推理能力提升20%,支持100万token上下文,在数学评测集上性能提升100%。
    • 通过模型飞轮与合成数据加速迭代,融合规则构造、模型扩充、反馈生成等多种数据合成方案。
  2. 书生·万象多模态模型
    • 支持图像、视频、文本、语音、三维、医疗等多种模态,性能比肩GPT-4V等顶尖闭源模型。
    • 采用渐进式预训练与对齐技术,以较低成本实现高性能训练。
  3. 风乌气象海洋大模型
    • 覆盖短临预报、中期预报、气候预测全周期,实现全球10公里高分辨率气象建模。
    • 风乌Ada端到端模型摆脱对物理分析场的依赖,效率提升1000倍以上。

四、国家级实验室的协同创新

在通专融合的背景下,国家级实验室的协同至关重要。钱锋院士、王耀南院士等专家指出,AI发展需“顶天立地”:

  • 顶天:研究大模型架构、训练算法、算力效率与数据可信度,突破现有技术瓶颈。
  • 立地:推动AI在智能制造、智能交通、智慧教育、智慧医疗等领域的赋能应用。

各实验室需发挥优势,形成合力:

  1. 虚拟现实实验室:构建智能化虚实融合环境,实现虚实贯通。
  2. 认知智能实验室:聚焦语言理解与知识推理,让机器“能理解会思考”。
  3. 多媒体信息处理实验室:探索实时感知与脉冲神经网络,构建下一代智能系统。
  4. 自主智能无人系统实验室:研究多智能体协同与博弈,实现具身智能的群体智能涌现。

专家呼吁建立“举国体制”,由国家层面统筹基础设施建设与重大任务布局,避免资源分散与低水平重复。


五、全球人工智能创新指数与趋势

赵志耘所长发布的《2023全球人工智能创新指数报告》显示:

  1. 总体格局:中美两国引领第一梯队,与第二、三、四梯队差距进一步拉大。
  2. 发展趋势
    • 大模型带动技术创新加速,产业界在模型开发上优势扩大。
    • 生成式AI开源项目激增,人工智能企业数量与风险投资额回升。
  3. 中国表现:综合水平全球第二,但在高质量数据资源与原创能力上仍需加*。

未来需在数据资源建设、人才引进、原始创新、规模化应用与国际合作等方面持续突破。


六、AI安全与负责任发展

宋晓东教授*调,AI的负责任发展需关注三大挑战:

  1. 可信AI
    • 隐私泄露:大模型会记忆训练数据中的敏感信息,需发展差分隐私等技术。
    • 对抗攻击:模型易受对抗样本、数据投毒等攻击,当前防御进展缓慢。
  2. 滥用防范:AI可能被用于语音*隆、社会工程、虚假信息等攻击,需开发监控系统与安全设计。
  3. 数据经济:通过Shapley值等框架公平分配数据贡献价值,建立负责任的数据经济。

实现AI安全需推动“安全设计”,结合形式化验证与AI辅助证明,构建可证明安全的系统。


七、下一代AI架构的革新与挑战

在圆桌讨论中,青年科学家们指出当前技术路径的局限与未来方向:

  1. Scaling Law的反思:依赖算力与数据堆叠的路径可能遇到瓶颈,需探索更高效的架构与学习机制。
  2. 因果推理能力:当前大模型难以从被动数据中学习因果性,需设计新架构或利用多模态干预数据。
  3. 生成模型演进:Diffusion并非终点,需探索与自回归模型等的结合,并降低创新门槛。
  4. 具身智能突破:大模型可作为世界模拟器或奖励函数生成器,但需解决过拟合、规划能力不足等问题。

未来最值得探索的方向包括:

  • 让多模态大模型具备因果推理与反思能力。
  • 发展超越Transformer的高效架构,实现“压缩即智能”。
  • 利用大模型内部知识推动科学发现与创新。
  • 构建安全、可信、隐私保护的AI系统。

总结

本节课中我们一起学习了上海人工智能实验室在通专融合路径上的前沿探索,包括书生系列大模型、风乌气象海洋模型的最新进展。我们分析了全球AI创新格局,探讨了国家级实验室的协同机制,并深入讨论了AI安全、下一代架构革新等关键挑战。未来,AGI的发展需在技术突破、应用落地、安全可信与全球合作中持续前行。正如周博文主任所言:“We must be there, we will be there.”

4:2024世界人工智能大会产业发展主论坛精华解读与教程

在本节课中,我们将学习2024世界人工智能大会产业发展主论坛的核心内容。我们将把论坛中各位领导、专家和企业家的演讲与讨论,整理成一篇结构清晰、易于理解的教程。课程将涵盖人工智能产业的发展现状、技术趋势、应用挑战以及未来展望,特别适合初学者了解AI产业的全貌。


概述:人工智能产业的现状与机遇

人工智能作为新一轮科技革命和产业变革的核心驱动力,正以前所未有的速度渗透到各行各业,推动社会生产力的整体跃升。中国政府高度重视AI发展,明确提出开展“人工智能+”行动,大力推进新型工业化。本次论坛汇集了全球产业界的翘楚与专家,共同探讨了AI技术如何赋能产业、共护安全、共享成果。


第一部分:政策引领与产业生态构建

上一节我们概述了AI产业的宏观背景,本节中我们来看看中国政府在推动AI产业发展方面的具体举措和上海作为创新高地的实践。

政府层面的战略部署

工业和信息化部副部长单忠德在致辞中阐述了发展人工智能产业对于推进新型工业化的重要性。中国政府将促进智能技术与实体经济深度融合作为主线,主要开展以下四方面工作:

  1. *化开放合作:秉持开放包容、合作共赢的态度,在技术、产品、标准、服务、安全等方面与各国加*交流,推动形成广泛共识的AI治理框架。
  2. 推动产业创新:聚焦关键核心技术和重要智能装备,深化产学研合作,积极培育智能产品、装备和服务。
  3. 夯实产业底座:加快5G和千兆光网建设,深化算网融合,构建智能高效的融合基础设施,并建设高质量的工业数据集。
  4. 加快应用落地:以需求为牵引,推进智能技术在制造、交通、民生等垂直行业的应用,支持制造业企业加快数字化转型。

地方实践:上海的人工智能高地建设

上海市副市长陈杰介绍了上海在建设人工智能高地方面的成果与规划。上海产业规模持续扩大,创新成果不断涌现。

以下是上海在AI生态建设方面的关键举措:

  • 产业规模:规上企业从2018年的183家增长至2023年的348家,产业规模从1340亿元增长到3800亿元。
  • 创新成果:已有34款大模型备案,多款人形机器人原型机发布。
  • 载体建设:打造了总面积达2万平方米的“模速空间”,吸引了80家大模型企业入驻。
  • 未来方向
    1. 夯实基础底座,建设超大规模智能算力设施。
    2. 加大落地赋能,推动AI与传统产业、新兴产业深度融合。
    3. 深化治理规范,探索建立技术标准、基准测试等可信安全治理体系。

国际视角:包容性发展与全球合作

联合国工业发展组织副总干事邹刺勇*调了人工智能在促进包容性工业发展中的作用。他呼吁利用AI弥补数字鸿沟,让边缘化群体也能受益,并通过国际合作,特别是在发展中国家,加*AI能力建设,以支持联合国2030可持续发展目标。

核心公式人工智能发展 + 包容性治理 -> 可持续发展目标实现


第二部分:技术前沿与生产力变革

上一节我们介绍了政策与生态,本节中我们来看看领先企业如何利用AI技术引领生产力变革,以及关于技术路线的深度思考。

大模型:从技术竞争到应用为王

百度创始人*彦宏分享了对大模型发展的观察。他指出,国内闭源大模型的能力已追平或超越GPT-4,但争论的焦点不应停留在模型本身,而应转向应用。

核心观点

  • 开源与闭源:闭源模型在同等参数规模下能力通常更好。开源模型在学术研究上有价值,但在大多数激烈竞争的商业场景中,商业化闭源模型更具竞争力。
  • 应用的价值:没有应用,基础模型一文不值。应避免“卷模型”,转向“卷应用”。AI应用已在快递、网文创作、代码生成等领域产生真实价值。
  • 智能体(Agent)是未来:制作智能体通常无需编码,只需用自然语言描述工作流并配以专有知识库。未来将出现数以百万计的智能体,形成庞大生态,而搜索将是智能体分发的最大入口。
  • 新的工作机会:AI不会完全替代人类,而是创造如数据标注、提示词工程师等新岗位。

代码示例(智能体工作流描述示意)

智能体名称:高考志愿咨询助手
工作流:
1.  接收考生输入的分数、省份、选科信息。
2.  查询历年录取数据库,进行匹配分析。
3.  根据考生兴趣标签(如专业偏好、城市偏好),进行个性化推荐。
4.  以对话形式解答考生关于特定学校或专业的疑问。
知识库:历年高校录取分数线、专业介绍、就业报告等结构化数据。

数字基建:运营商的AI赋能实践

中国电信董事长柯瑞文阐述了对新型数字信息基础设施的理解,它是AI发展的重要支撑。

中国电信的“1+1+1+M+N”AI布局

  • 1个智算云底座:建设并升级数据中心为AIDC(AI数据中心),例如在上海临港建成全国首个单池万卡智算集群。
  • 1个通用大模型:自主研发“星辰”千亿参数大模型,并向社会开源。
  • 1个数据底座:汇聚高质量数据,如通过天翼视联网平台积累的视频数据。
  • M个内部应用:将AI用于网络运维、客户服务、节能降耗(上半年节电近5亿度)。
  • N个外部应用:在政务、工业、教育等领域推出30多个行业应用,服务超7000家政企客户。

中国移动董事长杨杰提出了“AI+”是发展新质生产力的重要引擎。他回顾了从“互联网+”到“5G+”,再到如今“AI+”的演进,指出AI大模型正推动经济社会发展从“+AI”向“AI+”迈进。中国移动将围绕基础设施创新、关键技术创新、产品应用创新三个方向推进“AI+”走深向实。

核心观点人工智能不会取代人类智能,但会重构很多行业。擅长使用AI的人将会替代不会使用AI的人。

深度对话:通用人工智能的路径与挑战

在由猎豹移动傅盛主持的对话中,亚马逊前首席科学家Andreas Weigend和阿里云创始人王坚院士探讨了AI发展的核心问题。

  • 技术路径:两位专家认为,无需过度纠结于“仿生智能”与“生成式智能”的路线之争,关键在于在选定的方向上坚持投入。当前以GPT为代表的技术路线仍有巨大潜力和探索空间。
  • 企业应用难点:瓶颈可能在于数据算力/能源。王坚院士指出,AI对企业的影响是革命性的,它可能催生新的大公司,也可能促使现有大公司“烈火重生”,利用AI重构自身(如苹果公司)。
  • 就业与未来:AI将改变“工作”的定义,更多创造性劳动将成为主流。人类与AI的根本区别在于好奇心、梦想和主动性。AI目前是冷冰冰的任务执行者。
  • 治理与基础设施:AI将深刻影响社会行为习惯和治理规则,需要动态建立新的规范。对于算力和能源瓶颈,应动态看待,新技术会催生新的解决方案。王坚院士特别指出,中国年发电量超过美、日、俄总和,在能源方面具有优势。

第三部分:产业融合与价值链创新

上一节我们探讨了技术本身,本节中我们来看看AI如何与具体产业深度融合,创造新的价值链。

架构创新:云端协同的算力解决方案

华为云CEO张平安提出,在中国算力受限的假定下,应通过端、云、网架构协同创新来构建可持续发展的AI算力基础设施。不应盲目追求终端芯片的先进制程,而应利用中国在网络(尤其是光网络)和能源方面的优势,将计算需求导向云端。

实践案例:华为“云拍照”。将手机拍摄的多张原图上传至云端,利用云端*大算力进行图像处理,最终效果可接近单反相机画质,这证明了云端协同的价值。

专业智能体:严谨行业的落地路径

蚂蚁集团董事长井贤栋分享了AI在严谨行业(如医疗、金融)落地的挑战与路径。通用大模型直接应用于严谨行业存在专业知识缺乏、复杂推理能力不足、交互不等于有效协同三大短板。

蚂蚁的解决方案是构建专业智能体

  1. 专业知识引擎:利用知识图谱和密态计算技术,将多模态、高价值的行业数据抽象成“专业教材”,供大模型学习与推理时调用。
  2. 专家决策框架(FOE):让智能体学习人类专家的思考方式,构建专业推理能力。例如,金融投研智能体“支晓助”已能媲美专家分析水平。
  3. 生态共建:复杂服务(如全流程就医)需要多个专业智能体(医院智能体、专科智能体、医保智能体等)网络协同完成。

生成式AI的2.0时代:应用超级时刻

商汤科技董事长徐立认为,生成式AI正走向2.0时代,其“超级时刻”的标志是深入垂直行业引发广泛变化。实现这一目标需要三大突破:

  1. 高阶思维链数据:解决AI的推理问题,需要人类构造更高阶的思维链数据。
  2. 实时自然交互:实现端云算力协同,支持无延迟的交互体验。
  3. 可控生成:特别是视频生成,需做到高度可控。商汤推出的“Vimi”人像视频生成模型,在形象逼真度、时长和一致性上取得了进展。

终端侧AI:规模化拓展的关键

高通中国区董事长孟樸指出,虽然当前AI研发集中在云端,但未来超过40%的生成式AI工作负载将转移到终端侧。终端侧AI能降低成本、提升隐私性、实现个性化体验。

高通的关键技术

  • 硬件平台:第三代骁龙8移动平台支持100亿参数模型运行;骁龙X系列PC平台提供高算力NPU。
  • 多模态大模型:在手机上运行多模态大模型,实现基于图像输入的多轮对话。
  • LoRA微调:在终端侧实现大模型的高效、低成本定制化。

圆桌讨论:大模型驱动的新价值链

在关于新价值链构建的讨论中,MiniMax闫俊杰、智谱AI张鹏、人形机器人创新中心许斌、御风未来谢陵分享了观点:

  • 大模型能力突破:关键在于将错误率从30-40%降低到个位数(如2-4%),并发展多模态理解能力,使AI能像人一样综合信息解决问题。
  • 人形机器人是通用AI的最佳载体:只有人形机器人能接触最丰富的人类社会数据,是通往通用人工智能的必由之路。预计3-5年可在智能制造产线应用,5-10年进入家庭服务等开放环境。
  • 低空经济即智能航空器:AI对低空经济意味着航空器本身的自主飞行决策能力(如森林灭火、海上搜救)和整个低空空域的智能化调度管理。
  • 价格战与价值链:大模型价格下降是技术进步的必然,但健康的价值链需要各方传递并分享价值。新的价值链特色将是单点技术爆发引发全面突破数据成为核心生产要素,AI最终像水和空气一样成为无处不在的基础设施。


第四部分:可持续发展与以人为本

上一节我们聚焦于产业应用,本节中我们来看看AI如何服务于全球可持续发展目标,以及其发展必须遵循的人本之道。

AI赋能能源转型与工业元宇宙

施耐德电气全球执行副总裁Peter Weckesser指出,未来能源系统是数百万个微电网的集合,AI对于管理这种复杂性、实现减碳至关重要。施耐德通过AI帮助食品饮料、汽车、数据中心、楼宇等行业客户显著提升能效(如数据中心节能超30%)。

核心公式能源系统电气化 + 数字化技术(物联网/AI) = 可持续的未来

西门子全球执行副总裁肖松博士描绘了“工业元宇宙”愿景:AI生成高仿真虚拟空间,人类在其中无拘束地创造,再由AI辅助现实世界的设备将设计变为实物。西门子凭借深厚的工业知识和IT/OT融合技术,正推动工业AI的通用化。例如,其“Industrial Copilot”工具让工程师用自然语言生成自动化代码,极大降低了开发门槛。

深度对话:AI发展的人本之道

在德勤中国主席蒋颖主持的对话中,曾毅、Mark Nitzberg、Robert Trager和星环科技孙元浩探讨了AI的社会影响与治理。

  • 社会目标:AI应是以生态为本社会中的工具,用于增*人类和保护环境,而非创造一个“AI时代”。当前AI更像快速直觉的“系统一”,而非理性推理的“系统二”。
  • 整合挑战:技术挑战在于让AI掌握人类常识;社会挑战在于建立有效的全球治理规则,防止技术滥用。
  • AI的角色:当前AI仍是大规模信息处理系统,可以协助但不能代替人类做重大决策,尤其无法承担道德责任。人类不应像信任朋友一样信任AI。
  • 治理责任:需要政府、产业、学界协同。政府需主导安全测试与规则制定;产业需提供使用指南并证明系统的公正安全;学界需进行前沿政策研究。中国建立的“人工智能安全网络”是一个多方协作的范例。
  • 呼吁与期待
    • 合作:各国、各机构必须携手,为人类共同未来努力。
    • 平衡:在创新、安全、资源分配间寻求平衡。
    • 潜力:关注AI在促进基础研究、实现可持续发展目标上的巨大潜力。
    • 红线:为AI发展划清安全红线,禁止开发危害人类的能力。

总结

在本节课中,我们一起学习了2024世界人工智能大会产业发展主论坛的精华内容。我们从宏观政策与生态构建入手,探讨了AI技术的核心趋势与生产力变革,深入分析了AI与各产业融合创造新价值链的路径,最后聚焦于AI赋能可持续发展及必须遵循的人本之道。

课程揭示了几个关键共识:

  1. 应用为王:技术竞争正从模型转向场景落地,智能体(Agent)将成为主流应用范式。
  2. 融合创新:AI的发展依赖于算力(云网端协同)、算法(模型突破)和数据(高质量、多模态)的融合,以及与实体经济(尤其是制造业)的深度融合。
  3. 生态共建:从开源开放到全球治理,合作共赢是产业健康发展的基石。
  4. 以人为本:AI是服务人类、增*人类的工具,其发展必须可控、可靠、向善,最终目标是提升全人类的福祉。

希望本教程能帮助你系统性地理解人工智能产业发展的当前图景与未来方向。

5:人工智能向善:创新扩大影响论坛全记录与解读 📘

在本课程中,我们将学习“国际电信联盟人工智能向善:创新扩大影响论坛”的核心内容。我们将了解人工智能如何被用于推动联合国可持续发展目标,以及全球各界在人工智能治理、标准化和应用方面的努力与实践。


概述 🌍

本次论坛汇集了来自联合国机构、各国政府、科技企业及学术界的代表,共同探讨如何利用人工智能技术应对全球性挑战,并确保其发展符合“向善”与“以人为本”的原则。核心议题包括人工智能的治理、标准化、伦理以及其在医疗、通信、环保等关键领域的应用案例。


论坛开场与主旨演讲 🎤

论坛以一场融合视觉与声音的动态表演开场,艺术家将1940年至2024年的全球温度异常数据进行了“声音化”呈现,直观展示了气候变化这一紧迫议题。

随后,国际电信联盟及上海市政府的代表致开幕词。他们*调了人工智能作为新工业革命核心动力的巨大潜力,同时也指出必须关注其带来的伦理风险与治理挑战。中国代表介绍了本国在人工智能领域的快速发展,包括拥有超过4万家人工智能相关企业,并表达了与国际社会合作、共同完善全球人工智能治理的意愿。

上海市代表则分享了本地在推动人工智能“技术向善”方面的法规建设与产业培育工作,例如出台首部人工智能地方性法规,并致力于构建包容且审慎的监管框架。


联合国机构视角:人工智能与使命融合 🤝

本节我们介绍了联合国各专门机构如何利用人工智能推进其核心使命。

以下是联合国工业发展组织、国际电信联盟和联合国教科文组织代表的分享:

  • 联合国工业发展组织:该组织将人工智能视为工业发展的“推动者”和“变革者”。其工作重点包括利用人工智能提升成员国(特别是发展中国家)的智能制造、能源效率及供应链管理水平,并通过能力建设帮助各国制定本国的人工智能战略。
  • 国际电信联盟:作为联合国负责信息通信技术的专门机构,国际电联的核心工作之一是建立技术标准。目前,其已发布超过100项与人工智能相关的标准,涵盖多媒体水印、绿色技术等领域。同时,国际电联运营的“AI for Good”平台已成为连接全球创新者、政策制定者和专家,共同解决可持续发展挑战的关键网络。
  • 联合国教科文组织:该组织长期关注新兴科技的伦理问题。其于2021年通过了全球首份《人工智能伦理问题建议书》,为193个成员国提供了在11个政策领域(如教育、数据、环境、性别平等)发展合乎伦理的人工智能的具体行动框架。其核心原则是确保人工智能服务于人的尊严与基本自由。

过渡:在了解了联合国系统如何从战略和伦理层面引导人工智能发展后,我们接下来将目光转向具体的实践与合作项目。


人工智能促进可持续发展的实践案例 📊

联合国各机构正在通过具体项目,将人工智能的潜力转化为实际影响力。

以下是正在开展的部分合作项目:

  • 人工智能促进健康:与国际电联、世界卫生组织合作,聚焦于利用人工智能提升远程医疗和诊断的质量与可信度。
  • 自然灾害管理:与联合国世界气象组织等机构合作,结合人工智能与气候专业知识,为弱势社区开发可持续的灾害预警和应对方案。
  • 数字农业:与粮农组织等合作,利用人工智能创建动态程序,优化农业生产和资源管理。

总结:这些案例表明,通过跨机构、跨领域的协作,人工智能能够为解决健康、气候、农业等复杂挑战提供创新工具。


人工智能治理与国际合作 🏛️

上一节我们看到了人工智能的应用实践,本节我们来看看如何通过治理与国际合作来引导其健康发展。

代表们普遍认为,联合国系统在制定标准、提供政策指导、搭建中立对话平台方面具有独特优势。当前的重点是采取平衡的方法,既要抓住人工智能带来的机遇,也要管理其风险。

关键行动方向包括:

  1. 弥合人工智能鸿沟:通过能力建设、技能培训和在发展中国家建立卓越中心(如在上海新建的全球卓越中心),帮助其追赶人工智能发展浪潮。
  2. 推动标准与评估:发展可测量、可测试的评估方法,并通过标准化工作为全球人工智能治理提供统一的技术基础。
  3. *化实施与问责:将已达成的伦理原则转化为实际行动,建立人工智能造成损害前的预防机制和损害发生后的补救机制,确保人类始终保有监督与控制权。

产业界实践:技术赋能与普惠包容 ⚙️

理论框架和治理原则需要落地。本节中,我们将看到来自领先科技企业的代表,分享他们如何将“人工智能向善”的理念转化为具体产品和服务。

微软展示了其在无线传感和医疗AI方面的研究,例如利用智能手机声波非接触式监测呼吸、开发脑电图基础模型辅助诊断神经疾病,旨在以保护隐私、节能的方式提升医疗可及性。

阿里巴巴介绍了其面向医疗和少数语言群体的AI应用。通过AI模型分析常规CT扫描辅助癌症早期诊断,并开发针对东南亚文化的专用大语言模型,以促进知识在欠发达地区的传播。

中国移动探讨了AI与6G的深度融合。*调未来的6G网络应从设计之初就具备“原生AI”能力,并指出高质量、标准化的网络数据开放对于训练AI、优化网络能效至关重要。

华为分享了其在AI治理方面的思考,提出需通过“发展认识问题,治理促进发展”。他们介绍了从训练数据、模型安全到内容合规、应用安全的端到端治理流程,并呼吁基于不同行业场景制定细化的AI治理标准。

vivo聚焦于利用AI提升残障人士的生活质量。其开发了实时语音转文字、手语识别、视觉辅助(如描述周围环境、识别物品)等功能,让听障和视障用户能更自由地沟通与探索世界。

核心概念示例(AI辅助诊断)

# 伪代码示例:一个简化的AI医疗影像分析流程
def ai_medical_diagnosis(ct_scan_image):
    # 1. 图像预处理
    processed_image = preprocess_image(ct_scan_image)
    # 2. 使用训练好的AI模型进行分析
    prediction = trained_ai_model.predict(processed_image)
    # 3. 输出诊断建议(例如,标识可疑病变区域)
    diagnosis_report = generate_report(prediction)
    return diagnosis_report
# 该模型可以帮助放射科医生提高诊断效率和准确性。

“AI for Good”影响倡议与全球挑战 🚀

国际电联正式发起了“AI for Good影响倡议”,旨在将对话转化为规模化行动。该倡议包括区域规划、扩展挑战赛、政策研究、标准制定和能力建设等内容,并宣布成立全球人工智能指导委员会,汇聚各界领袖共同塑造人工智能的治理方向。

同时,论坛宣布了与国际电联合作的“机器学习挑战赛”,聚焦于利用AI降低移动网络能耗。参赛者需要利用真实网络数据,解决“5G网络流量预测”和“基站可再生能源智能调度”等问题,优胜方案将获得奖励并有机会在全球会议上展示。


总结与展望 🔮

在本课程中,我们一起学习了“人工智能向善”全球论坛的核心内容。我们从联合国机构的战略视角,到产业界的具体实践,全面了解了人工智能在推动可持续发展目标方面的巨大潜力与当前挑战。

关键共识总结如下

  1. 以人为本:人工智能的发展必须坚持以人为中心,确保技术服务于人类福祉,扩大机会,保护基本权利。
  2. 治理与创新并重:需要建立全球协同的治理框架和标准,以负责任的方式引导创新,在发展中迭代治理能力。
  3. 弥合鸿沟:国际社会需共同努力,通过能力建设、技术转移和基础设施支持,缩小发达国家与发展中国家之间的“人工智能鸿沟”,确保技术红利普惠共享。
  4. 跨界协作:应对气候变化、健康危机等全球性挑战,需要政府、企业、学术界和民间社会的深度合作。“AI for Good”平台正是这种协作精神的体现。

人工智能正在深刻改变世界。通过本次论坛的讨论我们认识到,唯有坚持合作、伦理与包容,才能确保这场技术革命引领我们走向一个更加公平、可持续和繁荣的未来。

6:2024世界人工智能大会未来之星创新项目路演全记录 📝

在本课程中,我们将学习2024世界人工智能大会“未来之星”创新项目路演开幕式的完整内容,包括领导致辞、嘉宾主题分享以及四家前沿科技公司的项目路演。我们将深入了解人工智能产业的政策导向、投资趋势、技术融合以及大模型安全、测试、科学应用等核心议题。


开幕式致辞与领导讲话 🎤

尊敬的各位领导、各位来宾、女士们、先生们,大家下午好。欢迎大家来到2024世界人工智能大会“未来之星”创新项目路演开幕式的现场。

AI产业的发展不仅需要领军企业的带头示范,同时也需要创新企业和后起之秀携手共建生态,促进技术创新,为整个产业圈注入全新的活力。WAIC推出“创投生态合作伙伴计划”,并于2024世界人工智能大会特别打造“未来之星”创新项目路演,为创新企业提供具有前瞻性和发展潜力的舞台,助力未来产业的新一代行业大师和链主企业的诞生。

嘉宾介绍

以下是出席今天会议的各位领导及嘉宾:

  • 上海市人才工作局规划研究处创业指导处*凯副处长
  • 东浩蓝生金融集团总裁,上海东浩蓝生投资管理有限公司董事长陈辉峰先生
  • 上海国有资本投资有限公司红腾资本总经理费菲先生
  • 中移互联网有限公司云通信事业部副总经理黄敏华女士
  • 安永大中华区数据智能咨询服务合伙人陈建光先生
  • 东浩蓝生会展集团股份有限公司副总裁裘浩明女士

再次感谢各位嘉宾的到来。同时,主办方还邀请了科创板日报、头部科技等媒体朋友共同关注本次活动,并开通了线上多平台直播。

*凯副处长致辞

面对全球新一轮的科技革命和产业变革,上海正以前瞻视野与坚定决心,积极拥抱创新,加速推进新型工业化,着力培育人工智能这一新质生产力,构建开放包容、充满活力的创新创业生态系统。

近年来,上海正在全力打造“海聚英才”人才工作品牌,已基本形成了大赛、峰会、基地和路演大厅等系列活动和载体。其中,“海聚英才”全球创新创业大赛作为面向全球招才引智和招商引资的国际性赛会品牌,旨在促进创新链、产业链、资金链、人才链深度融合。

“海聚英才”全球创新创业大赛与世界人工智能大会这两个盛会都代表着时代的前沿。两者的结合无疑会进一步促进科技创新的合作交流,加速人工智能技术在各行业的应用推广。

我们深知人才是创新的根基,是推动产业蓬勃发展的关键力量。为此,上海积极搭建各类平台,促进产学研的深度融合,着力构筑人工智能产业高地。

陈辉峰董事长致辞

世界人工智能大会作为推动全球创新和产业变革的重要展会平台,更深层次地展现了各方在推动人工智能健康、安全、有序发展过程中的责任担当和价值理念。

投资人作为人工智能创新生态中最重要的组成部分之一,所怀有的价值取向将很大程度上影响这个生态圈的内生增长。如果将本届大会的主题延伸到投资的维度,我们的理解是“资本向善、责任创投”。

费菲总经理主题分享:投资视角下AI大模型生态发展

上一节我们聆听了领导们对产业生态的宏观展望,本节中我们来看看投资机构如何从资本角度解读AI大模型的发展。

党中央高度重视数字经济的发展。从2023年到2028年,全球大模型市场预计将实现5倍扩张。而中国凭借庞大的单一市场优势以及数字化转型的深厚基础,预计未来大模型市场将有8倍的增长,为本土大模型创业生态企业注入了*劲动力。

从产业链深度剖析来看,美国作为先行者,其大模型及人工智能产业趋于成熟。尽管我国在基础大模型领域已涌现出具备一定国际竞争力的企业,但在算力、模型构建、中间件以及应用等各环节仍面临与全球顶尖企业的显著差距。

面临挑战,我国企业展现出了非凡的决心和韧性,在多个领域已经取得了一定突破。上海作为中国人工智能与大模型产业的璀璨明珠,以其独特的创新生态和政策支持,成为企业成长的沃土。

上海国投福腾资本一直将人工智能产业作为重点方向,助推产业链核心环节的国产化。团队结合大模型产业的六大领域,正在建立起福腾的AI基金矩阵。

今后一段时间内,人工智能一定是引领新一轮科技革命与产业变革的战略性技术,具有溢出带动性很*的头雁效应。大模型领域的革命性创新也一定会出现,这就要求国资机构的使命不仅是战略投资者,更是资源撬动者、赛道引领者和生态构建者。

黄敏华副总经理主题分享:通话,让AI无处不在;AI让通话无所不能

资本为技术发展提供了燃料,而技术的落地则离不开与具体场景的融合。接下来,我们看看通信巨头如何将AI融入传统业务。

中移互联网有限公司是中国移动旗下专注于“通信+互联网”的专业公司。我们的5G-A AI智能通信解决方案,在本届世界人工智能大会中荣获了卓越人工智能引领奖。

我们的方案致力于AI与通信的融合,让每个用户都能实现大模型的自由。通过5G消息与大模型的融合,可以把传统的文旅短信变成用户AI服务的新入口。用户只要通过短信消息,就可以跟大模型去做对话和交互,获取到自己想要的信息。

同时,我们的“新通话”提供了通话中的同声传译服务。在正常通话里面,司机说的普通话会实时翻译给外国朋友听,双方都不需要下载APP或特殊终端,只要像平常一样打电话就可以享受到无缝的翻译服务。

以上两个案例展现了AI跟通信融合,如何让用户非常简单能够用上AI以及用好AI。其技术理念源自于我们对于网络和AI的一个共生的理念和技术。我们把通信网络做了开放,把音视频数据与互联网对接,同时也把算力网络和AI能力做了云边端的算力调度,能够使得在通信的过程中实时调用各种AI能力。

除了翻译功能与大模型结合,通话可以有更多的想象空间。例如,在打电话过程中可以发送语音表情、设置数字人形象;在工作场合可以用上AI来电速记;我们还推出了“视障”服务,如大字幕;以及针对诈骗场景的“守护宝”应用。

我们的新通话能力也支持对外开放,推出了新通话SDK。APP只要集成SDK之后,就可以随时调用我们新通话的一些能力。目前,中国移动拥有全球最大规模的网络和用户,我们基于庞大的通话入口构建新通话应用商店,欢迎开发者、能力方和渠道商来跟我们一起合作,共创AI生态,共享通信价值。

陈建光合伙人主题分享:AI驱动,企业服务智能化

通信技术展示了AI在C端应用的潜力,而在B端,AI同样正在深刻改变企业服务的模式。下面,让我们进入企业咨询领域。

安永是全球领先的审计、咨询、税务、战略与交易的专业服务机构之一。在大中华区,我们服务超过55年,服务过的客户包括众多全球五百*中国企业。

安永在内部一直积极推动和实践人工智能方面的应用。在众多领域,包括审计、产品研发、财务、HR、ESG咨询等,都大量采用了AI技术,用于帮助增长营收、提升效率或缓释风险。

去年随着大模型的职业推出,安永非常重视,投资了14亿美金建设了EY.ai平台。基于这个平台,我们把众多内部数据做了积累和打通,同时也给内部员工提供了大量不同的应用。

EY.aiQ是我们内部的大语言模型应用。我们投资了大量精力,结合过去在专业领域的积累,打造了EY.aiQ大模型来服务内部员工,大大提升了效率。例如,在审计领域,我们引入了生成式AI技术,能够非常快捷地从各种文档库中生成相关分析线索,发现异常。

我们还开发了税务助手、薪资助手、收款助手、合同助手等一系列AI应用。例如,合同助手可以自动识别、比对合同条款,判定合同风险,并给出相关提示。

在国内,我们也基于国内的大模型,开发了mats.ai(或称Y.ai)大模型平台。这款平台结合安永在财务、税务、审计、合同等垂直领域积累的大量数据,以大模型为基础,结合自研系统和企业数据分析引擎,帮助客户快速应用相关模型。

整个安永可以帮助不同的企业提供全面的人工智能服务,包括人工智能规划、人工智能治理服务,以及与初创企业联合,将产品部署到客户侧,提供相应的开发实施和落地服务。

裘浩明副总裁介绍:世界人工智能大会未来生态合作新途径

最后,让我们从大会主办方的视角,了解世界人工智能大会如何构建持续的创新生态。

今年是世界人工智能大会创办第七年,我们在H3馆首创了“全域链接馆”,做了一些新的尝试。整个大会遵循“战略引领、场景应用和以人为中心的价值关怀”的品牌理念,致力于打造有世界格局、中国气派和上海风格的世界级AI行业盛会。

我们的future tech板块精选了112个优质项目,这些项目来自于上海的AI基金、上海国投、奇迹创坛、亚马逊加速器等。在三天中,我们有30多场项目路演,来自80多家投资公司的140多位投资人现场评项目。同时,在舞台中心还有应用场景发布和采购商对接,有几十场需求配对会,现场有超百亿的采购资金。

未来,世界人工智能大会将打造365天AI全域链接,做到与人才生态、学术生态、产业生态、创投生态、国际生态融为一体,共创、共建、共荣、共赢、共享、共治。我们将举办“预见论坛”、产业对接走访、线上AI基点对话、青少年未来领航营等活动,并拓展国际生态合作。

东浩蓝生的人工智能项目致力于打造全球领先的人工智能生态服务商。我们借助WAIC平台,用好WIC平台,把整个行业带动起来,助力于整个产业的发展。


创新项目路演环节 🚀

开幕式为我们描绘了广阔的产业图景,而真正的创新活力来自于一线的创业公司。本节中,我们将聚焦四家各具特色的科技初创企业,看看他们如何用技术解决具体问题。

以下是本场路演的四个项目:

1. 北京阿莱蒙科技有限公司:大模型安全落地与人机价值对齐

我们做的是大模型的安全落地以及人机价值对齐。“对齐”指的是人工智能和人类的价值观以及意图对齐。可以说,目前所有人工智能的问题都是对齐问题。

我们认为大模型成功落地的先决条件是安全。在中国的独特环境中,模型的安全性是市场进入的首要门槛。在未来三年内,AI公司的安全成本将提升至所有AI研发投入的50%。

我们拥有行业领先创新的大模型对齐技术,包括新发布的“大模型Aligner”对齐新范式。我们提供全周期的安全解决方案,包括模型部署前的安全漏洞检测、训练中的RLHF到部署后的外置修正器,可以成功降低大模型的调优成本,显著提升性能与安全性。

我们的技术已实现应用。去年我们首个复现GPT-4 RLHF效果,并帮助百川智能等公司进行大模型SFT与对齐,助力其获得网信办牌照。我们目前是百川、360、智谱、阿里等公司的官方ISV,帮助其落地大模型。

我们拥有多家头部客户,包括中国电信、移动、工行、万华等,在医疗和法律领域有较*输出。团队核心成员来自北京大学,在产业界和安全监管界都有较*影响力。

核心概念示例(对齐技术)

# 简化的安全修正器概念代码
class SafetyAligner:
    def __init__(self, base_llm):
        self.llm = base_llm
        self.safety_filter = load_safety_rules()

    def generate(self, prompt):
        raw_output = self.llm.generate(prompt)
        aligned_output = self.apply_alignment(raw_output, prompt)
        return aligned_output

    def apply_alignment(self, text, prompt):
        if self.safety_filter.is_unsafe(text, prompt):
            # 使用对齐模型进行修正或重写
            text = self.correction_model.rewrite(text, prompt)
        return text

2. Aex Tech:一站式人工智能检测平台

我们搭建一个一站式人工智能检测平台,为人工智能保驾护航。AI在带来便利的同时也会犯错,存在风险。例如,自动驾驶模型可能将卡车误认为天空导致事故;AI生成的虚假信息也被用于诈骗。

人工智能的风险与问题主要包括:鲁棒性与安全问题、数据和模型的隐私问题、公平和道德性问题,以及模型不可解释的问题。

人工智能是一个发展非常快的新行业,不像传统软件或电子设备有成熟的检测认证体系。现有AI模型在进入市场时,缺乏统一和官方的第三方认证检测,这是很危险的事情。各国政府都已将AI管控和治理作为国家策略。

我们提供一站式解决方案,用户只需将数据和模型上传,通过简单操作即可生成测试报告和认证证书。我们的服务包括:传统AI模型的风险评估(鲁棒性、安全性、隐私性、公平性、可解释性)、大模型安全与质量评估、生成式内容检测(AIGC识别)、数据安全扫描以及企业咨询与培训。

我们的平台能帮助客户降低75%以上的测试成本,提高100倍以上的测试速度,大幅降低试错成本。团队源自新加坡高校科研团队,在AI检测与安全方向有7-8年技术积累,发表30多篇顶会论文,成员多参与过AI标准制定。

3. 立百智恒科技:自动化AI测试沙盒平台

我们提供自动化的AI测试沙盒平台。随着AI智能体(如Apple Intelligence)的发展,其行动安全成为新的风险点。例如,智能体可能被恶意指令诱导,执行转发邮件等危险操作。

为了解决智能体及具身智能的安全问题,我们构建了自动化的AI测试沙盒平台。方案源于我们过去一年多在大模型开发中遇到的真实需求,拆解成任务、评估器和测试环境三个模块。

我们分享了过去一年在安全测试中遇到的问题与解决方案:

  1. 测试集本土化:针对中文测试集缺乏问题,我们提出了CMMLU,成为中文大模型最权威评估标准之一。
  2. 降低评估成本:我们将大模型推理加速技术(如vLLM)应用于测评,将评估成本降低了20倍。
  3. 生成式安全测评:我们提出了“Do Not Answer”生成式任务,对大模型安全进行三级拆解测评。该工作入选了斯坦福AI指数报告。
  4. 降低评估成本(再次):针对生成式结果评估成本高的问题,我们使用专有小模型替代GPT作为评估器,实现了200倍的成本降低,并将项目开源。
  5. 智能体(Agent)评估:我们构建了基于Agent的事实性检测评估器,并开源了该项目。针对复杂Agent流程,我们进行拆解评估,准确率提高20%,成本降低80%。
  6. 动态测试构建:针对静态测试集易被泄露用于预训练的问题,我们使用Agent动态构建测试。

我们将这些能力产品化,提供了统一的评估器API,可评估客观题、主观题、实验题,评估准确性大于GPT评估器,并能节约超过50%的成本和30%的时间。

我们团队从MBI孵化,兼具创业者、AI安全研究者及大模型开发者三重身份。我们立足于中东北非地区,提供标准化产品走向全球市场。

4. 超越对称上海技术有限公司:前沿科学大模型

我们研发的科学大模型“前沿大模型”,是一个跨尺度、跨结构、跨学科,用于理解和研究物质世界的基座大模型。

我们认为,AGI(通用人工智能)实现的最高标志,是人工智能能够帮助人类解答理论物理最前沿的问题。因此,我们的Big Bang Transformer模型围绕探索物质世界最深层次问题(如宇宙起源、标准模型、量子引力)而开发。

我们开发了一个能同时学习理论和实验的大模型。我们采集了全球物理、天文、航天等领域约50个大型科学装置和项目的实验数据,围绕此数据集训练了基座科学模型。

我们的模型已在多个场景应用:

  1. 粒子物理:与中科院高能所合作,用大模型对撞机实验产生的粒子数据进行识别,识别准确率比人类最佳算法提高约10%。
  2. 材料发现:用大模型替代传统的密度泛函理论计算,预测材料性能,可将新材料发现周期从5-10年缩短至5个月。我们正与上海硅酸盐研究所等合作寻找高性能材料。
  3. 流体力学与水治理:构建了全方位的流体力学训练基座,用于预测湖泊治理中的关键指标(如透明度、叶绿素浓度),并与上市公司德林海合作。
  4. 生物统一建模:将RNA、DNA、蛋白质的一维序列和三维结构进行统一表征,让模型学习,用于制药、蛋白质设计等任务。

构建统一科学大模型的优势在于,物质世界本身由不同尺度和结构构成。我们的技术旨在将所有尺度和结构的信息统一映射到同一向量空间进行学习。我们认为此次AI革命是“物质世界的革命”,而非仅仅信息革命。只有能解决物质世界问题的模型才具有真正价值。


总结与展望 🌟

在本节课中,我们一起学习了2024世界人工智能大会“未来之星”路演的完整内容。

我们从大会开幕式看到了政策制定者对构建AI创新生态的决心,投资机构对深耕产业链、做“耐心资本”和“积极资本”的承诺,以及产业巨头在推动AI与通信、企业服务融合方面的实践。

在路演环节,我们深入了解了四家前沿初创企业的技术:

  1. 阿莱蒙科技聚焦于大模型安全落地的“最后一公里”——价值对齐,确保AI符合人类意图与价值观。
  2. Aex Tech致力于建立AI的“质检中心”,提供一站式检测平台,为AI模型的安全与质量保驾护航。
  3. 立百智恒专注于用AI测试AI,通过自动化沙盒平台解决智能体(Agent)等复杂AI系统的评估难题。
  4. 超越对称则雄心勃勃地构建统一科学大模型,旨在让AI理解并探索物质世界的根本规律,推动基础科学突破。

这些分享共同揭示了一个趋势:AI的发展正从追求规模参数,走向与安全、治理、测试、垂直应用基础科学深度融合的新阶段。资本、政策、技术与场景正在上海这个世界人工智能大会的平台上紧密链接,共同塑造一个可信、可靠且富有创造力的智能未来。

7:AI+赋能 智算未来 - 联通人工智能论坛解读教程

概述

在本节课中,我们将学习并梳理“AI+赋能 智算未来”联通人工智能论坛的核心内容。我们将重点关注中国联通在人工智能基础设施、大模型应用及产业赋能方面的战略布局与实践案例,并理解其如何助力上海构建人工智能高地。课程内容将严格遵循原文含义,以清晰、直白的方式呈现。


第一节:论坛背景与战略意义 🎯

本次论坛于2024年世界人工智能大会期间举办,主题为“AI+赋能 智算未来”。论坛*调,人工智能是引领新一轮科技革命和产业变革的战略性技术。加快发展新一代人工智能,是赢得全球科技竞争主动权的重要战略抓手。

中国政府高度重视人工智能发展,2024年政府工作报告首次写入“人工智能+”。上海作为改革开放前沿,正积极探索并推动人工智能技术的发展和应用,培育新质生产力。中国联通作为数字信息运营服务的国家队,积极落实“人工智能+”行动,旨在通过本次论坛推动AI基础设施、大模型研发与行业应用发展,助力上海人工智能产业生态集聚。


第二节:中国联通上海临港智算中心发布 🏗️

上一节我们介绍了论坛的战略背景,本节中我们来看看中国联通在算力基础设施方面的核心布局——上海临港智算中心。

国家信息中心指南指出,智算中心投资对AI核心产业及相关产业增长带动效应显著。中国联通提前布局,建设了上海临港智算中心。

该中心是高规格的国家级跨境数据流通枢纽节点,具备以下六大“极致”特性:

以下是其核心创新特性:

  • 极致产出:每亩机架数高达173架,远超行业平均水平。
  • 极致可靠:供电架构采用 2N,制冷架构采用 N+1,满足高等级标准。
  • 极致灵活:可适配 4kW60kW 的不同功率密度应用场景。
  • 极致安全:具备六重安防体系和三路通信线路接入。
  • 极致低碳:采用光伏、储能、液冷等技术,整体 PUE < 1.25
  • 极致运营:利用智慧运营平台实现智能化高效运营。

该中心将全面赋能千行百业数字化转型,助力上海构筑具有国际影响力的人工智能高地。


第三节:领导致辞与政策导向 📜

在智算中心发布后,多位领导发表了致辞,进一步明确了政策方向和对企业的期望。

上海市经信委副主任张洪涛指出,人工智能正深入千行百业。上海已备案34个大模型,未来将继续加大投入,突破核心技术,提升算力支撑,并激发应用活力,赋能产业转型升级。他肯定了中国联通作为重要节点在算力底座领域的贡献。

上海市通信管理局副局长戴斌*调,算力是支撑AI发展的核心资源。上海在用算力规模和运力指数全国第一,智能算力占比超35%。他对上海联通提出三点希望:

  1. 加*算力基础设施建设。
  2. 开展国产计算技术研发,提高生产要素自主可控性。
  3. 协力共筑算力产业新生态。

中国联通上海市分公司副总经理刘彤表示,中国联通将持续加大算力基础设施布局,扩大临港智算中心规模,并推进青浦算力枢纽节点建设。同时,联通的“远景”大模型体系将在本次论坛亮相。


第四节:联通智算能力体系详解 ⚙️

基于领导的战略指引,中国联通详细阐述了其面向人工智能时代的能力体系。上海联通网络部总经理叶*介绍了公司在智算基础设施(资源层)的三大核心能力:AIDC、AI算力和AInet(算力网络)。

1. 适配智算特性的AIDC
上海联通形成了“东西两翼”的AIDC资源布局。重点介绍了位于临港的“国际数据港”:

  • 区位优势:毗邻国际海缆登陆站,具备国际业务落地“零时延”优势。
  • 部署能力:满足大规模智算集群部署的四大高要求——高密度、高用电容量、高组网要求、高安全可靠。整个园区最终可具备 10万卡 计算集群部署能力。

2. 多元并进的AI算力
上海联通坚持国产与主流算力并进原则:

  • 国产智算中心:采用国产化算力+RoCE网络架构,全液冷配套,单集群可满足万亿参数模型训练。
  • 主流智算中心:采用最先进的 H800 芯片与 NDR 3.2T 组网架构,未来将扩展至万卡规模。

3. 以网*算的AInet
网络是运营商之本,中国联通升级新一代算力网络:

  • 算内网络:采用IB和RoCE架构,通过 RDMA 及算网一体调优技术,已实现集群算效整体提升 20% 以上。
  • 算间网络:打造高速直达、弹性服务的智联网络,并研究 ODUk+RDMA 长距无损技术,打造“数据高铁”。
  • 路算网络:构建城市内、长三角、全国 1ms/5ms/20ms 的算力时延圈,通过 SRv6 和切片技术保障用户体验。

为确保高效运营,中国联通启动了“AI星火燎原”工程,培养专家团队,打造端到端的专业化智算服务体系。


第五节:远景大模型与行业应用实践 🤖

拥有了*大的算力底座,人工智能的效能最终要通过模型和应用来体现。中国联通人工智能创新中心副主任丁鼎介绍了联通的“远景”大模型体系及行业落地思考。

联通观察到,当前AI发展面临从“亮眼”到“好用”的挑战,包括:场景数据有限、模型调优人才短缺、数据安全风险等。

因此,联通提出了面向政企的AI落地路线:

  1. 技术+需求双轮驱动:不单纯追求超大规模参数,而是寻求算力、数据与模型版本的最佳性价比组合。
  2. 模型+工具的应用范式:百亿级参数模型结合 RAG、智能体等工具,往往能取得更好效果。
  3. 专属定制服务:将行业专家升级为具备大模型操作能力的专家。
  4. 可信的数据运营服务:解决数据安全问题,培育本地化运营人才。

基于此,联通打造了 1(一套基础模型)+1(一个大模型平台)+M(多种行业模型) 的“远景”大模型体系。该体系已在政务、工业等领域展开实践:

  • 政务领域:在成都、辽宁等地,应用于政策解读、12345热线工单自动填写与分拣、城市事件智能识别等。
  • 工业领域:在南京港,通过“小模型初判+大模型精判”,将质检准确率提升5个百分点以上;在浙江服装企业,辅助产品设计。

丁鼎*调,未来将是“算力+算法+数据+场景”的共研共创模式。联通也正推动“远景大模型市场”建设,开放算力、模型平台和能力,共建产业生态。


第六节:产业合作与生态共建案例 🤝

人工智能的价值在于赋能千行百业。论坛邀请了几家代表性企业,分享了与联通合作的“AI+”实践案例。

中共一大纪念馆:红色文化元宇宙
副馆长阮竣介绍了与联通共建“数字一大”元宇宙项目的探索。项目通过数字化文物、打造VR体验空间、发行数字藏品等方式,构建红色遗址数字世界,让红色文化传播跨越时空,更具沉浸感。

中国商飞:国产民机智能运维
大飞机智能运维创新中心主任彭焕春分享了基于 5G+AI 的国产民机航线智能检查项目。项目旨在开发便携式智能检测设备,利用AI视觉算法辅助机务人员检查飞机外表面损伤,并通过5G网络实现远程专家协同,提升检查效率和飞机运行安全。

罗氏诊断:医疗器械数字化服务
转型与战略总监邢月春介绍了AI在体外诊断(IVD)领域的应用。罗氏诊断与联通合作,打造了智能客户服务平台,实现报修智能预警、AI自助答疑、坐席辅助等功能。通过数字化手段,提升了仪器可用性和客户服务体验,最终让病患受益。

智慧足迹:经济大模型
CEO张岩介绍了作为联通经济军团打造的“经济大模型”。该模型定位为经济研究人员的AI助手,具备智慧问数、知识问答、文献学习、智能报告生成等功能。它融合了宏观经济数据、产业链数据及联通人口大数据,为经济分析提供了新工具。模型采用 RAG 技术增*知识时效性,并利用 AI Agent(智能体) 架构处理复杂任务。


第七节:联合倡议与生态新征程 🌱

在论坛的最后,中国联通上海市分公司政企BG常务副总裁周京代表“算助申城”上海市算力产业联盟,发出了新征程联合倡议:

以下是三点核心倡议:

  1. 打造算力高地:促进大模型迭代,推动“+AI”向“AI+”转变,赋能千行百业。
  2. 构建算力产业生态:汇聚芯片、硬件、平台、模型等产业链上下游企业。
  3. 加*产学研合作:推动算力资源开放共享,夯实算力底座。

随后,中国联通携手木西、随幻、摩尔线程、曙光、超聚变、华坤振宇、华为、阿里、燧原、无问芯穹、蓝马、智谱等众多产业链合作伙伴,共同启动了“生态共创新征程”仪式,标志着产业生态将进一步壮大,共同助力上海打造全球人工智能高地。


总结

本节课中,我们一起学习了“AI+赋能 智算未来”论坛的核心内容。我们从国家战略与上海定位出发,深入了解了中国联通以 上海临港智算中心 为核心的算力基础设施布局,及其 “远景”大模型体系 的产业赋能思路。通过政务、工业、医疗、文化、航空等领域的真实合作案例,我们看到了“AI+”如何切实落地并创造价值。最后,产业联盟的新征程倡议表明,构建开放、协同的生态是推动人工智能高质量发展的关键。中国联通正以“国家队”和“主力军”的身份,与合作伙伴携手,全力推进人工智能与实体经济的深度融合。

8:AI基础设施与算力生态构建教程 🚀

概述

在本节课中,我们将学习人工智能(AI)基础设施的重要性、当前面临的算力挑战,以及如何通过技术创新和生态协同来构建高效、开放、普惠的AI算力底座。课程内容基于“智启新章·算引未来”AI基础设施论坛的核心讨论,涵盖政策导向、技术实践、产业应用及生态构建等多个维度。


1. AI作为新质生产力与基础设施的关键性 🤖

近年来,AI技术作为新质生产力,正以其*大的创新能力深刻影响着各行各业。AI基础设施是否稳定、充沛且具有高性价比,对进一步提升AI生产力至关重要。

核心公式:

AI生产力 = f(算法, 数据, 算力)

其中,算力是算法与数据高效结合的基石。


2. 人才与政策:上海AI产业高地的建设 👥

上一节我们介绍了AI生产力的公式,本节中我们来看看人才与政策如何为算力提供支撑。

随着AI技术的持续创新及我国AI产业的快速发展,国家对AI人才的需求日益旺盛。上海持续推进高水平人才高地建设,着力打造AI产业人才的集聚高地。

关键数据:

  • 上海AI领域产业人才总数约25.7万人,占全国三分之一。
  • 35岁以下青年人才占比超过67.5%,形成了国际化、年轻化、专业化的多层次AI产业人才梯队。

政策支持:
以下是上海为AI人才定制的一系列优惠政策:

  • 引进:积极引进海内外高层次和紧缺急需人才。
  • 培养:推动产学研用深度融合,加*本土人才培养。
  • 保障:在生活保障、安居环境等方面提供贴心服务。
  • 生态:不断优化人才发展服务生态,聚焦人才关心的关键小事。

3. 智能算力:大模型发展的基石与挑战 ⚙️

上一节我们看到了人才政策的支持,本节中我们聚焦于支撑大模型发展的核心——智能算力。

自GPT诞生后,大模型的能力远超此前的AI技术。智能算力作为大模型行业发展的基石,正以前所未有的速度和规模发展,成为推动产业变革的关键力量。

当前挑战:
在智算成为AI产业发展关键要素的背景下,国内算力生态面临独特挑战:

  • 生态差异:国外生态相对集中(如英伟达、AMD),而国内生态非常分散,形成了“百模大战”和众多国产芯片并存的局面。
  • 生态竖井:虽然物理上已将不同种类的算力构成集群,但在软件栈上难以协调打通,导致算力使用方面临复杂的工程挑战。

核心目标:
构建 AI Native基础设施,旨在打破异构生态竖井,高效整合多元算力,实现“M种模型”到“N种算力”的灵活适配与全量利用。


4. 异构千卡大模型混训实践 🧩

上一节我们指出了异构算力的挑战,本节中我们来看一个具体的破局实践——异构千卡大模型混训。

无问星琼联合研究团队,发布了业内首个支持在6种不同芯片上进行交叉混合训练的大规模模型异构分布式训练系统。

面临的核心挑战:

  1. 通信:不同硬件使用不同的通信库,如同使用不同语言,需要高效互通。
  2. 分布式训练效能:异构卡之间的性能差异可能拖垮整体训练效率。

解决方案:

  • 通用集合通信库:实现不同芯片间的高效通信。
  • 非均匀流水线并行拆分方案:根据硬件效率分配最适合的任务。
  • 混训性能预测工具:在训练开始前预测最优拆分策略。

实践成果:

  • 实现了多种芯片组合下90%以上,最高达97.6%的集群算力利用率。
  • 完成了96种不同芯片组合的千卡规模异构混训。
  • 该能力已集成至无问星琼的Findora平台,成为全球首个支持千卡异构混训的平台,可支持700亿参数以上大模型的训练。

代码示意(核心思想):

# 伪代码:异构集群任务调度与拆分
def heterogeneous_training_scheduler(cluster_resources, model):
    # 1. 性能预测
    performance_prediction = predict_performance(cluster_resources)
    # 2. 非均匀任务拆分
    split_strategy = non_uniform_split(model, performance_prediction)
    # 3. 分发任务并启动训练
    dispatch_tasks(split_strategy)
    start_training()

5. 高效调度与容错:保障算力稳定可用 🔄

上一节我们解决了如何用起异构算力的问题,本节我们探讨如何让算力集群更稳定、高效地被用户使用。

高效的调度系统和*大的容错机制是保障大算力集群稳定运行的关键。

调度系统优化:

  • 统一纳管:支持十种以上芯片,建设超万卡级算力系统。
  • 智能调度:平均任务调度延迟在毫秒级,集群资源利用率保持在90%以上。
  • 高可用:多租户场景下集群服务等级协议(SLO)可达99.95%。

容错系统增*:

  • 有效训练时长:提升30%。
  • 异常检测成功率:提升至70%。
  • 检查点读写效率:提高20倍,大模型异常中断时间可缩短至5分钟内。

6. 工程化实践:智能算力运营的样板 🏗️

上一节从平台方视角看了调度优化,本节我们从运营方视角看智能算力的工程化实践。

上海智能算力科技有限公司作为第三方算力服务商,为大规模模型训练提供算力支持,其实践提供了重要样板。

运营模式与挑战:

  • 模式:基于IDC资源、云操作系统和行业理解,提供第三方算力服务,心无旁骛支持大模型研发。
  • 挑战:需解决国产GPU商业化迭代、单卡算力密度、异构混训、跨数据中心调度、软件生态开放等多层次工程问题。

破局思路:
需要从芯片加速迭代算力密度提升集群效能优化跨集群弹性调度软件生态开放五个层面协同解决,并与上下游企业(如无问星琼)紧密合作。


7. AI应用赋能:以人才评鉴为例 🎯

基础设施的完善最终是为了赋能应用。本节我们看一个AI在人力资源领域的具体应用案例——AI面试官。

猎聘集团推出的AI面试官“多面Doris”,基于大语言模型重塑了人才评鉴流程。

系统架构与核心能力:

  • 底层理论:基于麦*利兰冰山模型、胜任力模型等。
  • 核心机制:“一模三问两评一防”
    • 一模:基于岗位的胜任力模型。
    • 三问:基于胜任力模型提问、基于简历提问、智能深度追问。
    • 两评:通过锚点对比和多模态(语义、语音、表情)分析进行科学评分。
    • 一防:实时防作弊系统,包括身份校验、背景监测、AI生成内容检测等。
  • 产品体验:交互简单,支持面试官形象定制,自动生成智能报告。

应用效果:

  • 将某餐饮企业招聘周期从3周缩短至1天。
  • 招聘成本降至原来的1/6到1/10。
  • 实现了招聘流程的标准化、科学化,降低人为因素影响。

8. 圆桌讨论(全):AI 2.0时代的新基建思考 💡

在AI 2.0时代,如何发展新基建以迎接智能新时代?本节汇总了产业专家的核心观点。

AI Native基础设施的特点:

  • 垂直深度:需要针对AI负载特点,从芯片、框架、语言到操作系统进行全栈优化。
  • 本土化创新:在中国多元异构的算力生态下,中间层(Infra)的打通与建设尤为关键。
  • 软硬件协同:需要更开放的生态,让应用、算法、芯片实现深度协同优化。

端侧AI的机会与挑战:

  • 必然性:端侧智能设备将越来越多,AI能力将更贴近用户,甚至改变流量入口和利润分配。
  • 挑战:受限于功耗、算力,需在模型压缩、芯片设计、端云协同等方面进行更极致的优化。
  • 差异化:端侧工作负载与数据中心不同,需针对单用户、低延迟、高隐私等场景设计专用优化策略。

生态构建的关键:

  • 协同共赢:需要芯片厂商、Infra公司、应用企业、高校、政府形成合力,以“组团”方式对抗单点技术差距。
  • 开源开放:积极拥抱开源生态,降低开发者和用户的迁移与使用成本。
  • 产研结合:通过竞赛、课程、书籍等方式培养开发者生态,为长远发展储备人才。

9. 圆桌讨论(二):计算瓶颈的破局之术 🛠️

面对算力需求的指数级增长与摩尔定律的放缓,如何突破计算瓶颈?本节汇集了硬件与软件专家的见解。

破局的多维路径:

  1. 算法创新:Transformer架构可能面临瓶颈,需要探索如MoE(混合专家)等新架构,从根本上提升计算效率。
  2. 芯片与系统级优化
    • 先进封装:利用Chiplet等技术提升单芯片算力密度。
    • 系统架构:借鉴NVLink Switch等思想,通过定制化系统(如NVIDIA的GB200 NVL72)提升集群效率。
    • DSA设计:针对大模型计算特征,在微架构层面进行定制化加速。
  3. 软件与编译优化:通过Triton等编译优化技术,可显著提升训练性能(如案例中提升65%)。
  4. 能效比:液冷等散热技术对建设高密度、绿色数据中心至关重要。

有效算力公式:

有效算力 = 硬件算力 × 调度效率 × 软硬结合效率 × (1 - 故障损失率)

必须从硬件、调度、软件优化、稳定性四个维度共同提升有效算力。

开放生态的实践:

  • 分层合作:与服务器厂商、Infra伙伴、互联网大厂、高校建立不同深度的合作。
  • 拥抱开源:紧密跟进开源模型社区,快速适配,满足应用厂商敏捷迭代的需求。
  • 降低门槛:通过兼容主流生态、提供易用工具、培养开发者社区,逐步构建自主生态。

总结

本节课中,我们一起学习了:

  1. AI算力是新时代的关键基础设施,是国家与产业竞争的战略焦点。
  2. 中国正通过政策引导人才培养,加速建设AI产业高地。
  3. 面对国内外算力生态差异,需要通过异构混训智能调度等技术打破“生态竖井”。
  4. AI Native基础设施的核心是实现软硬件深度协同,让算力易用、好用、普惠。
  5. 算力运营的工程化实践,到AI面试等具体应用,展现了算力赋能千行百业的巨大潜力。
  6. 突破算力瓶颈需要算法、芯片、系统、软件的多维创新,以及全产业链的开放协同
  7. 构建健康、繁荣的算力生态,离不开开源开放、合作共赢的理念,以及持续不断的开发者生态建设

最终目标是推动大模型应用成本实现数量级下降,让AI像水电一样,成为触手可及、无需关心其背后复杂技术的基础设施,真正走进千行百业、千家万户。

9:人工智能新质生产力发展论坛核心观点与趋势解读 🚀

在本课程中,我们将学习2024年长三角协同创新AI新质生产力发展论坛的核心内容。课程将系统梳理多位院士、企业家及专家关于人工智能发展趋势、产业应用、教育变革及中国机遇的深度见解,帮助初学者构建对AI前沿发展的整体认知。

概述 📋

本次论坛聚焦人工智能作为新质生产力的核心驱动力,探讨了其在关键技术突破、跨行业协同、人才培养等方面的巨大潜力。与会专家从技术趋势、产业落地、算力挑战、教育革新等多个维度,描绘了AI赋能千行百业的未来图景。


一、人工智能发展的五大趋势 🔮

上一节我们概述了论坛的整体情况,本节中我们来看看中国工程院院士张亚琴提出的关于大模型与生成式AI的五大核心趋势。

张亚琴院士指出,当前大模型发展呈现五个明确方向:

  1. 多模态、跨模态及多尺度融合:智能体将能处理和理解文字、声音、图像、视频、激光雷达点云、生物DNA序列等多种形态和尺度的信息。
  2. 智能走向边缘(Edge AI):大模型将从云端下沉,部署到个人电脑、手机、汽车、电视等各种终端设备上,实现更即时、更隐私的本地化智能。
  3. 智能体(Agent)的全面发展:AI将具备更*的自主性,能够规划任务、自我升级、自我编程和自动试错,成为能独立完成复杂目标的智能体。
  4. 物理智能(具身智能)的崛起:AI将与物理世界深度结合,通过无人车、无人机、机器人等载体与真实环境交互,学习“世界模型”,实现“既会读书,也会走路”。
  5. 生物智能的远期展望:长远来看,AI将与人类大脑、器官等生物体连接(如脑机接口),形成AI与人类智能(HI)融合的新形态。

核心公式/概念

  • 多模态智能体 = f(文本, 图像, 音频, 视频, 传感器数据...)
  • 具身智能智能体 + 物理身体 + 环境交互 -> 世界模型

二、通用人工智能(AGI)的实现路径与时间线 ⏳

在了解了五大趋势后,我们自然关心这些趋势将引领我们走向何方。张亚琴院士对通用人工智能的实现路径和时间做出了预测。

他认为,当前基于算力和数据堆砌的“规模定律”在未来5-10年仍将有效,但效率瓶颈终将出现。预计5年左右,可能会出现一个全新的AI架构,该架构需包含三层记忆系统(类似人类的DNA记忆、短期记忆和长期记忆),并提升推理能力和透明度。

关于AGI实现,他预测需要15-20年,并分为三个阶段:

  1. 信息智能:多模态AI在文字、视频上通过图灵测试(部分已实现)。
  2. 物理/具身智能:无人驾驶、机器人等能在物理世界通过图灵测试,预计还需5-10年。
  3. 生物智能:实现脑机接口等深度融合,可能再需5年。

核心观点:AI的影响常被“短期高估,长期低估”。当前的AGI定义更侧重于在各领域完成任务的能力超越人类,而非拥有自我意识或情感。


三、人工智能的产业应用蓝海:以农业为例 🌾

理论趋势最终要服务于产业实践。接下来,我们以农业为例,看看AI与机器人技术如何开辟新的产业蓝海。德国国家工程院院士张建伟深入阐述了这一领域。

农业正面临劳动力短缺、老龄化、精细化需求提升及可持续发展等全球性挑战,这为AI和机器人提供了绝佳场景。农业机器人的发展路径如下:

以下是农业机器人的关键应用环节:

  • 自主导航与物流:在无标准基础设施的农田实现自主移动和运输。
  • 机器视觉与监测:用于产量预测、成熟度判断、病虫害检测和作物分级。
  • 智能除草:在禁用除草剂的趋势下,利用AI识别并物理清除杂草,市场潜力巨大。
  • 自动化采摘:针对草莓、蓝莓等高价值作物,是技术攻坚的重点方向。

核心技术栈

# 农业机器人系统简示
农业机器人系统 = {
    “感知层”: [“多传感器融合(SLAM)”, “高分辨率视觉”, “光谱分析”],
    “决策层”: [“多模态大模型”, “*化学习”, “任务规划”],
    “执行层”: [“灵巧操作机械臂”, “自主导航底盘”, “特种作业工具”],
    “平台”: [“ROS”, “边缘计算单元”, “物联网终端”]
}

张建伟院士*调,具身智能是农业机器人的未来。它要求AI具备时间序列理解、空间认知、主动感知和与物理世界安全交互的能力,这与传统AI有本质区别。


四、算力基础与产业协同的挑战与机遇 💻

当AI技术寻求落地时,算力与产业协同成为不可回避的基础议题。国家超级计算无锡中心主任杨广文教授和多位产业界代表在圆桌讨论中聚焦于此。

算力挑战:中国面临算力生态建设的重大挑战。当前国产AI芯片架构多样,但缺乏统一的软件生态、应用生态和标准规范,导致算力使用率不高和开发门槛高。
核心观点:“国产化替代”不是简单替换硬件,而是需要硬件、软件、应用、人才共同构建一个繁荣的生态体系,这是一个长期目标。

产业协同实践

  • T3出行(崔大勇):在出行领域应用“阡陌大模型”,提升供需匹配效率约10-15%,改善安全与客服体验。预计2027年成为自动驾驶商业化运营的拐点。
  • 清华无锡研究院(陈一伦):认为AI最大的机会在于与物理世界结合的“具身智能”(自动驾驶、机器人),中国拥有场景和供应链的独特优势。
  • 云启资本(韩毅):从投资视角看,AI应用正从“数字世界”向“物理世界”延伸。当前在营销、客服、法律咨询、内部增效等“脑力劳动中的体力活”环节落地最快,能直接创造经济价值。

长三角的协同机遇:长三角地区算力基础雄厚、产业需求旺盛、制造业链条完整,具备构建算力网络、制定协同标准、推动AI与制造业深度融合的独特优势。


五、人工智能时代的教育与人才范式变革 🎓

技术的发展最终取决于人才。香港科技大学(广州)协理副校长熊辉教授尖锐地指出了AI时代教育与人才需求的根本性变革。

熊辉教授将人类智能分为四重境界,并指出大模型已在前两重境界超越人类:

  1. 博闻*识(记忆知识)❌ 机器已超越
  2. 触类旁通(跨领域应用知识)❌ 机器已超越
  3. 一叶知秋(推理与预测)⚠️ 机器正在快速逼近
  4. 无中生有(原始创新)✅ 人类仍具优势

因此,教育必须转向培养机器不擅长的能力:

  • 提问能力:提出关键和深刻问题的能力。
  • 鉴赏能力:鉴别价值、判断优劣的能力。
  • 创新能力:从0到1的颠覆性创造能力。

教育重心转移:应从过度追求“人类知晓且可言传的知识”(这部分价值在下降),转向重视:

  1. 可意会不可言传的知识(如动手实践、模型调参)。
  2. AI赋能的启发式创新(用AI改变科研范式)。

人才类型:中国需要从培养大量“金手指”(卓越工程师),转向培养更多“金头脑”(具有创新思维和领导力的战略人才),由“金头脑”带领“金手指”创造“金苹果”(重大创新成果)。


六、前沿探索:端侧模型与科学智能 🔬

最后,我们关注两家前沿公司的技术探索,它们代表了AI模型发展的两个重要方向:普惠化和专业化。

1. 面壁智能(*大海):让大模型走向终端

  • 核心洞察:提出“大模型摩尔定律”——模型的知识密度每8个月翻一番。这意味着同等智能水平所需的算力在持续下降。
  • 技术路径:研发高性能的端侧小模型(如MiniCPM系列),使其能在手机等设备上高效运行,解决云端推理成本高、数据隐私等问题。
  • 愿景:实现智能的“无所不在”,让AI更普惠、更经济地融入千行百业。

2. 斯比驰 & 上海交大(于凯):AI for Science(科学智能)

  • 核心洞察:提出科研“第五范式”——由通用人工智能驱动的联动任务科学研究,而不仅是数据驱动的单点突破。
  • 实践案例:开发化学领域的专业大模型“化学东风”(KMDFM)。它不仅是知识库,更能理解分子结构、谱图等多模态数据,进行人机协同的推理、反思和实验规划,向“虚拟研究员”目标迈进。
  • 关键挑战:科学智能需要可靠性优先的模型架构,而不仅是生成多样性或普通准确性。

3. 第四范式(胡石伟):构建行业AI基础设施

  • 核心观点:行业AI的核心不是简单地将知识灌入大模型,而是用AI解决行业关键竞争力问题(如效率、质量、壁垒)。
  • 方法论:企业需构建“劳动 -> 数据 -> 模型 -> 价值”的闭环。AI价值源于业务过程中产生的数据,并反哺业务形成增*回路。
  • 生态建设:需要行业核心技术与生态设备共同升级,才能完成数据的采集与决策的执行。

总结 🎯

本节课中,我们一起学习了2024年长三角AI新质生产力发展论坛的精髓:

  1. 技术趋势明确:AI正向多模态、边缘化、具身化、与生物融合的方向演进,AGI可能在15-20年内以特定形式实现。
  2. 产业应用广阔:农业等传统行业因劳动力、精细化需求成为AI蓝海,具身智能是核心。
  3. 基础挑战待解:算力生态建设、国产化替代是长期而艰巨的任务,需要产学研协同攻坚。
  4. 教育亟待变革:必须从知识灌输转向培养提问、鉴赏和创新能力,培育更多“金头脑”。
  5. 前沿探索活跃:端侧模型推动AI普惠化,科学智能(AI for Science)开启科研新范式,行业AI需构建数据与价值闭环。

论坛共识在于,中国发展AI拥有应用场景丰富制造业体系完整的独特优势。抓住机遇的关键在于深化技术突破、推动产教融合、构建开放生态,最终让人工智能真正成为驱动千行百业高质量发展的新质生产力。

10:人工智能前沿技术治理挑战与应对措施论坛 🎤

在本节课中,我们将学习人工智能前沿技术,特别是生成式人工智能所面临的治理挑战,以及国际社会、学术界和产业界提出的应对措施。课程内容整理自一场汇集了多位顶尖专家的论坛讨论。


概述:人工智能治理的关键十字路口

当前,人工智能的治理发展已经走到了关键的十字路口。生成式人工智能所带来的挑战是前所未有的。在这个关键时间点上,我们必须意识到人工智能治理也面临着空前挑战。

首先,人工智能技术的发展速度远远快于监管制度调整的速度。首当其冲的便是发展与治理的平衡问题。其次,人工智能所引发的问题前所未有,这使得人工智能监管变得空前复杂。没有任何一个监管机构能够单独管理好人工智能涉及到的各个方面。其三,随着国际格局变化和中美关系复杂化程度的加深,我们越来越认识到,国际社会不太可能形成一个单一的全球性机构来管理和监管人工智能发展的方方面面。因此,就特别需要加*国与国之间、不同领域之间人工智能治理的沟通与合作。

在这样的背景下,我们齐聚世界人工智能大会,组织这场论坛,专门研讨人工智能的治理挑战与应对方案。


第一节:人工智能安全治理的研究走向 🤖

上一节我们概述了人工智能治理的宏观背景,本节中我们来看看姚期智院士从信息技术角度对AI安全治理研究走向的深入分析。

姚期智院士指出,大模型带来了新的风险前沿。以下是其主要风险类别:

  • 信息智能风险:大模型幻觉产生的错误信息可能误导人类;大模型滥用导致虚假信息泛滥;侵犯知识产权等行为变得更容易。
  • 物理与生物智能风险:未来智能机器人进入家庭和工厂,将带来物理风险;AI控制的仪器失控可能造成生物灾难。
  • 生存性风险:通用人工智能的快速增长可能带来失控风险,对人类社会构成生存危机。

面对这些风险,治理路径可以从技术和时间两个维度分类。

以下是主要的治理路径:

  • 短期工程与系统路径:应用传统信息安全技术、生物技术、核技术中的风险分类、评估与管控方法。
  • 长期核心理论研究路径:深入研究AI核心理论,理解AI安全的机理,研究大模型的对齐方法。
  • 政策与技术结合路径:积极探索与技术匹配的治理条例和监管措施。


第二节:大模型时代的数据安全新挑战 🔐

上一节我们介绍了AI安全的宏观风险与治理路径,本节中我们聚焦于大模型时代一个具体而紧迫的挑战:数据安全。

姚院士以两项研究为例,说明了大模型带来的新问题。

以下是两项具体的研究案例:

  1. 隐私数据提取攻击:研究发现,通过特定算法诱导大模型生成文本,可以从中提取出训练数据中包含的个人隐私信息(如住址、年龄),这类似于人类回忆起多年前读过的内容。
  2. 用户隐私保护难题:用户在使用大模型时,其查询问题本身可能泄露隐私。研究致力于开发可行方案,让大模型能够回答用户问题,同时不获知用户的具体问题内容,这借鉴了传统数据安全中的多方安全计算思想。

总体来看,当前大模型时代的数据安全研究尚处早期,类似于网络安全发展初期“攻防博弈”的阶段。未来的重要方向是发展一套核心理论,使研究更系统化。


第三节:构建可证明安全的AI系统 🛡️

除了应对具体问题,从长远看,有没有一劳永逸的解决方案?本节我们探讨构建可证明安全的AI系统的宏大构想。

姚院士介绍了两个有潜力的研究方向。

以下是两个前沿的研究构想:

  • 有益的人工智能: Stuart Russell 提出的“Assistance Game”从博弈论角度出发,旨在设计始终以人类利益为依归的AI系统。其核心是避免预先给定固定的奖励函数,而是让AI通过与人类持续对话来理解并满足人的需求。
  • 可证明安全的AI: 该构想旨在将计算机科学中“可证明安全”的形式化方法推广到AI系统设计。思路是使用一个经过数学证明是安全的小型“白盒”模型作为中介,所有人类与*大AI的交流都必须通过这个安全中介进行,从而防止AI通过花言巧语误导人类。

这些研究旨在为AI安全治理提供根本性的理论基础。


第四节:人工智能安全治理的当务之急 ⚡

从理想的研究构想回到现实,本节我们探讨当前人工智能安全治理最紧迫的任务。

姚院士重点阐述了两大当务之急。

以下是当前治理工作的重点与挑战:

  • 发展与评估对齐方法: 发展如监督微调、*化学习微调等技术,使AI与人类价值观对齐。同时,建立评估大模型安全性的方法与平台。挑战在于方法的可扩展性、对模型能力的影响,以及评估本身的系统化和鲁棒性不足。
  • 结合国情优势,简化治理: 在全球共识下,结合本国优势进行治理。例如,中国拥有完善的实名制身份验证系统和丰富的新科技风险管控经验(如无人机、金融科技)。可以借此建立AI大模型分级体系,实现实体ID映射和全产业链监控,简化治理流程。

第五节:人工智能全球治理的展望 🌍

上一节我们讨论了国家层面的治理举措,本节我们将视角上升到全球层面,看看国际组织对人工智能全球治理的展望。

联合国秘书长人工智能顾问机构成员马瓦拉校长(视频演讲)提出了促进人工智能高效治理的多方面建议。

以下是其建议的核心要点:

  • 培育发展与风险并存的文化。
  • 建立确保AI伦理使用的法律框架,关注透明度、问责和公平。
  • 建立统一的AI标准。
  • 起草治理AI开发、使用和影响的法律。
  • 治理数据、算法、计算系统和AI应用。

马瓦拉校长还介绍了联合国大学全球人工智能网络,该网络旨在联合学术界、产业界、政策制定者和民间社会,共同应对AI挑战,并特别关注赋能全球南方国家。


第六节:生成式人工智能的数据安全治理 💾

数据是AI的基础,其安全治理至关重要。本节我们聆听产业界专家对数据安全治理的见解。

香港科技大学郭毅可教授(通过数字分身演讲)阐述了数据安全治理的路径。

以下是其演讲的核心内容:

  • 国际治理趋势: 各国立法谨慎,避免阻碍创新。欧盟采取全面立法(如《人工智能法案》),英美则偏向市场驱动。数据治理与隐私保护紧密相关。
  • 前沿技术应用: 区块链技术可增*数据完整性与安全性;加密和匿名化技术(如差分隐私)是保护数据的关键;严格的访问控制、权限管理以及监控和审计也至关重要。
  • 治理路径总结: 需建立健全法规、采用先进技术、加*国际合作并遵守最佳实践,以推动负责任和安全的AI应用。

第七节:全球人工智能治理的中国方案 📘

中国在人工智能治理方面有何思考和方案?本节我们通过一份联合研究报告来了解。

清华大学薛澜教授介绍了《全球人工智能治理与中国方案》研究报告的核心观点。

报告提出了构建全球人工智能治理体系的若干主张:

  • 求同存异,凝聚共识: 构建公平公正、综合平衡的国际治理体系,统筹发展与安全。
  • 统筹四个关键方面: 统筹发展与安全;统筹伦理、立法、标准、测评等治理工具;统筹国内治理与国际治理;统筹既有经验与新的实际问题。
  • 尊重规律,合作共赢: 加*算力和数据共享,降低重复建设成本;保障不同治理框架间的互操作性,倡导开放标准与开源技术。

第八节:圆桌对话:治理挑战与多方共治 💬

理论探讨之后,本节我们通过一场圆桌对话,聆听多位中外专家对具体治理挑战的碰撞与思考。

对话由中国政法大学张凌寒教授主持,涵盖了以下核心议题:

  • 最大风险: 专家指出,短期风险包括失业、虚假信息泛滥;长期最严峻的风险是通用人工智能(AGI)可能带来的失控和生存性危机。当前最大的问题是对这些风险缺乏全球共识。
  • 平衡发展与安全: 产业界代表认为,治理应为发展护航,需在发展中治理。建议采取分类分级治理,针对不同风险等级和场景(如医疗与商品推荐)采取不同措施,避免一刀切。
  • 多方主体的角色: 各方需具备参与治理所需的资源(如学界需要算力和平台,政府需要人才,企业需要明确的规则和反馈渠道)。不同社会结构下,各主体的参与方式不同。
  • 全球治理机制构想: 有专家提出“全球人工智能挑战框架公约”的设想,即先达成高层级原则共识,再针对具体问题(如安全风险)制定由主要国家参与的议定书,最终推向全球。
  • 弥合智能鸿沟: 关键在于确保全球南方国家不被排除在AI价值链之外。与其期待所有国家都建立大模型,不如通过技术合作、能力建设(如ICT学院)、以及开发满足当地需求的应用(如小语种互译),使其融入全球AI生态。治理应聚焦于真正跨国界、需国际合作解决的问题。

总结

本节课中,我们一起学习了人工智能前沿技术治理的多维度挑战与应对。我们从宏观风险(生存危机)谈到具体问题(数据安全),从技术构想(可证明安全AI)谈到现实举措(对齐与评估),从国家方案(中国实践)谈到全球合作(联合国框架)。关键共识在于:人工智能治理极其复杂,需发展治理并重,需多方协同共治,需在全球共识下尊重国情差异。最终目标是以人工智能的“善治”,推动人工智能向“善”发展,让全人类共享技术红利。

11:人形机器人与具身智能发展论坛全记录 📝

在本课程中,我们将学习2024年7月4日“人形机器人与具身智能发展论坛”的核心内容。本次论坛汇聚了全球顶尖的专家学者、企业家和创新者,共同探讨了人形机器人领域的最新技术、应用前景和发展趋势。我们将对论坛的致辞、主旨报告、技术发布及圆桌讨论进行系统梳理,重点关注技术突破、产业应用和未来挑战。


论坛开幕与致辞 🎤

本次论坛由世界人工智能大会组委会指导,国家地方共建人形机器人创新中心、中国电子学会等机构承办,主题为“人形机器人与具身智能发展”。

上海市人民政府副秘书长庄木弟在致辞中指出,人工智能是新一轮科技革命的核心驱动力。上海将着力推动人形机器人产业高质量发展,赋能新型工业化。具体举措包括:

  • 开展核心技术研发:推动产学研协同,攻关共性关键技术。
  • 推动产业生态集聚:打造产业集聚区,做好配套服务。
  • 推动示范应用落地:以重大场景为牵引,探索“机器人即服务”新模式,争取3年内实现千台级应用规模。
  • 打造产业发展共性底座:围绕开源机器人本体、大模型、数据集,构建支撑全国人形机器人发展的关键底座。

中国科学院毛明院士在致辞中*调,人形机器人是跨学科研究的典型,涵盖了机械、电气、计算机、认知科学乃至生物学。从产业角度看,它正成为智能制造、医疗健康、家庭服务等行业的变革力量。据预测,全球人形机器人市场规模年增速超过20%,市场潜力巨大。

中国电子学会理事长徐晓兰在致辞中提出,人形机器人是“人工智能与机器人融合创新的产物”,是诸多前沿技术的集大成者。她介绍了中国电子学会在工信部指导下,发起成立“中国人形机器人百人会”、筹建标准化技术委员会等工作,旨在从核心技术突破、应用场景拓展、产业生态建设三方面推动产业发展。


重磅发布:全球首款全尺寸开源人形机器人“青龙” 🤖

国家地方共建人形机器人创新中心首席科学家姜磊主持发布了全球首款全尺寸开源人形机器人“青龙”,旨在破解人形机器人面临的“一高五难”(硬件、软件、软硬解耦、知识积累、人才聚集、安全应用难)问题。

1. 机器人平台技术

由梁振杰博士介绍。“青龙”机器人秉持*对标、通用化、智能化、多模态的设计原则。

  • 基本参数:身高1.85米,体重80公斤,集成43个主动自由度。
  • 动力系统:搭载具有能量回收和稳压管理的电源系统,支持3-4小时全工况续航。
  • 关节模组:搭载两类10种共31个关节,最大关节扭矩396牛·米,最大扭矩密度达200牛·米/公斤。
  • 操作系统:腿部采用高扭矩密度电机加低减速比行星减速器方案;上肢采用高功率密度电机加谐波减速器的SEA(系列弹性驱动器)方案。
  • 灵巧手:搭载七自由度、集成触觉感知的五指灵巧手。
  • 控制系统:采用高速以太总线系统,并搭载具备400TOPS算力的具身智能控制器。

2. 具身智能技术

由田充博士介绍。团队打造了“朱雀”具身大脑和“玄武”小脑模型。

  • 朱雀大脑:以多模态大模型为核心,负责感知、任务理解和决策调度。
  • 玄武小脑:负责具体任务执行,分为轨迹规划模块和运动控制器。轨迹规划基于端到端模仿学习;运动控制融合了*化学习和基于全身动力学的模型预测控制(MPC)方法。
  • 演示:机器人能通过语音指令理解人类意图,并完成“整理桌面”等任务。

3. 开源数据集

由邢博洋博士介绍。数据是驱动具身智能的核心。创新中心致力于构建“白虎”数据集,目标在3年内联合生态伙伴完成1PB(拍字节)清洗后数据集的构建。数据采集方式包括:

  • 全身运动捕捉:用于采集走、跑、跳、抓、拿、放等技能数据。
  • 视觉手部捕捉:用于毫米级灵巧作业数据采集。
    中心提供标准化的数据采集、评估、管理工具,并通过开源社区加速数据标准和专用标准的建立。

4. 智能训练场

由刘宇飞博士介绍。为解决“场景应用难”和“高质量数据获取难”的问题,需要建设智能训练场。

  • 目标:搭建模拟产线,规模化采集数据,并建立检测评估基地。
  • 架构:分为“感、存、算、学、用”五个部分,涵盖数据采集、存储、技能训练(模仿学习与*化学习)和场景应用。
  • 规划:2024年在上海打造100家人形机器人训练场;2027年期待在全国搭建1000家。

“青龙”机器人随后在现场亮相,展示了其初步能力。所有设计资料将在开源社区 openloong.org.cn 发布。


主旨报告精选 💡

上一节我们介绍了中国在人形机器人开源平台方面的突破,本节中我们来看看国际专家和产业界的前沿思考。

报告一:人工智能之后,人类还能做什么?

  • 主讲人:Andreas Weigend(亚马逊前首席科学家)
  • 核心观点:AI的价值在于其对决策的影响。当AI在创作(如文本、音乐、绘画)上已难以与人类区分时,我们不应与之“竞赛”,而应与之“协作”。人类独有的价值可能在于亲身参与和体验,例如现场欣赏音乐会时全神贯注的投入和欣赏。此外,人类内在的、私密的体验(如情感、疼痛)也是AI难以完全复制的。他引用诺贝尔奖得主Daniel Kahneman的观点,提醒我们关注那些可能无法被数据完全捕捉的人类特质。

报告二:东盟制造业中人形机器人的潜力与前景

  • 主讲人:陈智生(东盟智慧产业联盟)
  • 核心观点:东盟制造业市场增长稳定,但各国发展阶段不同。人形机器人在东盟的落地面临高初始成本、技术整合、劳动力习惯等挑战。机遇在于东盟快速的工业化进程、劳动力成本上升以及对自动化解决方案的需求。建议中国企业与东盟的研究机构、大学合作,进行数据和技术共享,并关注各国不同的政策与激励框架。

报告三:穷澈具身大脑与具身技能库

  • 主讲人:卢策吾(穷澈智能联合创始人)
  • 核心观点:解决具身智能Scaling Law(规模定律)问题的关键在于降低训练空间的不确定性。穷澈智能提出了两大技术路径:
    1. 物理常识大模型:将像素理解提升到物理表征理解(如物体的旋转轴、材质属性),大幅降低数据需求。
    2. 力位混合大模型:在决策中融合力觉和位置信息,使控制更鲁棒、更接近人类“下意识”行为,减少计算量。
      团队通过自研仿真平台和低成本数据采集方案(如外骨骼),构建了大规模力位混合数据集,并发布了“穷澈大脑”产品,提供可任意组合的原子技能库。

报告四:具身智能是实现AGI的最有效途径

  • 主讲人:王兴星(宇树科技创始人兼CEO)
  • 核心观点:当前的大语言模型缺乏对物理世界时空和因果的理解,而具身智能通过与物理世界的交互学习,是实现通用人工智能(AGI)更有效的途径。他类比“缸中之脑”思想实验,指出脱离肉体的智能如同活在梦境中。宇树科技展示了其在四足机器人(如Go2)和人形机器人(如H1、Z1)上的运动控制成果,并认为通过深度*化学习,人形机器人的运动能力很快将超越人类。他*调,AI发展已成为一种“信仰”,需要更大胆的投入和探索。

报告五:银河通用:具身多模态大模型系统探索

  • 主讲人:王鹤(北京大学助理教授)
  • 核心观点:通用机器人需要“任务通用性”和“环境通用性”。当前成本和技术下,采用“轮式底盘+上半身”的复合形态是实现全空间作业的务实选择。他指出,依赖遥操作采集真实数据成本高昂且不可持续,仿真与合成数据才是实现泛化能力的关键。其团队通过合成10亿规模的灵巧手抓取数据,清晰观察到了具身智能的Scaling Law效应。基于合成数据训练出的“大脑”(多模态理解)与“小脑”(泛化操作)系统,已能完成开放词汇的指令任务,并在无人零售场景中实现了97%以上的任务成功率。


开发者技术分享 🛠️

以下是两位青年开发者带来的前沿研究分享。

分享一:通过自监督实现AI的终身学习

  • 分享人:胡宇航(哥伦比亚大学博士生)
  • 核心观点:当前AI缺乏人类那种渐进式、可迁移的终身学习能力。他倡导通过自监督学习,让AI像人类一样,在已有知识基础上快速学习新技能。他展示了两个工作:
    1. 人脸机器人共情:让机器人通过照镜子(自监督)学习控制面部肌肉,理解表情与情感的关联。
    2. 整洁概念建模:将整洁场景视为“有序的句子”,让AI通过观察大量整洁与混乱的图片(自监督),学会整理物品,赋予机器人“审美”和内在动机。

分享二:面向安全、敏捷和可交互的机器人

  • 分享人:孙一凡(卡耐基梅隆大学博士生)
  • 核心观点:机器人发展需兼顾安全性、敏捷性和交互性。其所在实验室的工作分为三层:
    • 应用层:在导航、运动、操作领域取得进展,如动态避障、人机协作装配、人形机器人遥操作等。
    • 能力层:关注跨平台的深层能力,如具身感知(柔性触觉传感器)、人机交互(AR技术)、自动化任务集成。
    • 理论层:为核心算法提供安全保证,如提出“完全策略优化(APO)”算法,优化策略表现的下界,控制风险。同时,开发了Guardian*化学习环境,集成了基准算法库和多种机器人模型,以促进社区研究。


圆桌对话:场景落地与产业应用 💬

本节中,我们将聆听四位专家关于人形机器人如何从实验室走向市场的深度讨论。

  • 主持人:姜磊(国家地方共建人形机器人创新中心首席科学家)
  • 嘉宾
    • 张建伟(中国工程院外籍院士)
    • 高峰(上海交通大学教授)
    • 齐国胜(国双科技董事长)
    • 苏航(清华大学研究员)

核心讨论要点如下:

  1. 技术突破方向

    • 张建伟:需在空间理解(动态语义建模)、时间轴操作(使用工具)、交互功能三个维度实现从非具身到具身的跨越。这需要“具身智能”(身体进化,如软硬结合驱动)和“具身AI”(大脑进化)的共同进步。
    • 高峰:从机械角度看,电机驱动可能不是最终方案,未来或需向“人工肌肉”等感知驱动一体化方向发展。应用驱动研发,应聚焦真空、深海、飞机/汽车总装等特定高危或复杂场景。
  2. 产业发展路径

    • 齐国胜:人形机器人是“终极生产力工具”。其发展极其复杂,需要建立产学研用融一体化的创新联合体。在推进各行各业数字化转型的过程中,积累高质量业务场景数据,用于构建世界模型和训练机器人。
    • 苏航:发展具身智能的核心是提升泛化能力,从而通过规模化生产降低单机成本。构建通用的世界模型短期内不现实,应围绕典型场景进行。当前真实数据量远不足,需仿真与真实数据结合
  3. 人才培养与生态建设

    • 苏航:现有教育体系面临AI时代的挑战,如何培养跨学科的机器人人才是需要反思的问题。
    • 共识:人形机器人发展必须依靠创新链、产业链、资金链、人才链“四链融合”。学术界需面向真实产业问题,产业界需保持耐心,共同推动。目标不是简单仿人,而是实现超越人类智能、解放生产力的工具。

总结 🎯

在本课程中,我们一起学习了“人形机器人与具身智能发展论坛”的核心内容。我们看到了中国在开源人形机器人平台“青龙”上的突破,涵盖了硬件设计、具身智能、数据集和训练场等完整技术栈。我们也聆听了国内外专家对技术路径(如物理常识模型、力位混合控制、合成数据)、产业前景(如特定场景落地、生产力工具属性)和未来挑战(如数据、成本、人才)的深刻见解。

论坛达成的基本共识是:人形机器人是多项前沿技术的集大成者,其发展道路漫长且复杂,但潜力巨大。未来需要产学研用紧密协同,以场景和应用为牵引,通过开源开放、数据共享、生态共建的方式,稳步推动这项未来产业健康发展,最终让机器人技术造福人类社会。

12:人工智能投融资趋势与中信实践 🚀

概述

在本节课中,我们将学习2024世界人工智能大会投融资主题论坛的核心内容。课程将涵盖人工智能的宏观发展环境、技术前沿趋势、产业应用实践以及金融资本如何支持科技创新。我们将重点关注上海的发展战略、中信集团的综合金融服务模式,以及产业界与投资界对AI未来的洞察。


一、论坛开幕与领导致辞 🎤

尊敬的各位来宾,本次会议即将开始,请您尽快就座,并将手机等通讯设备关闭或置于静音状态。

欢迎大家来到2024世界人工智能大会投融资主题论坛的现场。我是来自中信证券的朱叶新,担任本次论坛的主持人。

首先,介绍出席今天论坛的嘉宾:

  • 上海市副市长陈杰
  • 中信集团党委副书记、副董事长、总经理张文武
  • 中国社科院学部委员于永定
  • 中国科学院外籍院士樊文飞
  • 中远海运集团党组成员、副总经理陈扬帆
  • 中信集团党委委员、执行董事、副总经理王国权
  • 中信金控总经理曹国*
  • 以及其他来自政府、产业界、投资界和学术界的领导与专家。

人工智能是引领未来的战略性技术,是新一轮产业变革的核心驱动力。本次论坛旨在与国内外顶尖学者、产业界和投资界专家交流碰撞,共同探索人工智能产业发展趋势及在投融资领域的前行之路。


1.1 上海市领导致辞:打造人工智能创新高地 🌉

上海作为人工智能的重点创新之城,正在积极推动人工智能的科研储备、招商引资和应用实践。

上海市副市长陈杰在致辞中指出,人工智能是新一轮科技革命和产业变革的重要推力。上海在抢抓人工智能机遇方面取得了显著进展:

  • 大模型:通过国家备案的大模型数量达到34个。
  • 创新平台:成立了国家和地方共建的人形机器人创新中心,并发布了公版机。
  • 算力与数据:正在组建大规模计算集群,并加*高质量语料供给。
  • 产业规模:人工智能产业规模超过3800亿元,位居全国前列。
  • 生态建设:设立了总规模1000亿元的三大先导产业母基金,40余家机构入驻大模型创新生态社区“模速空间”。

面向未来,上海将重点推进以下工作:

  1. 算力基础设施:加快芯片研发,打造算力集群,推动异构计算训练。
  2. 模型发展:追踪国际先进水平的万亿级大模型,同时积极推动各行各业应用的垂类模型。
  3. 数据语料:依托浦江国家实验室打造国家语料库,加*数据加工与市场化供给。

陈杰副市长呼吁投资界更加关注在上海人工智能产业生态发展中涌现的大量初创型中小企业,并给予金融资本支持。上海将继续营造一流营商环境,深化与国内外企业、科研院所和投资机构的合作。

过渡:上一节我们了解了上海作为创新前沿城市的发展蓝图。接下来,我们将视角转向本次论坛的主办方之一——中信集团,看看这家综合性企业集团如何践行金融与科技的融合。


1.2 中信集团领导致辞:金融与实业并举,支持AI发展 💼

中信集团是金融与实业并举的国有大型综合性跨国企业集团,也是数字化转型的先锋。

中信集团总经理张文武在致辞中表示,中信集团坚持“两手抓”:

  • 一手抓金融支持:融合金融资源,全力服务人工智能产业和科技创新企业发展。
  • 一手抓技术应用:聚焦人工智能技术应用,推动自身产业转型升级。

在金融支持科技发展方面,中信集团主要从四个方向发力:

  1. *化股权融资功能:成立中信股权投资联盟,管理规模超3000亿元,发挥券商优势提供融资服务。
  2. *化信贷服务功能:创建区域科创中心和200余家科技先锋支行,科技金融贷款余额达3500亿元,服务专精特新企业。
  3. *化跨境服务能力:打造以香港为支点的跨境服务体系,助力企业走向全球资本市场。
  4. *化智能驱动:在智能投顾、投研、风控等场景实现创新应用,提升服务精准性。

在产业应用方面,中信集团推动人工智能与传统产业深度融合:

  • 完善创新体系:建成137个创新平台,在金融基础设施、生物育种等领域突破关键技术。
  • 促进产业升级:以中信泰富特钢和中信戴卡为例,通过AI技术深度融合,在研发、生产、能效等方面取得显著改善,成为全球“灯塔工厂”。

张文武总经理表示,中信集团将进一步发挥综合金融优势,支持科技型企业发展,加大投资力度,开放应用场景,与各界朋友携手把握人工智能发展趋势。

过渡:在了解了政策与产业层面的宏观布局后,我们需要思考:人工智能的蓬勃发展需要怎样的宏观经济环境作为土壤?接下来,我们将聆听经济学家的分析。


二、主题演讲:宏观环境与技术前沿 📈

2.1 宏观经济视角:为AI发展创造良好环境 📊

中国社科院学部委员于永定发表了题为《加大财政扩张力度,力争实现5%GDP增速》的演讲。

他指出,人类经济发展主要由科技革命推动,但科技发展也离不开繁荣稳定的经济环境。当前,实现今年5%的GDP增长目标至关重要,有助于扭转经济增速的下降趋势,提振市场信心。

通过从需求侧(消费、投资、净出口)构建简单的预测模型进行分析:

  • 公式:GDP增速 = (消费占比 × 消费增速) + (投资占比 × 投资增速) + (净出口占比 × 净出口增速)
  • 基于年初假设(消费增速5%,净出口贡献为0),为实现5%的GDP目标,需要基础设施投资增速达到约11.7%。
  • 结合1-4月实际数据(消费增速4.1%,制造业投资增速9.7%,房地产投资增速-9.8%,基建投资增速6%),为抵消消费放缓的影响,当前基础设施投资增速需达到约12.7%。

这意味着存在较大的资金缺口。于永定委员建议,应实施逆周期调节的财政政策,通过增发国债来支持基础设施投资,从而稳定经济增长,为包括人工智能在内的科技发展创造良好的宏观经济环境。

过渡:宏观经济的稳定为技术创新提供了基础。那么,人工智能技术本身目前处于什么阶段?又有哪些值得关注的方向?接下来,让我们转向技术专家的视角。


2.2 技术前沿洞察:AI = 机器学习 + 逻辑推理? 🧠

中国科学院外籍院士樊文飞发表了题为《AI等于机器学习加逻辑推理》的演讲。

他首先指出当前风口上的大模型存在明显缺陷:

  1. 可解释性与溯源困难:欧盟法规要求AI决策必须可解释。
  2. “不可能三角”:理论证明,大模型难以同时满足准确性、公平性和鲁棒性
  3. 逻辑表达能力有限:尚未达到一阶谓词逻辑水平。
  4. 幻觉问题:可能产生看似合理实则错误的信息,在关键领域代价高昂。
  5. 投入产出反思:巨大的算力和数据投入对生产效率的实际提升有待验证。

因此,他建议投资界关注大模型,但不必盲目跟风。行业大模型对精度要求更高,挑战也更大。

樊院士提出,AI赋能产业的目标应是“成本低、见效快、可解释”。他介绍了一种将机器学习模型作为谓词嵌入逻辑框架的方法,开发了“钓鱼城”系统,实现了机器学习与逻辑推理的统一。该系统在多个行业应用中取得成效:

  • 新能源电池:将电芯化成分容流程从120小时缩短至4小时,产能提升80%,误差率仅万分之六到千分之一。
  • 网络攻击预测:在头部央企上线,将攻击识别精度提升85%以上。
  • 新药研发:在靶点识别和老药新用方面,预测结果与实验高度吻合。

此外,樊院士还给出其他投资建议:

  • 数据准备基地与算力基地同等重要:高质量的训练数据是提升模型性能的关键,其技术门槛不亚于算力。
  • 关注基础软件:中国在标准化基础软件(如数据库)领域与国外差距巨大,但意义重大。他介绍了团队自研的“崖山”数据库系统,在性能与生态兼容上表现优异。

总结:大模型机遇与挑战并存,并非唯一选择。逻辑推理与机器学习结合、数据质量提升工具以及基础软件等领域都蕴藏着重要的投资机会。

过渡:技术突破需要产业落地,而产业升级离不开金融活水的灌溉。接下来,我们将深入了解中信集团如何系统性构建科技金融服务体系。


2.3 中信实践:构建科技金融服务体系 🔄

中信集团副总经理王国权分享了集团服务科技创新、支持新质生产力发展的实践。

中信集团着力构建 “以股权投资为主,股、贷、债、保联动” 的科技金融服务体系:

  1. 打通股债联动全链条:近三年累计完成股权和债券融资9.7万亿元,助力245家企业上市。构建评估企业创新能力的“第四张报表”,科技金融贷款余额超3500亿元。
  2. 创新股权服务新模式:以中信股权投资联盟为牵引,管理基金规模超3000亿元,聚焦“投早、投小、投长期、投硬科技”,直接投资孵化超1000家科创企业。
  3. 推进专精特新全覆盖:为国家级专精特新企业提供全牌照、全周期解决方案,服务覆盖率超70%。
  4. 构建综合服务新体系:首创“人家企社”服务体系的中信企业家办公室,聚合资源破解企业成长烦恼。

面向未来,中信集团将从以下方面加大服务力度:

  • 加大股权投资:聚合长期资金,聚焦前沿技术,加*投后管理,拓展多元退出渠道。
  • 优化信贷供给:创新信贷产品,打好“投贷联动”组合拳,关注企业专利、成长性等指标。
  • 放大债券势能:拓宽科创债发行主体,加大品种创新力度。
  • 构筑保险防线:健全多方共保体系,树立全生命周期保险服务理念。
  • 健全协同生态:开展信息共享、机制共建、拓宽融资渠道。

过渡:金融服务的最终目的是赋能实体产业。在人工智能时代,传统产业巨头如何转型?让我们看看航运领域的实践。


2.4 产业应用案例:AI赋能智慧航运 🚢

中远海运集团副总经理陈扬帆分享了集团构建数字化供应链的实践。

中远海运聚焦三个面向搭建数字化供应链:

  1. 面向内部的数字运营:运用AI优化全球运营。例如,90%的空箱调运通过AI实现;船舶配载方案生成时间从小时级缩短至分钟级;通过航线优化,船队每月节油达1200吨。
  2. 面向客户的一体化解决方案:为不同客户提供标准化、行业化、战略嵌入式的物流服务,并迭代行业垂类大模型“COSHIPPING”。
  3. 面向合作伙伴的全球供应链生态:牵头创立基于区块链的全球航运商业网络(GSBN),提升国际贸易效率。其中,区块链提单解决方案已签发超22万单,大幅降低贸易成本与风险。

陈扬帆总期待与金融企业深化合作:

  • 转变融资方式:利用区块链、IoT、AI等技术,基于供应链真实数据构建智能风控模式,降低中小企业融资门槛。
  • 创新投融资产品:探索符合航运科技类企业的多元化金融产品,更好推动产业升级。

过渡:产业与金融需要更紧密的链接平台。作为综合金融服务平台的代表,中信金控如何发挥作用?


2.5 平台赋能:中信金控与股权投资联盟启动 🌐

中信金控总经理曹国*介绍了金控平台如何汇聚金融全牌照优势,服务科技创新。

中信金控旗下持有银行、证券、信托、保险、基金等全金融牌照,致力于提升财富管理、资产管理和综合融资三大核心能力。为更好地服务实体经济,创设了中信股权投资联盟。

中信股权投资联盟服务体系旨在打造以股权投资为主,股、贷、债、保联动的支撑体系:

  • :提供境内外IPO、并购重组、再融资等服务。
  • :提供积分卡、科创贷、成果转化贷等特色信贷产品。
  • :提供科创债、科创票据等债券承销服务。
  • :搭建担保与风险共担体系,提供科创企业专属保险。

联盟通过“中信企业家办公室”为企业提供“人、家、企、社”多维度综合服务,陪伴企业全周期成长。

随后,论坛举行了 “中信股权投资生态圈”启动仪式,标志着多方合作全面提升科技金融服务能力的新起点。

过渡:在了解了各方的实践后,我们需要站在更高的视角,洞察全球人工智能的趋势与中国的独特机遇。接下来是智库研究报告的发布。


三、趋势发布与市场展望 🔭

3.1 智库报告:人工智能的全球趋势与中国机遇 📄

中信证券首席科技分析师许英博发布了中信智库研究报告《人工智能的全球趋势与中国机遇》。

报告指出,全球市值最高的三家公司(微软、苹果、英伟达)分别对应了PC、移动互联网和人工智能三轮科技浪潮。英伟达过去20年市值增长1000倍,其“起飞式增长”背后是长达30年、累计超400亿美元的研发投入。

报告总结了五大全球趋势:

  1. 大模型持续迭代:AGI从“冲刺”变为“马拉松”。
  2. 算力规模蓬勃成长:科技巨头竞争AI高地,未来算力市场预期巨大。
  3. 高品质数据或将耗尽:合成数据的重要性显著提升。
  4. AI应用逐渐落地:在硬件端(AIPC、AI Phone、机器人)和软件端(Copilot)看到进展。
  5. AI驱动电力需求增长:节能技术(如液冷)重要性凸显。

报告同时分析了中国的五大机遇与挑战:

  1. 算力供需不平衡:国产算力方案重要性提升。
  2. 大模型算法差异化发展:在跟进中寻求场景突破。
  3. “三化”并举:以AI反哺信息化、数字化,提升企业竞争力。
  4. AI+产业:凭借丰富场景和私域数据形成差异化优势。
  5. 数字能源兴起:能源是AI计算基石,孕育新投资机遇。

过渡:科技创新企业的发展离不开资本市场的支持。我国的资本市场为科技企业提供了哪些助力?


3.2 资本市场视角:服务科技自立自* 💹

上海证券交易所市场发展部副总经理卢大雄分享了资本市场服务科技创新的举措。

上交所科创板自设立以来,就致力于服务国家高水平科技自立自*,主要服务“硬科技”企业。具体措施包括:

  • 坚持硬科技定位:完善科创属性评价指标,确保企业符合国家战略、掌握关键核心技术。
  • 构建稳定生态体系:推出双创债、科创债等创新融资品种,设立多元化上市标准,已支持54家未盈利企业上市。
  • 优化政策制度:畅通上市公司融资渠道,优化并购重组机制。2022年至2024年6月底,科创板公司再融资募资合计2279亿元,用于科技创新领域。

卢总表示,交易所将加速完善金融支持政策体系,全面提升服务科技创新的能力。

过渡:理论、趋势和平台都已明晰,最终要落实到具体的金融服务行动上。中信体系内的金融机构有哪些具体实践?


四、中信金融实践分享 🏦

4.1 银行实践:中信银行的科技金融答卷 📝

中信银行投资银行部总经理匡彦华介绍了中信银行打造差异化科技金融的“六大特色”:

  1. 体系引领:设立专职团队、专门风控体系和专项资源。
  2. 服务新质生产力:聚焦国家重大科技项目、专精特新企业,覆盖率分别达49%和61%。
  3. 创新驱动:提供全生命周期产品,如纯线上“科创易贷”、打破传统审批逻辑的“积分卡”审批等。
  4. 面向资本市场:陪伴高价值科技企业成长,助推其登陆资本市场。
  5. 构建多元生态:汇聚政府、园区、私募、券商等资源,赋能企业。
  6. 深化协同联动:借助中信集团协同效应,与投行资委会、股权投资联盟深度合作。

4.2 证券实践:股权投融资助力科技金融 📈

中信证券首席投资官高愈湘分享了股权投资市场的观察与中信证券的实践。
当前市场呈现“募资本土化/国资化”和“投资偏好两极分化”的特点。尽管市场经历调整,但新一代信息技术、人工智能等领域仍不断涌现优秀企业。

证券公司可提供全产业链服务:

  • 直接投资:作为耐心资本筛选标的。
  • 投行服务:提供财务顾问和保荐承销服务。
  • 研究支持:提供宏观、产业到公司的全视角智力支持。
  • 交易服务:提供上市后的股权质押、大宗交易等综合服务。

中信证券的投资策略包括:培育耐心资本、以全球化视野助力中国企业出海、践行国家战略从“换道超车”和“自主可控”角度寻找优质企业。

4.3 投资控股实践:创投点亮科技 💡

中信投资控股副总经理金建华指出,人工智能发展面临“死亡之谷”高概率、创投行业“投资难、成长难、退出难”三座大山的挑战。

中信集团凭借金融、产业、科技三大综合优势,提出两大特色投资策略应对挑战:

  1. 产业和资本联动:与产业龙头、上市公司合作,解决投资的专业性、安全性和流动性问题,关注“看得准、投得进、长得大、退得出”。
  2. 境内和境外联动:利用海外网络,将愿意进入中国的高科技企业引进来,加速国内科技进程。

过渡:在了解了各机构的实践后,让我们最后听听产业界与投资界在一线碰撞出的思想火花。


五、圆桌对话:产业与资本的双向奔赴 💬

圆桌嘉宾围绕“投融资助力人工智能产业发展”展开讨论,核心观点如下:

  • 产业资本 vs. 财务资本

    • 产业资本(如小米)更注重战略协同和长期布局,能陪伴早期项目,周期更长。
    • 财务资本需考虑回报周期和退出,但在产业发展中提供重要流动性和保障。
    • 两者协同发力,产业资本指明方向,财务资本提供流动性。
  • 投资布局思路

    • 小米集团:通过“自研+投资”布局,自研小爱同学、智能驾驶等,同时投资多家大模型公司。
    • 摩根资产管理(二级市场):跟随产业发展进程投资,当前阶段关注

13:AI生产力落地实践教程 🚀

在本课程中,我们将学习如何将生成式人工智能(AI)应用到千行百业,使其成为有效的生产力工具。课程内容基于“未来生产力:千行百业的AI落地实践论坛”的分享整理而成,涵盖了AI的优势、挑战、应用场景及具体实践案例。


概述:AI从理论到实践的跨越 🌉

过去一年,生成式AI技术飞速发展。如今,核心议题是如何将这项技术应用到产业界,使其成为人们工作的好帮手。钉钉作为领先的AI智能助理平台,携手众多客户伙伴,在大模型重塑产品和业务场景方面积累了丰富的落地实践经验。


一、生成式AI的核心特点:优势与挑战 ⚖️

上一节我们概述了AI应用的背景,本节中我们来看看生成式AI本身的核心特点。

生成式AI与其他人工智能有本质区别,它拥有显著优点,但也存在致命缺点。

其核心优点包括:

  • 擅长生成(而非搜索):能够创造类似自然人的、流畅的答案。
  • *大的语义理解:能够理解复杂的、充满潜台词的对话语境。

其核心缺点包括:

  • 不保证结果质量:不负责生成结果的正确性、可靠性、真实性、安全性、隐私性。
  • 存在“幻觉”:对于有严格正确答案的问题或逻辑,有时会生成错误答案。这是由其基于概率生成的本质决定的,无法根本消除。

核心概念公式生成式AI = *大的创造性 + 不可避免的“幻觉”


二、关键应用原则:错误敏感度分析 🎯

理解了AI的特点后,我们不能盲目应用。本节将介绍一个关键原则,帮助您评估AI在特定领域是否适用。

在应用生成式AI系统前,必须首先判断应用领域的 “错误敏感度” 。即,如果AI出错,造成的后果有多严重。

以下是三种典型的错误敏感度场景:

  1. 高敏感领域:错误会造成严重后果(如医疗诊断、核电修复)。错误容忍度极低,需极其谨慎使用。
  2. 中性敏感领域:错误造成的损害与正确带来的效益基本相当(如高频股票交易)。只要正确率超过50%,就可能产生净收益。
  3. 低敏感领域:错误影响很小,但能极大提升效率(如写诗、作画、生成营销文案)。可以大胆使用。

决策公式
系统可用性 = (正确率 × 正确收益) - (错误率 × 错误损害)
通过计算此值,可以理性判断AI系统在特定场景下能否带来净价值。


三、行业落地实践案例精选 🏢

理论需要实践来验证。以下是不同行业将AI助理融入具体业务,提升生产力的真实案例。

案例一:制造业——云南白药的生产知识AI助理 🏭

云南白药将AI助理应用于复杂的生产环节,解决知识传承与即时查询的难题。

以下是其实现的功能:

  • 研发辅助:员工询问“水包油乳液的稳定策略”,AI助理5秒内给出完整答案并定位原文,替代了翻查多份资料的工作。
  • 生产排障:生产线突发故障(如温度升高),员工描述现象,AI助理快速提供图文并茂的解决方案,打破技术壁垒。
  • 质量检验:质检人员可通过提问获得对应的检验方法及原文链接,提升检验效率。
  • 政策解读:AI助理学习外部最新政策,为质量管理人员提供完整的解读参考,免去人工整理。

过渡:看完了制造业的案例,我们再来看看家居定制行业如何利用AI改造其长链条的服务流程。

案例二:家居行业——金牌橱柜的数字化服务员工 🛋️

金牌橱柜面对产品非标、服务链条长、咨询问题重复率高的挑战,引入了钉钉数字员工。

以下是其解决方案:

  • 统一知识库:整合634份文档,告别预设问题列表,直接维护答案文档,准确率随知识库完善持续提升至83%。
  • 流程深度集成:连接86条OA流程、ERP、物流等内部系统。员工通过语音或文字即可唤起流程,例如扫码即可完成补单或返修申请。
  • 服务工单闭环:知识库无法解决的问题,自动转人工工单,并实现全流程留痕、可跟踪、有时效约束的闭环管理。
  • 未来展望:计划将AI应用于海外多语言客服、行政、研发图纸管理、合同审查等场景,并探索AI赋能“智慧小店”的新商业模式。

过渡:服务流程的优化显著提升了效率,而在航空销售这类系统庞杂的领域,AI又能如何化繁为简呢?

案例三:航空业——深圳航空的销售全能助手“肖邦” ✈️

深航销售平台面临系统繁多、知识庞杂、一线人员负担重的问题,他们创造了AI助理“肖邦”。

“肖邦”主要提供四类帮助:

  • 帮我查:解答常见问题、查询渠道信息、销售数据、客票溯源,甚至查询食堂菜谱。
  • 帮我做:自动生成周报、创建违规证据收集页面(结合图像识别票号),极大简化工作流。
  • 帮我算:通过自然语言查询整体或各营业部的销售情况,无需编写SQL语句。
  • 帮我想:学习撰写销售指导意见,将知识、数据与系统串联,形成策略。

核心洞察:AI让知识、数据和系统“活”了起来。未来的应用趋势是,用户只关注结果,而后端的业务应用将逐渐接口化、隐身化,由AI助理作为统一的交互客户端。


四、钉钉的AI生产力平台:降低创造与协同门槛 🛠️

众多案例的背后,需要一个*大且易用的平台支撑。本节介绍钉钉如何通过技术创新,降低AI应用的门槛。

钉钉致力于成为AI时代的低门槛生产力创作平台,其核心定位有三:

  1. 低门槛创作:让AI应用开发像说话一样简单。通过“拟人操作”技术,用户只需演示一遍流程,AI即可学会并泛化,实现用自然语言指挥软件操作。
  2. 高密度协同:将AI助理作为新角色引入组织协同网络。支持多助理协同(在群中像真人一样协作)、多场景感知(主动发现业务异常并发起动作)、多模态互动(用语音、视频等更自然的方式与数字世界交互)。
  3. 数据价值驱动:在创作与协同中积累高质量数据,并通过AI赋能数据消费。数据可作为训练语料、个人化记忆、智能分析对象、业务感知源和决策辅助,真正成为生产要素。

一个综合案例:钉钉内部的“超级服务助理”
该助理能感知群内或私聊中的技术问题消息,自动分析问题并利用记忆(职责表)指派给对应负责人。问题解决后,相关人员只需在帖子下回复“已解决”,助理即可感知并自动关闭工单。同时,它能应要求自动生成团队服务数据报告并定期发送。


五、更多创新实践掠影 🌈

除了上述行业,AI助理正在更多领域开花结果。

  • 政务领域(杭州公安):打造“公安政务助手”,集成9大板块知识,提供多语言政策解读、业务办理一键直达、意见智能反馈的闭环服务。
  • 农牧领域(铁骑力士):打造“智慧养殖专家”,为养殖场长提供日程管理、知识问答、费用报销(语音填单)、物联网数据查询等一站式服务。
  • 金融领域(横琴人寿):实践“轻场景、微投入”策略,开发“智能核保顾问”、“智能陪练”(多AI角色模拟销售对话)、“智能问数”等场景,降低合规风险,提升培训与数据分析效率。
  • 物流领域(环世物流):推出“掌柜助手”,用中文对话解析复杂的国际物流询价需求,对接海量实时运价,并自动生成带公章的标准报价单,重塑传统、低效的询报价流程。
  • 企业服务领域(华夏数科):发布企业选址助理“小云”,结合2700个开发区数据、产业知识库与VR实景,为企业提供从需求分析、园区匹配、政策比对到方案生成的全链路智能选址服务。
  • 商业创意领域(墨见科技):与钉钉集成,为品牌方提供“潮流阅读-风格整合-内容生成-定向发布”的AI创意引擎,助力产品设计和营销内容生产。

总结与展望 🚀

在本节课中,我们一起学习了生成式AI落地实践的完整图谱:

  1. 理性认识技术:明确生成式AI“聪明但不保证正确”的双面性,理解“幻觉”的必然性。
  2. 把握核心原则:在应用前,务必进行错误敏感度分析,以此决定使用的方式与程度。
  3. 借鉴行业实践:千行百业已涌现出大量将AI用于知识管理、流程简化、数据分析和客户服务的成功案例,其思路具有普适参考价值。
  4. 利用平台赋能:像钉钉这样的AI生产力平台,正通过降低创作门槛、增*智能体协同、激活数据价值,让每个组织和个人都能更容易地拥抱AI。

展望未来,开放共享的AI生态是通往智慧未来的必经之路。通过持续的技术革新与生态共建,AI将深度渗透工作场景,重塑生产模式,最终成为触手可及、普惠大众的核心生产力工具。

行动倡议:立即审视您工作或业务中的痛点,思考哪些属于“错误不敏感”或可通过人机协作管控风险的场景,尝试用AI的思维去创造您的第一个数字员工或智能助理。

15:隐私计算与大模型数据可信融合 🛡️🤖

课程概述

在本节课中,我们将学习隐私计算如何作为关键技术,解决大模型发展中的数据安全与隐私挑战,并促进数据要素的可信流通与价值释放。课程内容整理自行业论坛的多位专家分享,涵盖了技术原理、行业实践、法律视角及未来展望。


第一节:隐私计算的重要性与时代背景 🌍

我无法亲临上海世界人工智能大会现场,但很高兴通过视频与大家交流。

尊敬的各位领导、来宾、女士们、先生们,线上的观众朋友们,大家下午好。欢迎来到2024世界人工智能大会“隐私计算助力大模型与数据可信融合发展论坛”。我是主持人霞飞,很荣幸与大家相聚。今年已是隐私计算论坛陪伴大家的第四年。

在充满变革与机遇的AGI时代,大模型重构了技术底座,加速了行业的颠覆性变革。其中,高质量专业数据的流通与共享,是推动大模型技术应用快速进步的关键要素。

如何运用隐私计算解决数据大规模应用带来的安全及隐私挑战,已成为行业热点话题。今天,我们齐聚一堂,集结众多海内外顶尖高校的著名教授以及行业专家,重点探讨这一议题。

期待本次交流能够全面链接产业链各环节,构建起隐私计算互联网生态圈,探寻平衡数据利用与隐私保护的最佳路径,助力大模型与数据可信融合发展。


第二节:开幕致辞与隐私计算的核心价值 🎤

首先,请允许我荣幸地介绍今天出席活动的领导与发言嘉宾。

接下来,让我们以热烈的掌声,有请加州大学伯*利分校计算机科学教授宋晓冬女士为本次论坛致辞。

大家好,谢谢大家。这次能为会议致辞非常荣幸。因为我长期在美国任教,所以这次致辞用英文来讲可能比较顺利,请大家包涵。

大家好,非常荣幸能为这次重要的隐私计算会议致开幕词。我是宋晓冬,加州大学伯*利分校计算机科学教授,也是伯*利全校性“负责任去中心化智能中心”的主任。

我长期从事隐私计算领域的研究,因为我个人坚信这是一个非常重要的问题。如今,随着AI技术的进步和广泛应用,这个问题变得愈发重要。

众所周知,AI技术的巨大进步主要由三个关键点推动:算法、算力和数据。在算法方面,本质上同类的算法已存在很长时间。当然,算力方面有很大改进,但只要有资金,就可以购买算力。归根结底,数据是构建优秀模型的重要壁垒,也是任何公司或机构构建特定应用模型的独特资产。

当我们谈论数据并利用数据赋能AI时,当然面临许多挑战。首先,由于隐私担忧等问题,大量数据仍被锁在数据孤岛中,许多有价值的数据未被充分利用。有讨论和估计认为,当前的基础模型已经使用了互联网上大部分可用的文本数据。然而,我们仍有许多非公开的、私有的宝贵数据,如果能利用这些数据构建更好的模型,将极具价值。

数据用于构建AI的另一个重要问题是,大量数据本质上是由用户贡献的,包括创作者、艺术家等。但不幸的是,这些用户贡献的数据所产生的价值,并未公平地归属回原始数据生产者和创作者。这带来了另一个挑战。

展望未来,我们如何构建更好的模型,如何更好地解决这些数据相关问题?隐私计算提供了一项关键技术,既能解锁这些数据的价值,也能恰当地将数据创造者和生产者贡献的价值归属回去。

隐私计算可以为AI模型的更好发展和AI技术的更广泛应用提供重要的基础技术。

谈到隐私计算技术本身,它实际上涵盖广泛谱系,包括硬件辅助技术(我们称之为可信执行环境TEE或安全飞地),以及完全基于密码学解决方案的纯软件方案,包括全同态加密、安全多方计算,甚至零知识证明等技术。

一件令人兴奋的事情是,我们在所有这些不同前沿都看到了隐私计算的巨大进步。在基于密码学的解决方案方面,我们从算法和实现层面都看到了改进。这类技术在过去几年中甚至出现了数量级的性能提升。同时,也有关于为其中一些技术(如同态加密)构建硬件加速器的讨论和实际规划。

另一方面,硬件辅助解决方案,即安全飞地TEE,我们也看到了巨大的进步。我自己的工作涵盖了两方面。但特别地,我想以硬件解决方案(TEE和安全飞地)为例,分享一些观点和例子。

如你们所知,我的团队与伯*利及其他合作者在大约五六年前开发了第一个开源、端到端的安全飞地,名为Keystone。我们当时的目标是认识到构建安全飞地的重要性,它可以作为构建安全系统的基础,并赋能隐私计算以解锁数据的价值。同时,我们也认识到实现透明度和建立开放生态系统的重要性,以确保整个社区能够验证这类解决方案的安全性,因此开源解决方案至关重要。

当时,我们还启动了一个名为“开源安全飞地研讨会”的会议。实际上,包括英特尔、Arm、谷歌等全球众多组织(我认为超过30家)齐聚一堂,讨论安全飞地的未来发展。

我可以分享几个轶事。一是大约五年前,英伟达团队访问了伯*利。我们当时的目标是说服英伟达,尽管我们有CPU的安全飞地,但为GPU配备安全飞地或机密计算能力也非常重要。我们解释说这不会太困难,而且会非常有帮助。我不确定我们对此有多大贡献,但当H100推出机密计算功能时,我们真的非常高兴看到这一点。

在研讨会上,如我所说,我们大约五六年前启动。五年前,我做出了一个预测:十年内,大多数芯片都将拥有安全飞地。现在五年过去了,我们还有五年时间来验证我的预测是否正确。但至少目前,我认为我们正走在非常好的道路上。现在,大多数服务器CPU芯片已拥有安全飞地。而且,随着英伟达GPU具备机密计算能力,未来所有先进的英伟达GPU芯片都将拥有机密计算能力。我认为,在隐私计算领域,这是一个惊人的时代。我们可以预见,未来几年,随着新芯片投入云端,大多数云服务器实际上都将拥有安全飞地能力。

有了硬件方面的这种支持,以及我提到的基于密码学的软件方案方面的许多投资,我认为隐私计算领域正处于一个拐点。许多事情,即使我们多年前就在讨论这些问题,但当时无论是硬件还是软件方案都尚未完全成熟。现在我非常兴奋,我认为整个领域真的来到了一个拐点。

有了这项技术,正如我之前提到的,它具有巨大的能力和影响力。一是当然可以为数据提供更*的安全性和隐私保护,也能为计算结果提供更好的完整性保证,从而真正作为安全和隐私保护计算的基础。

另一部分是,鉴于数据具有非竞争性属性。与物理对象不同,只有一个人可以持有该对象。但对于数据,一旦数据被他人复制,原始数据所有者就失去了对该数据副本的控制。这也是为什么我们真的需要隐私计算技术,这样我们可以在数据上进行计算,同时确保数据不会被复制或窃取。

这本质上可以帮助形成一种新型资产,称为数据资产。据我了解,中国现在也有数据保护以及数据资产的新政策。隐私计算本质上是构建数据资产的基础构件和平台。没有隐私计算,我们就无法谈论数据资产。数据不是资产,因为任何人如果想在数据上计算,就必须复制数据,然后你就会失去对数据的控制。因此,隐私计算是数据资产的必要组成部分和赋能者。

回到数据对AI和构建AI模型的重要性,隐私计算因此也是构建更好AI的关键赋能者。

我还想稍微拓宽一下范围。本次活动聚焦于隐私计算,但我也想简要地进一步拓宽范围,说明一些其他相关主题,这些主题在讨论隐私计算和数据资产时也非常重要。

一个部分是,如我们所知,隐私问题非常复杂,本质上发生在多个层面。一是在计算层面,即隐私计算。另一层面是保护计算结果,防止其泄露原始输入的敏感信息,因为原始输入可能是敏感的。我们与其他合作者的一些工作表明,这些AI模型即使我们能完全保护计算过程,但学习到的模型本身实际上可能记住大量原始敏感训练数据。攻击者仅通过查询模型,甚至无需知道模型细节,就可以从原始训练数据中提取敏感信息。因此,在我们训练这些AI模型和发展AI技术时,除了计算层面,我们还需要思考这一层面的隐私问题,以保护计算结果不泄露原始输入的敏感信息。

再进一步拓宽,当我们谈论数据资产时,正如我最初提到的,另一个重要问题是,我们也希望确保最终输出(例如训练好的AI模型)在产生价值并获得价值时,这些创造的价值也能恰当地归属回原始数据贡献者。尤其是展望未来,确保AI技术真正惠及每个人非常重要。因此,探索如何恰当地将创造的价值归属回原始数据贡献者,对于公平的价值归属以及为数据贡献者提供良好激励以贡献更多数据非常有帮助。我们早期的一些工作首次提出了一个使用夏普利值的严格数据估值框架,以计算数据估值,即模型创造的价值如何归属回原始数据点等。当然,这仅仅是第一步,仍有许多开放性问题。实际上,将价值归属回原始数据贡献者(包括创作者等)的最佳方式是什么?例如,AI模型潜在的版权问题或版权侵权问题也是当今的一大问题。

首先,正如我提到的,我对隐私计算处于拐点感到非常兴奋。最后,我想以我的几个预测结束。第一个预测我重复一下,即使五年前,我也说过十年内大多数芯片将拥有安全飞地。我希望这能在五年内真正实现。下一步是,十年内,大多数计算将以隐私保护的形式进行,例如在安全飞地中。最后,我们希望未来能看到数据资产成为一种重要的资产类型,也能看到新型实体(如数据信托等)被创建,以帮助管理用户数据,并帮助用户从其数据中获得更大价值。

在此,我欢迎大家参加这次关于隐私计算的重要会议。谢谢。

感谢宋教授的精彩发言。相信未来隐私计算作为基石,必将推动大模型与数据的可信融合发展。


第三节:行业实践:绿色算力与数据可信流通 ⚡

接下来,首先有请金和平先生上台为大家分享。

尊敬的各位朋友,今天借世界人工智能大会的机会,跟各位分享一下我们三峡集团在人工智能产业生态构建方面的一些实践。

应用生态大家都非常清楚,算力、算法和数据缺一不可。在此基础上,可以支撑众多的应用。三峡集团在整个算力、算法、数据方面,围绕长江流域以及可再生能源(水、风、光等能源)的开发,做了一个系统完整的布局。

首先是先进绿色算力方面。大家最近听得比较多的是马斯*以及西方很多观点都提到,算力的尽头是电力,因为所有的0和1都离不开电的支撑。近年来,特别是去年大模型爆发后,算力增长引发了新一轮对数据中心基础设施,即电力供给、能源供给的快速增长。

过去的普通计算、云计算、超算在未来算力需求和能源消耗中的比重会逐渐降低。人工智能计算离不开能源的支撑。这里有个大概数据,不同口径统计不一样,目前整个数据中心的耗电量大概在2到3个三峡的年发电量之间(三峡多年平均发电量约1000亿度)。实际上,今后整个算力对电力需求的增长,相对于其他行业会上升得更快,这个比重会越来越大。特别是大模型训练带来的能源消耗是巨量的。所以,绿色算力,包括蚂蚁等互联网公司以及国际算力巨头,都要求能源消耗绿色化,这也带来了很大挑战。

算力加能源,从我们国家战略布局上看,也很早就提出来了,包括发改委近几年的“东数西算”布局。因为西部绿色能源更加富集,能够把算力逐步向西部引导。工信部出台的算力基础设施也提出了算力加能源的耦合模式。未来的电力系统,能量供给的主体肯定会向以风光为主的新能源替代方向变革,国际上也是一样。我们国家每年电力供应的增量80%以上都来自于风和光。但从能源行业来看,算力未来将是增长最快的负荷之一。目前负荷增长最快的是电动车,每年的电力消耗增长也非常快。而且在全球范围内,未来终端能源消费中,煤、油、气目前占比最高,但未来要完成“3060”双碳目标,也要往电能上转。数据中心显然是一个非常重要的、也是增长最快的电力消费场景之一。

所以,算力需求的快速增长,也将有效带动能源生产和消费模式创新,促进能源行业绿色低碳转型和能源产业的高质量发展。

在绿色数据中心、绿能算力协同耦合的模式上,总的来看,在我们国家还没有得到很好的破题,目前还处于初步探索阶段。第一种当然是绿电直供型,即能源企业依靠自身电站发电,绿电直供数据中心。例如,我们在三峡坝区所在地建了一个目前体量最大的零碳数据中心,依靠自己的水电绿电直供。

第二种是绿电交易型。目前电网上的电还是以火电为主,很多企业就付出额外溢价购买绿电。例如,苹果的iCloud数据中心在乌兰察布、贵州都是以这种模式,购买电网中绿电企业直供的绿色电力。

第三种是源网荷储一体化数据中心。这种模式目前也还只是初步探索,例如中国电信在青海做了尝试,三峡也做了很多探讨。

还有一个是在数据要素流通方面。今天论坛的主题是可信数据计算流通,我们也在做一些探索型的工作。三峡主要在长江流域的开发、治理和保护方面,是国家的国家队。我们在这一块构建了一个围绕流域开发治理的数据要素流通交易平台。

长江流域不用讲,上海就属于长江流域,是我们国家经济绝对的主要引擎,经济总量和人口都占近一半,拥有丰富的数据资源和广阔的应用场景,包括经济、社会、生态、交通、水资源、能源等。

我们正在做的一个工作是,面对长江流域开发治理保护的各项专项业务目标,打造一个可信数据空间。当然,这个可信数据空间除了共享、交易、流通以外,也可以为目前的大模型提供训练数据。我个人的观点是,我们国家发展大模型最大的优势还是我们的语料和场景,由于产业发展速度快,相对于美国可能更加丰富。我们可以为模型训练数据企业提供一个安全可控的分析平台。刚才教授讲到的各种技术,包括数据不动、程序动、可用不可见、分享价值等,我们都在不同的组织之间应用。长江流域的可信数据空间或流域要素流通平台,不光涉及企业,也有政府、科研单位、社会组织。数据在不同组织之间流动,不光是技术,还有不同的模式,是我们打造的一个数据要素汇聚平台。

另外,在模型层面,我们也打造了一个行业大模型,取名叫“大禹”大模型。因为我们是治水出身的。大家都知道,我们在长江上游建的骨干水库主要功能是防洪。我可以骄傲地跟大家讲,这两天上海如果没有受到洪水侵害,肯定是因为我们上游的几大水库都减小了下泄流量。我昨晚从武汉赶过来,武汉办公楼门前的江滩平台已经被淹了。平时我们可以在长江边散步,但这两天不行。三峡这几天下泄的流量,来水大概2万多立方米每秒,我们仅下泄一半。所以,这样一个面向水、电行业的整体架构,我们分为基础层、行业层和应用层来构建大模型的整体解决方案。

当然,技术层我们主要用行业内的通算层面,与业界如百川、星火、华为、电信等都有合作,做通用的大模型AI服务。在行业垂直AI服务方面,我们做了大量工作,比如防洪、水资源管理、泥沙、电站运维巡检等,构建这些垂直模型。在场景方面,我们具体在电力生产、防洪和泥沙方面开展了一些探索工作。

其实,现在做行业大模型有很多,特别是传统产业有一个“不可能三角”:泛化性、经济性和专业性。如果做得太通用,对行业不适应;模型规模过大,训练成本过高,传统产业难以承受;泛化能力*了,专业性又不够。所以,行业大模型是人工智能落地的最后一公里。从通才往专才转移,我们经过近两年的实践,做了大量探索,在高性价比、泛化能力*、保证数据安全方面都做了一些探索。时间关系不细讲,我们还在路上。

“大禹”模型是国内首个水利水电行业大模型。现在的知识问答已经相对成熟。过去,防洪“20年一遇”、“30年一遇”、“百年一遇”都搞不清楚。经过大量语料训练后,可以非常专业、权威地解答,包括对员工的培训、数字提升方面起到了很好的作用。办公助手等通用功能上,也为企业提升运营效率做了一些有益探索。

我们未来的布局是在三位一体战略下构建AI应用生态。首先是绿色算力的供给能力。三峡是全世界生产绿色电(不含碳的电)最多的企业,每年不含碳的电量超过4000亿度。我们的风光装机是5000多万千瓦,水电装机能力和发电量都是世界领先。特别是海上风电,算力需求较大的区域,我们都有规模非常大的海上风电开发,也在布局深海海上风电。这一块,世界上最大的清洁能源源源不断地供应上海,上海有将近三分之一的电来自三峡集团的六座大坝。

零碳数据中心我刚才也提到,我们在三峡坝区已经打造了一个。另外,我们在韶关和腾讯合作,在内蒙古与华为合作,都在进行一些算电协同。刚才跟电信的宝骏总交流时,他特别说对算电协同或绿电算力耦合特别感兴趣,希望我们能形成一个相对成熟的模式,现在还属于探索阶段,因为电力体制比较复杂。但我们在三峡坝区已经打造出了一种成功模式,包括节能方面利用江水能源。

在可信数据流通方面,长江流域数据要素平台分了10多个专业,数据商店也分了10多个分店,有不同的“店长”。举个简单例子,水文数据(水的流量和水位),各个单位都在建水文站,长江委、三峡、各地政府都在建。要形成一个完整的水文数据,我们却形成不了,怎么办?他的数据也不可能完全共享,资产是人家的。通过可信计算、数据流通的相关技术,能够把很多专业数据形成一个完整的数据产品,大家来进行共享、互换或交易。我们组建了长江数据要素联盟,产学研用各单位参与,以武汉为中心,有几十家单位参加。这个平台目前已经上架了100多款产品,交易量还不算太大,我们也想跟在座的各位企业家、科研单位一起探讨,把这块做大。

例如,我们做的流域水体含沙量动态监测、泥沙问题、建水库后泥沙下泄情况、地震地质灾害监测等,都是很专业的数据。

在可再生能源领域,我们最近建设了首个AI靶场。过去,水、风、光都是不确定的自然资源,预测总是不准,特别是中长期更不靠谱,短期也不行。我们建立了一个可再生能源AI靶场,用于气象高精度预测和功率预报,即水电、风电功率预测、光伏功率预测。特别是在风功率预测靶场,中国最领先的功率预测厂家都已到我们的靶场来PK。我们选用最好的模型为风电场服务,考核损失电量一下子降低了20%,精度提高得非常快。这对整个能源系统的安全和场站经营运行效益提升都非常显著。水温预报我们也来做靶场,这个月训练数据就会出来。

最后,我热诚地希望大家,三峡集团作为全世界最大的清洁能源企业,愿意和在座的各位合作。我们上游做好绿色能源供给,中游为各位提供我们丰富的场景和积累的各方面数据,下游也可以为大家提供丰富的场景,包括我们的靶场,提供一个大家相互提高、竞技的AI舞台和靶场,共同推动整个长江流域或未来清洁能源开发的高质量发展。

好的,感谢金总的精彩演讲。我们相信,先进绿色算力、可信流域数据、大禹行业模型三位一体的应用实践,一定会构筑可再生能源领域的人工智能示范标杆。


第四节:从通算、智算到密态算力:演进与展望 🔐

接下来有请蚂蚁集团副总裁、首席技术安全官韦韬先生,

16:可信大模型助力产业创新发展论坛精华教程 📚

概述

在本节课中,我们将学习2024年世界人工智能大会“可信大模型助力产业创新发展论坛”的核心内容。课程将涵盖大模型技术的发展现状、可信人工智能的构建、产业应用实践以及未来展望。我们将以简洁明了的方式,整理并翻译论坛中的关键发言,帮助初学者理解大模型技术及其在产业中的创新应用。


篇章一:大模型产业应用的机遇与挑战 🚀

1.1 论坛开幕与领导致辞

本次论坛由世界人工智能大会组委会办公室指导,新一代人工智能产业技术创新战略联盟主办,蚂蚁集团承办。论坛主题为“可信大模型创新应用,激活产业新智生产力”,旨在探讨如何打造准确、专业、真实、严谨、可控、透明、安全合规的可信大模型,推动其助力千行百业高质量发展。

中央网信办网络安全协调局副局长王银康在致辞中*调,人工智能是新一轮科技革命和产业变革的重要驱动力量。他提出四点关于人工智能安全治理的看法:

  • 坚持包容审慎、确保安全的原则:鼓励创新,同时对危害国家安全、社会公共利益的风险及时采取措施。
  • 坚持风险导向、敏捷治理的原则:科学认定和分类风险,动态更新防范措施。
  • 坚持纪管结合、协同应对的原则:综合运用技术和管理措施,明确各环节安全责任。
  • 坚持开放合作、共享共治的原则:推动全球人工智能安全治理国际合作,共享最佳实践。

工业和信息化部科技司副司长刘伯超在致辞中提出三方面建议:

  • *化技术支撑:加*人工智能治理基础理论和前沿技术研发,特别是可解释性研究。
  • 加快产业实践:产学沿用各方携手加*风险研判与规则共商,构建人工智能发展治理提升的正向循环。
  • 坚持开放合作:推进数据开放共享,*化政策规则标准对接,推动建立科学合理的人工智能国际治理体系。

1.2 推动发展可信人工智能

中国网络空间安全协会理事长赵泽良以“老程序员”的身份分享了对大模型发展的思考。他指出,当前的大模型(基于Transformer的语言模型)在生成任务中存在不确定性,但在分析和判断任务中表现优异。因此,应重视大模型在专业领域、细分领域和垂直领域的应用。

赵泽良还提到,大模型的发展需要注重理论创新,突破现有技术框架。他呼吁关注大模型对环境的影响,并科学有效地发展技术,避免盲目追求参数规模和数据量的增长。

1.3 鹏程云脑与脑海系列大模型

中国工程院院士、鹏程实验室主任高文介绍了鹏程云脑计算平台和鹏程脑海系列大模型。鹏程云脑2是目前全球计算密度最高、算力规模最大、训练速度最快的AI计算平台,连续8次在Top500榜单中夺冠。鹏程云脑3正在建设中,算力将达到16000P。

鹏程脑海系列大模型包括7B、33B和200B三个版本,其中200B模型训练成本接近5亿人民币。高文院士*调,中国需要自己的大模型底座,以应对国际技术限制。鹏程脑海模型将通过开源方式,赋能产业生态发展。


篇章二:大模型技术创新与应用基础 🛠️

2.1 大模型进展与思考

智源研究院理事长黄铁军从技术角度分析了大模型的发展。他指出,大模型基于神经网络训练,其智能来源于数据驱动,而非人为设计的规则。这种自底向上的方式使得大模型具有*大的能力,但也带来了不可解释性和不确定性。

黄铁军将通用人工智能(AGI)分为五个级别:

  • Level 1:认知水平低于人类,可替代部分人类智能。
  • Level 2:认知水平全面超越人类,但仍可建立理性信任。
  • Level 3:具备具身智能,感知和运动能力超越人类。
  • Level 4:产生自我意识。
  • Level 5:人工智能自主发展,不再依赖人类数据。

他认为,当前大模型处于Level 1阶段,未来10到20年可能逐步向更高级别发展。

2.2 垂直领域大模型与人工智能体

浙江大学人工智能研究所所长吴飞介绍了“智海”系列垂直领域大模型。他指出,大模型的核心能力在于预测下一个单词,并通过下游任务微调,将这种能力迁移到实际应用中。垂直领域大模型(如司法、教育、金融)通过高质量领域数据训练,能在特定任务上媲美甚至超越通用大模型。

吴飞还提到,人工智能体(AI Agent)是大模型与工具结合的关键,能够将大模型的“大脑”与“手和脚”连接起来,完成复杂任务。浙江大学已将人工智能纳入通识课程,培养学生的人工智能素养。

2.3 大模型可信应用架构

中国信息通信研究院人工智能研究所所长魏凯分享了大模型可信应用架构的思考。他指出,大模型在行业中的应用正从简单场景向复杂场景延伸,但落地过程中仍面临诸多问题。他提出从五个方面体系化保障大模型应用的可信性:

  • 数据源头:加*训练数据和微调数据的质量管理。
  • 模型专业增*:结合知识计算与概率推理,提升模型专业性。
  • 内容生成可控性:通过检索增*生成(RAG)和工具调用,增*生成内容的可控性。
  • 智能体开发:将大模型封装为智能体,提升生产力。
  • 持续迭代与评测:通过全生命周期监测和评测,优化模型表现。

魏凯*调,金融、医疗、政务等行业对大模型可信性要求极高,需要产业上下游共同努力推动技术创新和生态协作。

2.4 蚂蚁百灵大模型多模态能力升级

蚂蚁集团副总裁徐鹏介绍了蚂蚁百灵大模型在多模态能力方面的升级。蚂蚁百灵大模型通过原生多模态架构,实现了文字、图像、视频、语音的联合处理能力。这种架构支持动态扩展,能够灵活适应新模态数据的加入。

徐鹏演示了多模态大模型在智能生活管家、智能金融管家和AI就医助理等场景中的应用。蚂蚁集团通过*化学习、奖励模型扩源等技术,提升模型的安全性和实用性。未来,蚂蚁将继续与产业伙伴合作,推动大模型在严谨行业的规模化应用。

2.5 多模态遥感大模型

武汉大学教授张永军介绍了蚂蚁集团与武汉大学联合研发的多模态遥感大模型“SkyCi”。该模型基于全球超过2000万个样本训练,参数规模达20亿,覆盖高分光学、多光谱、时序光学等多种模态数据。在17个公开数据集的测试中,SkyCi在7项遥感解译任务中均名列第一。

SkyCi具备多模态信息融合和跨任务通用解译能力,在自然资源调查、农作物监测、视觉导航等领域有广泛应用潜力。目前,SkyCi处于定向开源阶段,未来将全面向学术界开放。

2.6 从ChatGPT发展看大模型技术创新

OpenAI原研究员肯尼斯·斯坦利通过线上分享,探讨了大模型技术创新的实践与展望。他指出,当前大模型在创造性任务中仍存在局限,但通过外层算法(如进化算法)引导,可以探索设计空间,生成训练数据中不存在的新设计。

斯坦利认为,大模型在兴趣提取和匹配等任务中表现优异,可能是当前的“杀手级应用”。未来,大模型的发展需解决数据稀缺、架构创新等问题,同时关注多模态能力和人机协作的应用前景。


篇章三:大模型产业应用与创新实践 💡

3.1 高峰对话:大模型爆款应用的N种可能

在高峰对话环节,多位行业专家探讨了大模型爆款应用的可能性。以下是对讨论要点的整理:

大模型发展阶段

  • 大模型技术仍处于早期阶段,类似上半场的起跑阶段。
  • 开源生态尚未完全成熟,需要进一步开放以促进应用创新。

爆款应用方向

  • C端应用:对话助手、图像生成、视频创作等场景有望爆发,但需底层技术进一步突破。
  • B端应用:知识密集行业(如医疗、金融、法律)是大模型落地的主要场景,通过提供“心智生产力”赋能行业。
  • 智能体:智能体作为人与大模型的桥梁,有望成为爆款应用,降低使用门槛。

行业落地挑战

  • 数据可获取性、质量和版权问题是行业应用的主要障碍。
  • 需要与行业用户深度共创,结合领域知识和数据,实现场景化落地。

职业与教育影响

  • 大模型不会完全取代人类,而是提高供给,创造新的就业机会。
  • 人工智能将成为基础工具,每个人都需要掌握相关技能。
  • 教育方式需调整,注重培养创造力和跨学科能力。

未来展望

  • 明年B端应用将加速落地,C端应用百花齐放。
  • 未来2到3年,可能出现颠覆行业工作流程的应用。
  • 个人数字分身和完全的个人助理是值得期待的方向。

3.2 支付宝多模态医疗大模型发布

蚂蚁集团大模型应用部总经理顾进捷介绍了支付宝在医疗领域的AI布局。支付宝医疗健康频道已服务8亿用户,接入3600多家医院。基于百灵大模型的多模态能力,支付宝推出了全国首个城市级健康数字人“安诊儿”、医保数字智能体“杭州医保小智”等应用。

支付宝多模态医疗大模型支持千亿参数规模,具备原生多模态架构,可实现语音、视频、文字的联合交互。在体检报告解读、毛发检测等场景中,识别准确率超过90%。此外,蚂蚁还推出了医疗可信一体机解决方案,支持国产化芯片和密态计算,加速医疗AI应用落地。


总结

本节课中,我们一起学习了可信大模型助力产业创新发展的核心内容。我们从论坛开幕与领导致辞开始,了解了人工智能安全治理的重要原则。随后,我们探讨了大模型在产业应用中的机遇与挑战,包括垂直领域应用、可信架构构建和多模态能力升级。最后,我们通过高峰对话和医疗大模型发布案例,看到了大模型在行业中的创新实践和未来潜力。

大模型技术仍处于早期阶段,但其在知识密集行业的应用已展现出巨大价值。未来,随着技术进一步成熟和生态协作深化,大模型将为千行百业的高质量发展注入新动力。希望本教程能帮助你初步理解大模型技术及其产业应用,为后续学习打下基础。

17:大模型赋能产业智能化实践教程 📚

概述

在本节课中,我们将学习百度智能云如何通过其“千帆”大模型平台,推动人工智能大模型在千行百业中的落地应用,并助力新质生产力的发展。课程内容涵盖了大模型产业的发展现状、核心平台架构、关键技术突破以及在交通、医疗、教育、城市治理等多个领域的实际应用案例。


第一节:大模型产业的现状与机遇 🌱

近年来,AI大模型以前所未有的速度改变和重塑着我们的生产和生活。从智能制造到智慧医疗,从金融科技到教育创新,其*大的数据处理能力、深度学习的洞察力以及跨领域的泛化能力,正在重新定义行业边界。

大模型的发展初期,类似于毛竹的生长。毛竹在最初的几年里主要在地下拓展根系,一旦破土而出,便能在短短几周内长到十几米高。当前,人工智能和大模型也正处于这样一个产业爆发的初期阶段。虽然尚未出现现象级的爆款应用,但在过去一年中,大模型已经开始在行业中快速渗透,展现出前所未有的积极性和创新力。

从战略洞察来看,未来三年大模型最大的机会在于应用端。科技企业、国企、央企和大型民营企业将率先享受到这一波红利。大约两三年后,才可能在消费端(C端)出现颠覆性的产品。


第二节:降低大模型应用门槛的关键 🔑

当前,产业界关注的核心是“产业”和“场景”两个关键词。要让大模型真正创造价值,关键在于降低其使用门槛,并将其与具体的产业场景深度融合。

百度智能云的实践路径是:首先由技术专家深入产业,理解业务逻辑和生产流程,亲自下场为企业提供服务。在验证了价值后,将这些重构的经验、技术组件、行业Know-how和最佳实践沉淀到“千帆”平台中。目前,该平台已服务超过10万家企业、500多个行业应用场景和几十万个原生应用。

为了进一步降低行业客户的使用门槛,百度在通用“千帆”平台之上,还推出了行业增*版,如工业版、交通版、政务版、金融版等,封装了各垂直领域的独特需求。


第三节:千帆大模型平台的核心架构 🏗️

百度构建了完整的大模型产业化落地技术栈,主要分为三层:

  1. 算力层:百度百舸AI异构计算平台
    • 核心功能:提供稳定、高效、易运维的AI异构计算平台。
    • 关键技术突破:实现了“多芯异构协同训练”,允许同一集群中不同品牌、不同厂商的AI芯片协同工作,训练效能可达单一芯片的95%-97%,显著降低了企业的算力成本。

  1. 模型层:千帆Model Builder(大模型开发平台)

    • 核心功能:不仅预置了百度文心系列模型及众多开源、三方模型,更重要的是提供了一整套大模型开发工具链。
    • 关键升级
      • 模型效果提升:支持DPO、KTO等新的人类对齐方式,使模型输出更符合用户偏好。
      • 成本优化:支持INT8、FP8等量化压缩方法,降低推理成本与延迟。
      • 数据增*:独家提供“混合训练”功能,平台预置大量(可用不可见)数据样本,可帮助企业在精调模型时,既补充垂直领域语料不足的问题,又能防止模型遗忘通用能力。
  2. 应用层:千帆App Builder(AI原生应用开发平台)

    • 核心功能:极大简化AI原生应用的开发。
    • 关键特性
      • 丰富组件:提供60多种工具组件。
      • 交互升级:支持开发3D数字人交互应用。
      • 工作流编排:通过可视化拖拽方式,将业务流程编排为确定性的执行步骤,无需编写代码。
      • 企业级知识库:提供可扩展、策略可配、安全稳定的知识库增*(RAG)能力。
      • RAG with 百度搜索:独家能力,将百度搜索引擎的实时、海量信息与大模型总结能力结合,用于垂类问答场景。
      • 灵活部署:全面支持公有云、私有化及混合云部署模式。

第四节:行业应用实践案例 🏥

以下是千帆平台在不同行业的具体应用案例:

案例一:医疗领域 - AI医生助理

  • 解决痛点:医生工作繁忙,书写病历、重复问诊耗费大量精力。
  • 解决方案:基于千帆平台训练医疗垂类大模型,打造具备“听说读写”能力的AI医生助理。
  • 实现功能
    1. 在诊室聆听医患对话,自动生成病历和医嘱草稿。
    2. 在病房跟随医生查房,辅助记录。
    3. 术后根据医生口述,自动生成手术记录。
  • 效果:服务了45家医院和1.5万家基层医疗机构,将医生从繁琐事务中解放出来,使其能更专注于诊疗决策和患者关怀。经对比,其模型性能达到国外同类模型的1.7倍。

案例二:教育领域 - AI赋能医学考试培训

  • 解决痛点:传统医学教育依赖题海战术和视频课程,医护人员学习耗时⻓、效率低。
  • 解决方案:基于20年积累的医学知识图谱和百亿级用户数据,结合千帆大模型平台,打造场景化、个性化的AI学习产品。
  • 实现功能
    1. 智能测评:识别用户薄弱知识点。
    2. AI出题:针对薄弱点生成个性化练习题。
    3. 千人千面:为不同用户提供定制化的学习路径。
  • 效果:AI产品上线十天,累计使用人数突破10万,日均活跃用户提升11%,显著提升了学习效率。

第五节:智慧交通与城市治理实践 🚗

大模型与车路云一体化技术结合,正在深刻改变交通和城市治理模式。

实践一:百度“车路云图”4.0方案

  • 技术融合:将交通大模型的能力融入车、路、云、图全要素。
  • 车端突破:发布基于大模型的自动驾驶系统,第六代无人车成本降低一半以上,安全冗余达到十层。
  • 路侧突破:基于BEV+Transformer技术重构路侧感知,动态事件识别准确率高达99.999%。
  • 云端突破:发布智能计算操作系统“万源”,提升全要素数据的感知、预测和解读能力。
  • 应用场景
    • 赋能L4自动驾驶:提供超视距感知和盲区预警,提升安全性。
    • 服务L2网联车:提供动态信息服务、车位预约、精准导航等,已与多家车企达成前装合作。
    • 服务城市管理:在高速公路上减少封路时长,提升运营收入;在城市区域实现信号灯智能协调,降低车均延误20%以上。

实践二:苏州交警的AI交管探索

  • 合作模式:与百度建立联合实验室,探索AI在交管领域的应用。
  • 应用场景
    1. 疏堵保畅:利用大模型对全路网数据进行规律发现和智能优化,实现动态子区划分和信号配时调整,提升整体通行效率。
    2. 安全防控
      • 动态风险:通过视频流实时监测路口,预警右转盲区碰撞风险,并通过路侧设备或车载系统提醒驾驶员。
      • 静态风险:智能识别信号灯故障、标志标线残缺等隐患,并自动派单维护。
    3. 出行服务:打造具备交管知识的“数字交警”,通过导航、社交媒体等渠道,向公众精准推送交通政策、管制信息和实时路况,提供在线答疑服务。

实践三:绍兴智慧快速路的数据价值探索

  • 建设基础:全国首条支持L4级自动驾驶的城市快速路,积累了海量车路协同数据。
  • 数据价值化路径
    1. 摸清家底:梳理快速路自身产生的各类感知数据。
    2. 数据融合:与绍兴市公共数据(如气象、应急等)进行碰撞融合,形成更有价值的“数据资产”。
    3. 价值变现:探索将融合后的交通数据以“数据产品”形式在上海数据交易所挂牌交易,实现数据价值市场化。
  • 启示:智慧交通建设应“适度超前”,为后续叠加AI大模型等新技术预留空间,从长远看是节约成本的。

总结

本节课我们一起学习了百度智能云“千帆”大模型平台如何通过降低技术门槛、提供全栈工具链和深入行业场景,推动大模型从技术走向产业应用。我们看到,在医疗、教育、交通、城市治理等多个领域,大模型正在像“毛竹”一样,经历前期扎根后开始破土而出,展现出*大的赋能潜力。其核心价值在于与具体产业场景深度融合,解决实际业务问题,实现降本增效和体验升级。未来,随着技术与场景的持续碰撞,大模型必将催生出更多创新应用,智能生成无限可能。

18:智能向善,开放共治——人工智能与金融融合治理教程 📚

在本节课中,我们将学习人工智能(AI)与金融行业融合发展的现状、机遇、挑战以及治理体系的建设。课程内容基于“智能向善,开放共治”论坛的讨论,涵盖了政策背景、技术应用、风险挑战和治理框架等多个方面。


一、论坛背景与致辞 🎤

当前,新一轮科技革命持续推动金融智能化发展,以生成式AI为代表的前沿技术已进入商业应用新阶段。为加快金融*国建设,做好金融“五篇大文章”,并与全球各界共同推动人工智能产业可持续健康发展,本次论坛应运而生。

领导致辞要点

上海市经济和信息化委员会总工程师葛东波指出:

  • 上海人工智能产业规模持续扩大,企业数量接近400家,产业规模近4000亿元。
  • 上海正全力推动人工智能大模型创新发展,加快打造世界级产业集群。
  • 未来将加速赋能金融行业,探索新型治理模式,坚持多方共治。

交通银行党委书记、董事长任德奇指出:

  • 人工智能正以前所未有的广度和深度赋能千行百业。
  • AI与金融加速融合也带来了安全、伦理等新风险新挑战。
  • 交通银行积极将智能化手段融入金融“五篇大文章”体系建设,并*化AI在风险管理中的应用。


二、主旨演讲:人工智能治理体系建设 🏛️

上一节我们了解了论坛的背景与宏观方向,本节中我们来看看如何构建具体的人工智能治理体系。

中国证监会原主席肖刚分享了以下核心观点:

1. 全球AI发展特点与治理现状

  • 产业界主导:前沿AI模型主要由产业界开发。
  • 开源趋势:开源基础模型占比越来越高。
  • 成本高昂:前沿大模型的训练算力成本急剧上升。
  • 专利爆发:人工智能专利和出版物数量爆炸式增长。
  • 规则竞争:全球AI竞争已从技术领域延伸到规则制定领域。

2. 中国的人工智能治理倡议
中国提出的全球人工智能治理倡议包括:

  • 坚持以人为本,智能向善。
  • 建立风险等级测评评估体系。
  • 支持在联合国框架下讨论成立国际人工智能治理机构。

3. 加快我国人工智能治理体系的建议

  • 基本理念:坚持以人民为中心,以人为本,智能向善。
  • 基本目标:发展与安全并重,促进与规制并行。公式:发展 ∩ 安全 ≠ Ø
  • 基本原则:包括和谐友好、公平公正、包容共享、安全可控等。
  • 法规体系:应采用 综合性立法 + 场景立规 的多层次法规体系。
  • 治理机制:实施风险分级分类监管,采取 正面清单 + 负面清单 模式。

三、主旨演讲:人工智能在金融领域的应用与建议 💹

了解了治理框架后,本节我们聚焦于AI在金融领域的具体应用与挑战。

中国人民银行原副行长*东荣的分享要点如下:

1. 应用正在加速深化

  • 国家高度重视,产业规模已超5000亿元。
  • 金融行业政策环境持续优化,发布了多项行业标准。
  • 应用场景快速扩展,涵盖智能客服、量化投资、内部效率提升等。

2. 需要关注的问题

  • 算法风险:存在算法黑箱、歧视、模型缺陷难解释等问题。
  • 算力挑战:算力成本投入大,需进一步统筹“东数西算”。
  • 数据挑战:面临数据隐私保护、数据质量不均衡等挑战。

3. 五点发展建议

  • 坚持以人为本,科技向善。
  • 切实加*风险监管和基础支撑建设。
  • 加*数据安全和消费者保护。
  • 注意系统性提升人工智能的能力和水平(数据、人才、生产关系)。
  • 把握主动,切合实际,为金融业务带来实质性提升。

四、主旨演讲:数字金融新途径与AI治理 🤖

上一节我们讨论了应用与挑战,本节我们来看金融机构如何实践并应对治理问题。

交通银行党委委员、副行长钱斌的分享聚焦于实践与治理:

1. AI技术发展趋势

  • 算力:集约化成为新趋势,需提升效能、降低能耗。
  • 数据:合成数据有望成为数据扩充新来源。
  • 算法:多模态成为算法跃迁新方向。

2. AI与金融融合实践(交通银行案例)

  • 践行以人为本:运用AI进行客户精准画像、重塑业务流程(如远程视频核实)。
  • 服务实体经济:打造产业图谱、构建科技型企业评价模型、搭建ESG评价体系。
  • *化风险防控:在信用风险、操作风险、合规风险(如反洗钱)领域应用AI模型。

3. 推动AI安全可信发展的关键

  • 坚守科技伦理:防止算法歧视、隐私泄露,建立模型审计机制。
  • 加*算力资源整合共享:建议研究建立国家级云计算底座和金融算力云。
  • *化数据供给与治理:建立高效的数据标注治理体系。
  • 推动大模型生态建设:产学研融合,发展“小而美”的垂直行业模型。
  • 完善AI工程化人才培养

五、专题分享:公共数据的开放与价值 📊

AI的发展离不开数据,本节我们探讨公共数据这一重要资源如何开放并实现价值。

清华大学五道口金融学院研究员张建华的分享基于实证研究:

1. 公共数据开放的主要模式

  • 政府开放平台模式:数据由各部门自行上传,激励性较弱。
  • 授权运营机构模式:由政府委托专业机构运营,能更好保证数据质量。

2. 研究结论

  • 公共数据开放对地方经济增长、财政盈余和企业创新均有积极贡献。
  • 授权运营模式对专业性、创新性的促进作用更显著。
  • 开放平台模式对普惠性、协调性发展的作用更积极。
  • 较好的模式是两者结合,既保证全面开放,又通过专业机构提升数据质量与价值。


六、案例分享:金融行业AI大模型实践 🏦

理论需要实践验证,本节我们通过具体案例了解AI大模型在银行业的落地。

中国工商银行首席技术官吕仲涛介绍了工行实践:

1. 建设历程与体系
工行按照 “三大支柱、一加X范式” 思路,建成企业级千亿级金融大模型技术体系。

  • 算力:建成全栈国产化AI算力云。
  • 算法:采用商用+开源并行路线,建成多层次大模型算法矩阵。
  • 数据:打造金融知识工程,构建万亿token高质量数据集。

2. 应用范式与场景

  • “1”指金融智能中枢:处理复杂任务规划与工具调用。
  • “X”指多种专业范式:如知识检索、智能投研助手、交易助手等。
  • 典型场景:在金融市场领域,智能交易助手将询价交易效率提升3倍。

3. 风险与安全

  • 技术固有风险:如可解释性弱、隐私泄露隐患。
  • 恶意利用风险:如AI攻击AI。
  • 防护措施:从模型安全、数据安全、应用安全三方面建立全域守护安全平台。

4. 未来展望

  • 做深大模型技术支撑能力。
  • 做大数据资产建设。
  • 做*大模型人才队伍建设。
  • 加快行业联合创新。

七、成果发布与圆桌讨论 🚀

最后,我们通过成果发布和专家讨论,展望AI在金融领域的未来。

1. 成果发布

  • 交银易监管数字化集成服务平台:运用AI技术提供全生命周期资金监管服务,适用于工程项目、交易担保、投后管理、预付费等场景。
  • 人工智能联合创新成果:交通银行与科大讯飞、华为等成立联合创新实验室,形成 “1个能力平台 + 1套治理体系 + N个应用场景” 的框架,在信贷、客服、风控、办公等领域落地多项AI应用。

2. 圆桌论坛核心观点
以下是专家们围绕大模型金融应用的讨论要点:

  • 国产化必要性:在当今形势下,发展自主可控的AI底座必要且紧迫。
  • 应用效能:在特定场景(如投顾服务、代码生成)已能显著提升效率(数倍提升)。
  • 投入产出考量:当前仍属高投入期,需坚定投入并保持耐心,同时进行预算管控。
  • 监管建议:可参考 分级分类监管 思路,对直接进行金融决策的环节严格监管,对工具类应用适度放开;倡导监管与行业共治。

课程总结 📝

本节课中,我们一起学习了人工智能与金融融合发展的全景:

  1. 趋势与机遇:AI是发展新质生产力的重要引擎,正深度赋能金融业,提升服务质效。
  2. 风险与挑战:需重点关注算法黑箱、数据隐私、算力成本、科技伦理等风险。
  3. 治理体系:应建立 以人为本、智能向善、开放共治 的治理框架,采取 发展与安全并重、促进与规制并行 的策略,构建 综合性立法与场景立规相结合 的法规体系。
  4. 实践路径:金融机构应夯实数据底座,加*产学研合作,聚焦场景创新,同时*化模型全生命周期治理和风险防控。
  5. 未来共识:推动AI在金融领域的健康发展,需要政府、监管、金融机构、科技企业和社会各界协同努力,确保技术 可信、可靠、可控,最终赋能实体经济,守护人民美好生活。

19:前沿人工智能安全与治理论坛 🧠

课程概述

在本节课中,我们将学习2024年世界人工智能大会“前沿人工智能安全与治理论坛”的核心内容。课程将涵盖人工智能安全研究、安全评测、安全治理以及国际合作四大主题,旨在帮助初学者理解当前AI领域面临的关键挑战与应对策略。


第一部分:前沿AI安全研究 🔬

上一节我们介绍了课程的整体框架,本节中我们来看看前沿AI安全研究的具体内容。

1.1 通用人工智能的风险评估

图灵奖得主Yoshua Bengio牵头发布了第一份先进AI安全国际科学报告。该报告由30个国家、欧盟和联合国提名的专家委员会共同参与,对通用型AI的安全风险进行了科学评估。

核心概念:报告指出,目前没有已知的方法能有效预防AI的滥用风险和失控风险。

1.2 风险的主要类别

报告将风险分为三类:

  • 恶意风险:人们利用AI从事非法或不道德活动,如诈骗、深度伪造、网络攻击等。
  • 故障风险:AI系统出现非预期的负面后果,如产品安全问题、偏见歧视,甚至失控。
  • 系统性风险:AI技术与社会互动产生的风险,如对劳动力市场的影响、AI鸿沟、市场集中度以及环境影响。

1.3 技术挑战与研究方向

当前AI安全技术面临诸多挑战:

  • 模型不可解释性:我们不完全理解神经网络如何做出特定决策。
  • 安全防护易被绕过:现有的安全对齐方法(如SFT、RLHF)容易被“越狱”攻击或通过微调移除。
  • 评估方法的局限性:现有的安全评测多为“抽查”,无法提供定量的安全保证。

研究方向:需要加大对AI安全研究的投入,探索如表征工程安全设计等新方法,并推动国际合作。


第二部分:AI安全评测 🧪

上一节我们探讨了AI安全研究的挑战,本节中我们聚焦于如何评估AI系统的安全性。

2.1 评测的类型与生命周期

评测应贯穿AI系统的整个生命周期:

  • 研发阶段评测:在模型训练的不同节点进行安全基准测试。
  • 部署前保证评测:由独立于开发团队的专家进行,旨在确保系统安全性。
  • 行为评测 vs. 能力评测:既要评估模型在典型使用下的平均行为,也要探测其可能产生高风险行为的“尾部”能力。

2.2 评测的最佳实践

以下是进行有效AI安全评测的一些关键原则:

  • 提示词敏感性:评测需考虑不同措辞的提示词可能引发不同结果。
  • 评估对象:既要评估底层基础模型,也要评估最终面向用户的完整系统。
  • 对抗性使用:必须评估系统在对抗性攻击下的表现。
  • 基线对比:评估风险时,需与没有该AI模型时的替代方案(如网络搜索)进行对比。

2.3 中国的实践:大模型安全评测

中国信息通信研究院建立了AI安全评测基准框架,并按季度开展评测。评测维度包括:

  • 内容安全:防止输出法律禁止的内容。
  • 数据安全:防止个人隐私和企业机密泄露。
  • 科技伦理:评估价值观、心理健康、公序良俗等方面。

挑战:攻击手法不断翻新,模型的安全护栏容易被绕过,需要建立动态、敏捷的治理技术生态。


第三部分:AI安全治理 ⚖️

上一节我们了解了如何评测AI安全,本节中我们来看看如何从政策和治理层面应对这些风险。

3.1 治理原则:从风险到价值

当前的AI治理多以风险为基础,但存在局限:

  • 风险难以量化:许多风险(如隐私侵害、歧视)难以像传统风险那样计算概率和损害。
  • 存在不可预见风险:AI可能带来前所未有的风险类型。

因此,需要超越风险治理,迈向基于价值的治理框架,在发展中保障安全。

3.2 不同地区的治理视角

  • 新加坡:秉持“谦逊”态度,采取迭代学习的方法,先推出软性法规和指南,根据反馈和观察不断校准。同时注重提升全民的AI素养和能力。
  • 法国:*调开放源码和数字公地,将其视为建设主权数字基础设施的战略。同时关注弥合数字鸿沟,避免AI加剧社会分层。
  • 美国:当前AI领域法规很少,治理讨论集中在行政命令、立法路线图和州级法案。思路包括利用现有部门法规、通过诉讼形成判例,以及探索“安全设计”的正式验证方法。
  • 中国:形成了“发展与安全并重”的治理特色,探索分层治理(如生成式人工智能管理办法),并积极推进人工智能基础设施建设(数据、算力)。治理理念*调“以人为本,智能向善”。

3.3 治理建议

  • 建立分级分类体系:对能力最*、风险最高的前沿大模型施加更严格的规范。
  • 实体映射与内容标注:AI生成内容应被明确标识,智能体应有明确的归属主体。
  • 加大安全投入:建议将至少10%的AI研发资金投入到安全和伦理方向。
  • 设立安全红线:明确禁止AI进行无限制的自我复制、接管关键基础设施等行为。


第四部分:国际合作 🌍

上一节我们讨论了各地区不同的治理路径,本节中我们探讨如何通过国际合作应对这一全球性挑战。

4.1 国际合作的必要性与挑战

AI的效益与风险都是全球性的,其供应链、研发和应用跨越国界。然而,国际合作面临地缘政治竞争、技术不确定性、制度复杂性等挑战。

关键障碍:中美科技合作自2017年以来迅速恶化,涉及基础研究、商业技术乃至前沿技术的交流都受到限制,形成了“寒蝉效应”。

4.2 开放科学与多元参与

  • 开放的价值:开放科学(如开源模型、工具、数据集)能促进创新、缓解偏见、分散权力,让更广泛的研究者和社区能够审查、评估和贡献,这对于安全至关重要。
  • 开放的定义:开放不仅是模型权重的开放,更是一个包含数据、评估集、文档等在内的系统化透明工程。
  • 多元参与:没有任何一个组织能拥有确保AI对所有人群都安全所需的全部视角和专业知识,需要全球多元主体的贡献。

4.3 构建国际治理生态系统

需要建立一个多层次、网络化的国际治理生态系统:

  • 联合国:应发挥核心协调作用,编织全球治理网络,确保“不让任何国家掉队”。
  • 国际标准与报告机制:各国需合作制定AI安全国际标准,并建立计算资源使用和大型模型训练的国际报告机制,以增加透明度。
  • 框架公约:可考虑制定“全球AI挑战框架公约”,先就高级目标和原则达成快速全球协议,再通过具体议定书处理武器化、失控等具体风险。

合作路径:在竞争背景下,可优先推动“平行安全”,即中美等技术方在各自语境下通过专家对话、技术交流、联合评估等方式,各自建设安全能力,为未来的高层协议奠定基础。


课程总结 🎯

本节课中,我们一起学习了前沿人工智能安全与治理的核心议题:

  1. 安全研究:认识到AI存在滥用、故障和系统性风险,且当前防护手段不足,亟需加大研究投入。
  2. 安全评测:评测需贯穿全生命周期,采用多种方法,并重视第三方评估和动态对抗测试。
  3. 安全治理:各国治理需平衡发展与安全,探索符合自身价值观的路径,并考虑分级管理、设定红线等具体措施。
  4. 国际合作:面对全球性挑战,必须通过开放科学、多元参与和构建新型国际机构来加*合作,共同将AI安全作为一项全球公共产品来建设。

人工智能的安全治理是一项长期而艰巨的任务,需要技术专家、政策制定者、企业和社会各界持续对话、共同努力。

20:2024 WAIC 视频生成前沿技术论坛 🎬

在本节课中,我们将学习2024年世界人工智能大会(WAIC)视频生成前沿技术论坛的核心内容。论坛汇集了来自学术界、产业界和投资界的专家,共同探讨了AI视频生成的技术现状、应用挑战与未来机遇。我们将整理并提炼各位嘉宾的演讲与讨论要点,以教程形式呈现,帮助你系统性地理解这一前沿领域。


论坛开场与背景介绍

尊敬的各位来宾,现场及线上的观众朋友们,大家上午好。欢迎大家来到2024 WAIC视频生成前沿技术论坛。我是今天活动的主持人,机器之心联合创始人兼主编*亚洲。

我们知道,在ChatGPT之后,SORA引爆的视频生成绝对是今年最热的技术与应用方向之一。但是,视频生成领域又处在一个非常早期的阶段,而国内也正在进入爆发的前夕。因此,我们就想组织这样一场论坛,为大家学习了解视频生成技术提供一个平台。

本次活动由组委会办公室主办,机器之心执行,上海科技有限公司与东浩兰生集团有限公司共同承办。在活动开始前,我为大家介绍一下我们今天的活动环节。

首先,我们邀请到了视频生成领域的四位专家、学者为大家来做主题分享。也邀请到了来自学界、业界、创业公司、知名投资机构的嘉宾,共同围绕视频生成的技术与应用,展开两场深度的圆桌讨论。希望我们今天的活动能够让大家收获满满,不虚此行。

好的,那我话不多说,我们今天的活动就正式开始。首先让我们有请今天的第一位分享嘉宾,阿里巴巴达摩院视频生成负责人陈伟华先生。他的分享主题是:达摩院寻光——下一代AI视频创作平台。掌声有请。


第一节:达摩院寻光AI视频创作平台 🛠️

大家好,很荣幸今天有机会站在这里为大家介绍达摩院新推出的一款AI产品:寻光视频创作平台。

过去的一年对于AI视频生成来说是一个历史性的时刻。一年前,市面上还很少有这种面向公众的“文生视频”模型。但短短的几个月内,我们目睹了几十款视频生成模型的问世。越来越多的人开始通过文字提示或者图像提示的技术来制作自己的视频。

其中一个有代表性的时间点是今年2月份SORA的发布。SORA让大家看到了AI视频生成在高清晰度、高保真、高质量方面的巨大潜力和价值。OpenAI曾邀请了一些视频制作团队去对SORA进行试用。其中一个比较知名的团队是来自多伦多的Shy Kids团队。他们利用SORA制作了一个短片叫做《Airhead》(气球人)。相信很多人都看过这个片子,非常有创意的内容,也非常优秀地把创意和AI技术进行了一个完美的结合。

但是今天,此时此刻,我们想聊一聊它背后的一个故事。在Shy Kids团队做分享的时候,其主创人员就表示,SORA很酷,但是它的生成过程其实是很难控制的。整个短片其实是由多个视频片段组成的。但是在生成不同的视频片段时,很难保证主角始终是这个长着黄色气球脑袋的人。有的时候上面会出现一张脸,有的时候甚至气球都不是黄色的。因此,整个短片并不是SORA直接输出的一个结果,其中引入了大量的人工后期编辑,才能呈现出最终的效果。因此,Shy Kids团队也表示,视频内容的控制其实是创作中最大的一个需求,也是今天我们算法所面临的一个最大的挑战。

所以,今天我们要介绍的产品——达摩院寻光视频创作平台,是我们在调研了现有的视频创作工具,走访了许多视频创作者之后,打造的一款工具性的产品。今天的各种视频生成大模型已经让大家感受到了AI技术带来的福利,给短视频制作提供了各种各样的素材。在有了这些素材之后,我们希望能进一步提升视频制作的效率,去解决视频后期编辑中的各种问题。我们的目标就是用AI能力去重塑传统视频制作的整个流程,去打造AI时代的全新视频工作流。

寻光视频创作平台最大的两个特点,就是能让用户实现对视频内容的精准控制,同时可以保持多个视频中角色和场景的一致性。

平台亮点一:直观的交互与分镜组织

首先,平台的第一大亮点是在交互方面。我们希望让整个编辑过程像做PPT一样简单直观,容易上手。在我们的平台上,每个视频是由多个分镜头组成的。

以下是平台在分镜组织方面的核心功能:

  • 分镜生成与上传:用户可以在平台上从剧本自动生成一组分镜头,也可以自己上传原始的视频,由算法去切分成多个分镜头。
  • 灵活的查看与调整:在创作空间里,用户可以很方便地查看每一个分镜头。一个场景内的多个分镜头也可以收起或展开。场景之间可以通过拖拽来进行顺序的调整,场景内的镜头也可以进行拖拽。
  • 内容的添加与生成:同时,我们可以支持在任意位置上进行分镜头的添加或者删除。在新建的空白分镜头中,我们可以调用图生视频或者文生视频的能力去产生新的内容,也可以添加自己已有的各种素材。

那么对每个分镜头来说,我们可以对它里面的视频进行单独的编辑。从右侧的这个工具栏中,我们可以选择我们想要的合适的编辑功能,对分镜头视频中的所有细节去进行进一步的精细化的编辑。

平台亮点二:基于语义的智能编辑能力

其实讲到编辑,特别是这种精细化的编辑和控制,我们希望能够提供一个完整的、智能的编辑能力,可以让用户去理解用户的意图,在语义层面而不是在像素层面对视频做一个编辑。同时,我们希望一个视频里的所有元素都是可以被编辑和修改的,这样可以给用户提供一个最大的自由度。

这里我们提供了包括视频整体层面的修改,如风格、运镜、帧率、清晰度、画质。同时,我们也可以对视频中的任意局部元素或目标进行精细化的操作,比如人体、人脸、前景、背景等等。

在这些功能中,我们首先想要*调的是一组基于视频图层的编辑能力。因为在我们对用户的访谈过程中,我们就发现,视频图层几乎是所有视频创作者提到的频次最高而且最迫切的一个需求。所以我们平台首次地把视频图层相关的各种能力,以一个系统性的方式完整地呈现给用户。

视频图层功能详解

以下是基于视频图层的核心功能:

  • 前景图层生成:在前景图层里,用户可以通过输入文本,我们就可以产生符合文本描述的、并且具有透明背景的视频。在传统的视频生成的能力基础上,用图层这样一种更灵活的方式来产生内容。比如说可以看到下面这一排里面有一个警车,其实是我们的生成结果可以做到警车的车窗玻璃是透明的,也就是说可以让他很自然地放到其他场景中,以一个图层的形式放进去。
  • 图层拆解:同时,有时用户会上传自己的视频素材。那其实我们也提供了图层的拆解能力。用户在视频的第一帧选出自己想要提取的一个物体,那我们的算法会把整段视频中的这个物体对应的内容全部拆解出来,形成一个独立的带透明背景的视频图层。就比如这里的小和尚和这里的这个女孩,我们都是可以拆解出来的。左下角这个女孩这个视频其实我们值得说一下,就是说看这里面可能会有书本、有女孩、还有蝴蝶,其实这些我们都是可以做拆解的。我们可以把一个视频拆解成多个图层。以这个女孩为例,其实我们可以看到,我们的拆解算法还是非常精细的,比如这个头发的飘动,其实我们都是可以拆解出来的。
  • 图层融合与场景控制:当我们的素材都以图层的形式存在的时候,那我们就可以将不同的前景图层和不同的背景进行融合。图层的融合这样就可以组合成更多的新的视频来。比如刚才我们提取的这两个前景,就可以把它跟不同的背景进行融合,形成新的视频。前面其实我们提到的视频创作中,多个分镜头场景的一致性是非常重要的。我们其实想做到的就是一个场景的可控。那其实场景的可控主要靠的是什么呢?其实我们就发现,当图层融合能力已经让我们实现了视频背景的任意切换的时候,那我们就可以把不同的前景放到同样的场景中,实现场景的一致性。比如刚才提取的这两个前景,我们就可以给它放到一个类似的场景环境中,这样就可以让他们有一个剧情上的一致性。同时,我们也提供了支持多场景的一键式替换,比如一次性就把所有的分镜头的场景,统一替换成另一个场景,比如说这里的这个室内实验室的一个场景。

角色控制与一致性保持

那么除了场景控制之外,我们知道我们其实也支持对人物的控制,来实现多剧情里的人物的这种一致性。

以下是角色控制的核心功能:

  • 角色库与自定义:首先,我们提供了一个角色库。用户可以通过文字描述生成这种自定义的角色,也可以上传自己预设好的一些角色形象。
  • 一键换脸:我们的人脸控制功能可以将所有视频中的某一个角色,全部替换成角色库中用户想要的一个角色。比如说这个女警,然后再比如说把所有的换成这个黑人的女孩。整个这些操作我们都是可以一键完成的。
  • 多人同时换脸与嘴型适配:这里值得一提的平台,同时我们也支持对视频中的多个人物进行同时的换脸。比如说这段视频中前面这个穿蓝衣服的角色,我们可以替换成上面左边的这个帅哥,然后现在的这个绿衣服的角色,我们可以替换成右边这个帅哥。我们不仅是替换了某一段视频,我们实际上整个剧情的所有人都能一键替换,相当于换了两个角色在进行这场故事的演绎。那可以看到我们的替换可以很好地适配整个视频,不存在失真错位的状况,同时整个视频中人脸的移动也都是非常流畅的。那么这是再给大家另一个例子。值得注意的时候,可以看一下这个例子,在我们的替换过程中,我们就会适配原来视频中的人的嘴型,就是说保证人在说话过程中,即使把脸换了,我们的嘴型说话也都是没有问题的,表情和之前也都是一致的。

那么利用这个能力,我们就可以随意地去设置我们的视频的角色。我们希望就是让每个人都能成为这个故事的主角,也希望每一个故事可以去被不同的人去演绎。

全局与局部元素的编辑能力

我们知道,就像前面说的,我们的视频都是由各种不同的元素组成的,包括场景、包括人脸。那其实就像前面说的,它主要分为全局的这种元素,还有这种局部的元素。那下面我们就来介绍一下,我们对视频全局元素的这种编辑能力。

以下是全局编辑的核心功能:

  • 风格迁移:首先是这个风格的迁移。我们可以将视频转化成各种不同、各式各样的风格,比如说莫奈风、浮世绘、水彩、水墨、卡通等等。我们一共提供了20多种的风格,可以让用户进行随意的切换。同时我们对各种视频,都是可以支持这种一键式的风格切换的。
  • 运镜控制:其实我们平台也支持对画面做一个运镜的控制。镜头的运动是影视语言的一种表达,可以使画面变得更加的生动、有运动感。那其实我们这里不仅支持运镜,我们还支持了多种运镜方式的添加。这里给大家展示几种大家可能常用到的一些例子,从左到右分别是这种左右的平移、上下的移动、推进拉远以及左右环绕。
  • 帧率提升(视频超分):接下来介绍一下这个帧率的控制。那么有些视频其实由于拍摄的现场,其实它的帧率会比较低,播放起来其实会有一个卡顿。那么平台我们提供了一个帧率控制的功能,可以通过提升视频的帧率,来让这个视频运动变得更加的丝滑。比如说左侧这个视频中的这个火花的喷溅,大家可以看到是有这种明显的卡顿的,这是由于帧率比较低问题造成的。但是用我们的功能处理之后,可以看到这个火花的喷溅,就会变得非常的顺滑和连续。

那么以上几个是在视频整体层面做的一个编辑的能力。那么在视频的这个局部元素、局部目标我们也提供了很多的能力。

以下是局部编辑的核心功能:

  • 运动控制:比如说这个运动控制。其实运动控制是一个比较有意思的一个功能。其实现在有些平台也会提供类似于笔刷这种方式来实现运动的控制。但是我们的运动控制,可以让用户更精准地指定运动的一个方向。比如说左侧的这个船,我希望它从右滑动到左边,那么只需要选中这个船,然后朝左进行一个拖拽,那就能实现一个船的移动的效果。
  • 目标消除:其实平台还提供了这个目标消除的能力。对视频中的这些干扰物体,我们可以实现一键的消除。无论像左边的这个面积比较大的这些人物,还是说像中间的这个酒瓶、鱼这种在屏幕正中央的干扰物,以及向右侧这种左上角的小船,其实我们都可以做到和谐的去除。
  • 目标新增与替换:那么对应于这个消除能力,其实平台也支持了这个目标新增的功能。比如说在原视频是一个空旷的海面,用户可以选定一个区域,输入想要新增的一个物体,比如说一个船,那我们就可以在海面上添加一艘船出来。可以看到我们这个船是顺着水流移动的,是可以很好地和这个海面做一个和谐的、一致的运动。那下面这个例子其实是从左边到中间,这个视频其实是我们添加了一个风筝,天空上的一个风筝。那其实有了这个新增的能力之后,我们也可以对目标进行一个修改和替换。比如像右下角第三个视频,这样我们去把这个风筝换成一个气球。那这样的话,其实利用以上的这些能力,我们可以对视频中的每一个局部目标,都可以被精准的定义和修改。

总结与展望

今天我们发布了寻光视频创作平台,是一个专门为视频创作者打造的一个工具性平台。它提供了更简易的分镜头的组织形式,以及丰富的视频编辑能力,比如说基于视频图层的生成、拆解、组合,以及像运动控制、视频超分、风格迁移、目标的消除、新增、替换等等。同时,我们也支持了对多个视频中场景和人脸的控制,来保持人物和场景的一致性。

这个视频其实就是我们对整个平台能力的一个综合的展示。那我们相信,今天我们正处在AI视频生成的巨大变革之中。工欲善其事,必先利其器。我们希望寻光视频创作平台就是每一个人手中的利器,是每一个创作者自己的专属的视频工作室。那在这个平台上,我们希望AI与创作者之间能够紧密高效地协作,创意和想象力不需要被工具所限制。我希望寻光视频创作平台能跟各位创作者一起去开启一个更繁荣的视频生态。

那么最后,欢迎大家扫码申请我们的内测资格,也欢迎来到达摩院的展台,跟我们进行更多的交流。谢谢大家。


好的,感谢陈老师的分享。刚才那套二维码出来之后,大家都在夸夸地拍照,感觉这个平台肯定会火的。再次感谢陈老师的精彩分享。

上一节我们介绍了达摩院寻光平台如何通过图层、分镜和控制技术来提升视频创作的效率与可控性。本节中,我们来听听来自学术界的视角,探讨视频生成的底层技术挑战与新的解决思路。


第二节:面向矢量化的媒体内容生成 📐

感谢机器之心的邀请。今天很开心,又看到了很多老朋友。我今天的分享可能包括视频,但可能比视频的范围更广一点,因为我们这么多年来一直在做全媒体的这样一个生成,包括图像、视频以及三维的内容。而且今天我的分享可能更加偏我们一些前沿的底层。

那首先可能要稍微泼一点冷水。如果大家一直在用这些生成类的工具的话,我相信这些问题多多少少都会遇到。我们现在生成类的算法,包括视频、包括图像、包括三维的东西,我们可以遇到很多这种结构性的问题和细节性问题。比方说,通常会多一样多生长出一样东西,或者少一样东西,或者手穿模穿到人的身体里面。然后有的时候生成的衣服上的这些logo,突然间变得很模糊了。那如果对视频来说,像这种精细化的视频,特别是具有这种物理规则的视频,其实目前为止是挺难生成的。

那么究其原因,我们都知道,现在所有的生成式的智能从本质上讲它无非就是一个采样的过程。视频是一个非常高维度的空间,比图像更高。如果我们给予更多的训练数据,如果我们把采样精度降得更低一点的话,那么相信我们能够生产出更好的内容。这个就是为什么我们现在有Scaling Law,为什么有Stable Diffusion是不停的采样。但是这个是有天花板的,大家都知道是有天花板,因为我们的维度空间太高了。一定要做到万无一失、千真万确的话,恐怕以目前的技术框架来说,其实是有一定的难度的。更何况我们对于算力的约束,其实还是很大的。

这里列举了我们目前包括大语言模型、包括图像视频类的生成模型的一些算力指标。我们看到现在都是几十T、上百T甚至上千T的这样一个水平。那么我想,未来生成式的智能的一个发展趋势,它肯定会下沉到端侧。那么对于端侧来说,我完全不可能用这种无限制的大算力的采样的方式去解决问题。那么可以想象,我们是需要有一些新的架构、新的计算方式、或者叫新的一些底层技术,来支撑这样一个更加高效、更加高质量的生成的方法。

那么我们可以看到,为什么我们现在那么吃算力?我们现在那么消耗数据和算力的资源?其实就是一个我们神经网络的黑盒化。对于生成的网络,我们完全不知道这里面哪一个节点跟我们的要去生成、要去控制的内容有关。我们不知道我们输入的prompt的某一个词,到底在这样一个节点里面的哪一个、哪几个单元是有关联的。我们也不知道我们输出的这样一个人脸的某个地方的一个形状,是跟我们这个神经网络里面的哪几个单元是有关的。其实我们更需要的是做一种白盒化的生成技术。

比方说,如果我们能够将视频中的内容能够实例化到我们的网络参数的话,那么实际上我们可以精确地去操控我们生成的内容。但是要解决这样一个参数对齐问题的话,其实究其本源,本质上还是一个数据内容的表征问题。不管是图片还是mesh还是视频,实际上目前我们的基础表征还是这种规范化的网格。那么规范化的网格,它实际上是跟语义是不对齐的,我们并没有实例化的概念。这就导致了为什么我们现在去网络去算,我也不知道他在算什么,我也不知道他能够算出什么,反正我们给很多的数据,它最终总能生成我们期待的结果。

但是,如果我们有一种新的表征方式,它能把我们视频中的内容、把我们的这些内容以及各种内容的属性,比方说我们的颜色、我们的纹理、我们的光照、我们的形状,能够把它具象化、实例化、解耦开来,而且能够针对性地建模的话,那么这样一种表征实际上是特别适合生成式的人工智能。

那么朝着这样一个方向,实际上我们团队在这两年也做了一个新的内容表征的框架。比方说像这样一个框架里面,我们无论是对2D的图像也好、3D的物体也好、或者是视频也好,我们可以先做一个空间语义的结构,可以把它分成语义的部件,比如说手、脚、耳朵。然后对于每一个部件,我们实际上是可以进行一个矢量化的表达。我们可以通过我们过去的一些非常好的工具,比方说像贝塞尔曲线,或者是NeRF的这种曲面,我们可以把它进行矢量化的表征。然后我们可以把解耦的一些语义、解耦的一些视频的视觉的属性,比方说光照、纹理、形状,可以把它通过控制点的方式去放在我们控制的形状的一个边界,甚至是内部。如果我们要生成这个形状内部的东西的话,只需进行这样一个神经网络的采样就可以了。最近我们的一些像类似于隐式表达的一些方法,就特别适合这样的采样。

那么这样一来,我们整个视频、我们整个视觉的内容,可以拆分成这样一系列的矢量表征。那么我们对于生成和编辑的话,我们想去编辑哪个内容,对于它我们进行相应的采样就行了。

矢量化表征的优势与应用

那么这个就是利用我们现在的矢量化表征的框架,做的二维图像的生成和编辑。我们可以看到它的优势还是非常明显的。

以下是矢量化表征的核心优势:

  • 高精细度重建:首先,对于不同风格的图像来说,我们目前通过矢量化的生成和编辑方式所重建的图像,它的精细度是非常高的。我们过去可能怀疑,对于这种动画类的图像,可能矢量的重建会比较好,对于自然图片可能矢量重建就有点问题。但是我们实验表明,其实只要是对于我们的控制点去寻求一个更好的表达方式的话,其实它可以把我们的精细程度控制得非常好。
  • **无损

21:2024世界人工智能大会AI魔盒精彩内容解析 🎤🤖

概述

在本节课中,我们将一起学习2024世界人工智能大会(WAIC)AI魔盒环节的精彩内容。我们将深入了解SAIL奖获奖项目、前沿AI技术分享以及AI在各行各业的应用实践。课程将涵盖AI在能源管理、数据库技术、电力系统、算力架构、汽车制造、医疗健康、内容创作等多个领域的创新与突破。


一、SAIL奖获奖项目深度解析 🏆

1.1 施耐德电气:EcoStruxure AI引擎

上一节我们介绍了课程概述,本节中我们来看看SAIL奖的获奖项目。首先,施耐德电气的EcoStruxure AI引擎获得了“最具引领性的开路先锋”奖。

项目背景与核心价值
施耐德电气在中国拥有29家工厂和物流中心,面临着数字化转型、低碳和效率提升的内在需求。在提升供应链体系AI智能化水平的过程中,公司遇到了两个主要问题:如何快速解决工厂和场景中的问题,以及如何将同一个解决方案复制到不同的工厂,实现AI的规模化应用。

核心公式与理念
公司提出了“工欲善其事,必先利其器”的理念,因此打造了EcoStruxure AI引擎。该平台具有三个关键特点:

  • 开放性:面对不同的产线、供应商和合作伙伴,平台需要具备开放性和兼容性。
  • 一站式:为了降低技术门槛,平台需要提供从需求分析到最终部署的全流程解决方案。
  • 场景化:平台不追求技术的绝对前沿,而是注重解决实际场景中的具体问题,确保技术能够落地并产生实际价值。

应用案例
以下是EcoStruxure AI引擎在实际应用中的几个例子:

  1. 内部工厂案例(上海):在元器件生产过程中,通过计算机视觉(CV)技术检测产品上施耐德logo的打印质量(如颜色、位置)。一旦发现问题,系统可以立即预测打印设备可能出现的故障,实现预测性维护,避免批量废品的产生。
  2. 外部客户案例(太古集团):与太古集团合作,利用AI预测楼宇未来24小时所需的冷量(空调制冷量),预测准确性达到95%。相比传统的自动化控制,节能效果达到约15%。
  3. 外部客户案例(百威啤酒):为百威啤酒生产线提供设备故障预测性维护,并通过AI实时检测啤酒液的过滤质量,帮助控制过滤介质(硅藻土)的添加量,节省耗材使用。

企业价值观与战略
施耐德电气在2002年就提出了可持续发展战略,并将其作为企业发展的核心宗旨。公司认为企业应承担社会责任,特别是在能源和工业自动化领域,致力于通过技术创新帮助缓解全球性的能源和气候问题。在中国,公司秉持“在中国为中国”的宗旨,与本地客户和合作伙伴共同推动可持续发展。

未来展望
关于AI大模型的发展,施耐德认为技术本身的革新相对较快,但技术带来的产业革新有一定滞后性。目前,消费领域已广泛受益于大模型,而工业和生产制造领域现象级的应用尚未大规模涌现,但正在孵化过程中。施耐德作为解决方案提供商,正在积极推动大模型在工业领域的应用,以实现效率和节能的质的飞跃。


1.2 莫契科技:MyScale AI数据库

接下来,我们看看获得“最具创新性”奖项的莫契科技MyScale AI数据库。

项目简介
MyScale AI数据库是国际上第一个专门为大规模结构化与非结构化数据综合存储、查询和处理打造的数据库。在AI时代,处理的数据很多是非结构化数据(如图像、视频、语音、文本),这些数据通常通过深度学习、大语言模型或跨模态模型来处理。MyScale AI数据库就是为AI时代打造的数据基础设施。

核心创新与价值
MyScale的核心创新在于对非结构化数据的处理。它将图像、语音、文本等非结构化数据通过AI模型转化为高维空间中的向量,这些向量能够编码数据的语义信息。该数据库能够统一管理这些高维向量与传统的关系型数据、时序数据、空间数据等。

通俗解释
可以将MyScale AI数据库理解为一个“外部大脑”或“翻译官”。它把人类社会产生的海量、复杂的数据(尤其是大模型难以直接理解的图像、自然语言等)进行解释和整理,形成一个外部的知识库。大模型可以实时从这个知识库中获取领域知识,从而不再是通用而平庸的模型,而是能够结合具体领域数据提供差异化、精准化服务的智能体。

应用案例

  1. 科研平台:将2亿多篇学术文献存入MyScale AI数据库,构建成科研行业知识库。科研人员可以向这个知识库进行实时问答、做跨领域分析,极大提升科研效率。
  2. 智慧城市与自动驾驶:管理海量的图像和视频数据,结合空间、时序等信息,通过大模型进行语义检索和综合分析,用于提高安全性、管理效率或机器学习效率。

技术突破

  • 融合性:首次将结构化数据(SQL)与非结构化数据(向量)在大规模场景下进行了有机融合。
  • 高效性:针对高维向量处理成本高的问题,在算法和系统层面结合先进硬件做了大量创新,使得处理海量非结构化数据时的数据密度和性价比有数量级提升。

数据安全与隐私
MyScale AI数据库采用“知识库外挂”模式,企业可以完全拥有和管理自己的数据库,然后与通用的大模型结合。这样既保护了企业数据的隐私和安全,又能让大模型利用这些数据提供独特价值。此外,数据库底层也做了数据加密、安全保护和权限控制。

未来发展方向
未来将探索更精准的数据表征方式(如多尺度向量或图表征),优化结构化与非结构化数据的联合查询管理,进一步提升海量数据处理效率,并深化与大模型的有机结合,实现大模型驱动的自动化规律发现。


1.3 中国南方电网:新型电力系统智能仿真器“驭电”

最后,我们来看获得“赋能奖”的中国南方电网“驭电”项目。

项目简介
“驭电”是一个数字模拟器,用于模拟电力系统的运行,分析其安全性、经济性和碳排放情况。由于不能拿实际电网做试验(会导致大面积停电),因此必须依靠数字仿真技术。

传统仿真器的挑战与智能仿真器的优势

  • 传统仿真器:基于数值计算,建立数学模型解方程,结果准确但计算速度慢,适合可计划发电的传统电厂(如火电、水电)。
  • 智能仿真器“驭电”:应用人工智能技术,具有两大特点:
    1. 处理海量数据:新能源(如风电、光伏)发展后,发电机组从不到1万台激增至几十万甚至未来几百万台,传统方法计算量巨大。“驭电”可以处理海量场景。
    2. 计算速度快:达到秒级出结果。可以每小时根据最新的天气预报和电厂发电能力,重新优化调整发电计划,优先利用新能源,让常规机组为其让路或补充。

研发团队与产学研合作
项目由南方电网公司牵头,联合华南理工大学、武汉大学和华为公司共同研发。南方电网负责场景分析、需求分析、模型设计,并提供海量真实历史数据;高校负责模型开发、训练和测试;华为提供算力支持和技术指导。

与“南网智瞰”的区别

  • 南网智瞰:属于数字孪生范畴,更多是将电力系统的各种实物设备数字化,模拟其“形”(外观、状态)。
  • 驭电:也属于数字孪生,但模拟的是电力系统内在的动态运行参数(如频率、电压、功角),模拟其“神”(内在机理和运行状态)。两者在应用中合作,分别服务于设备维护和实时调度。

应用效果与领先性
目前主要在云南电网试用。测试表明,“驭电”的效率比传统仿真器提高了至少1000倍,计算误差可控制在1.5%以内,完全满足实际工作需要。它既确保了电网安全,又大幅提升了对新能源的利用率。在全球范围内,该项目也处于领先地位,因为大部分同类研究尚在探索阶段,而“驭电”已可实际运用。

未来挑战与规划
面临的挑战包括扩大模型支撑的物理电网规模(目前支持300节点,目标2000节点以上),以及开发更丰富的高级功能(如小扰动分析、暂态安全分析)。计划用两年左右时间在这些方面取得突破。未来将深化与高校在模型开发上的合作,并寻求更*大的算力支撑,同时与广大电网企业合作部署推广。

赋能价值
“驭电”能精准刻画电力系统的安全边界,确保安全;并能精细化安排各类电源的发电计划(未来可精确到每15分钟)。在确保安全的前提下,最大限度提高新能源利用率,带来显著的环保效益和经济效益(新能源发电成本低于常规机组),助力“双碳”目标实现。


二、AI科技前沿说 🚀

2.1 戴尔科技:现代化AI架构之力

上一节我们深入了解了SAIL奖的杰出项目,本节中我们来看看顶尖科技企业带来的前沿分享。首先,戴尔科技分享了构建现代化AI架构所面临的挑战。

AI对数据中心架构的全新挑战
与过去十年的互联网或云架构不同,AI大模型对算力、内存、I/O和存储都提出了前所未有的高要求。例如,xAI计划用10万张GPU卡训练新模型,这需要约12500台服务器。传统的风冷散热和机架设计无法满足如此高密度、高功耗设备的部署。

戴尔的解决方案
戴尔提供了高密度、液冷散热的服务器机架解决方案,一个机架可容纳64张甚至72张GPU卡,并采用独特的风道设计(先冷却网卡,再冷却GPU),以应对散热挑战,保护易损部件。

架构师的四大挑战与类比
构建AI支撑平台需综合考虑算、网、存、管四大支柱:

  1. 算(如同C919飞机):昂贵的算力投资(GPU)必须24小时高效运转,不能“停在地面”。任何导致其慢下来的瓶颈都必须消除。
  2. 网(如同中国高铁网络):AI算力集群需要四大网络(东西流、南北流、应用网、管理网),每个都不能慢。戴尔致力于用以太网实现高性能、低成本的网络互联,替代昂贵的InfiniBand。
  3. 存(如同中国光伏与储能):需要让GPU算出的结果能快速、直接地写入存储(如通过GPUDirect技术),避免中间延迟,实现“算存直通”。
  4. 管(如同嫦娥六号中继星):需要超越传统的点对点管理架构,建立三层管理架构(类似中继星),实现GPU池化、热迁移、在线微调等高级功能。

复合型人才的重要性
*开复先生指出,既懂AI模型又懂底层基础设施(Infrastructure)的复合型人才极为重要,他们能作为桥梁,价值相当于五个单一领域的人才。

戴尔的AI全栈解决方案
戴尔与合作伙伴共同创建了“AI First”全栈解决方案,底层是面向未来的“算网存管”架构,中间是开放的软件生态,上层是服务团队,旨在将黄仁勋提出的“AI工厂”理念落地。

AI的未来
AI是为了下一代。今天的AI仍处于最弱小的“婴儿期”,未来十年的AI将*大到超乎想象。掌握和学习AI技术,不仅是为了应对当下的冲击,更是为了能够传承给下一代,帮助他们更好地面对未来。


2.2 特斯拉:赛博越野旅行车(Cybertruck)

接下来,特斯拉展示了其被誉为“镇馆之宝”的赛博越野旅行车。

产品定位
特斯拉不仅仅是一家汽车公司,而是在人工智能、能源和自动驾驶领域都有卓越成就的科技企业。Cybertruck是其各项尖端技术的结晶。

设计与工艺创新

  1. 外骨骼车身:首次采用超硬冷轧不锈钢作为车身外骨骼,提供极致安全保护,无需传统车漆,永不褪色。
  2. 装甲玻璃:可承受棒球以时速60公里撞击。
  3. 车顶材料:可反射99.7%的红外线和紫外线,保证车内舒适。
  4. 极简内饰与OTA升级:保持简约设计的同时,通过空中升级(OTA)不断为车辆增加新功能(如自适应大灯),使车辆“越用越新”。
  5. 48伏低压架构:行业首次采用,并开源了相关技术文档,推动行业进步。
  6. 线控转向与后轮转向:世界上第一款方向盘与车轮之间无物理连接的纯电子转向系统,结合后轮转向,使这台超过5米长、3吨重的大家伙拥有小于轿车的转弯半径。

技术生态与未来布局
特斯拉的布局远不止汽车:

  • 人形机器人(Optimus):已在工厂进行分拣电池作业,未来将服务于老龄化社会、危险作业等场景。
  • 全自动驾驶(FSD):已在美国向超过170万用户推送,实现了端到端的完全无人驾驶(从家到公司),期间保持零事故记录。并预告将于8月8日发布下一代无人驾驶出租车(RoboTaxi)。
  • 超充网络与储能:正在建设覆盖广泛的充电和储能网络。
    特斯拉的使命是“加速世界向可持续能源的转变”,并致力于通过开源与合作推动整个行业共同进步。

2.3 蚂蚁集团:知识增*技术助力可信大模型

蚂蚁集团分享了如何通过知识增*技术提升大模型的可信度与应用能力。

符号化知识系统 vs. 参数化知识系统

  • 大语言模型(参数化):泛化性*、构建成本高、时效性低(知识截止日期)。
  • 知识图谱(符号化):迭代成本低、时效性高、显性化,但泛化能力弱。

知识增*技术的四个维度

  1. 高质量知识系统构建:通过统一的大模型指令微调框架(如OneKE),降低知识构建的人力成本,并能提升大模型的通用能力。
  2. 通过知识系统合成训练数据:利用知识图谱合成预训练和指令微调数据,注入知识,提升大模型的认知和推理能力。例如,合成多跳推理问题数据,能显著提升模型的问题拆解和泛化能力。
  3. 检索增*生成(RAG):利用迭代效率高的知识系统,通过提示工程向大模型注入实时、最新的知识,解决其时效性问题。
  4. 在具体应用中融合:将上述方法应用于推荐系统、金融风控等具体场景。

应用案例一:金融风险研报生产
在蚂蚁集团全面风险管理团队,通过构建专业的金融风险知识图谱(几千节点),并将其知识在不同训练阶段注入大模型,使模型生产的风险研报观点准确率从不足50%提升至70%,为分析师大幅提效。

应用案例二:推荐系统提效
传统推荐系统受限于闭环数据,存在偏差(如头部效应)。利用大语言模型的无偏知识和泛化能力,可以引导出对推荐场景有用的知识,并与推荐模型结合。通过知识蒸馏技术,将大模型(如70B)蒸馏成小模型(几B),在用户行为推理上达到媲美大模型的效果,且成本可控,从而提升推荐效果,缓解偏差。


2.4 原编程:培养人工智能时代的科技少年

原编程分享了在AI时代如何培养青少年的科技素养。

“四个一”培养模型

  1. 一种语言(编程语言):体系化、融合多学科、广泛展示应用的专业编程教育。
  2. 一种思维(计算思维):传授信息科技背后的智慧,如二维码原理、验证码演进史背后的创新思维,而不仅仅是知识本身。
  3. 一种能力(创新能力):通过活跃的编程社区(数十万作品),提供创新氛围和及时反馈,激发孩子创造力。
  4. 一种视野(未来科技视野):推出人工智能、芯片科技、脑科学等未来科技素养课,让孩子接触前沿科普。

产品体系与AI结合

  • C系列:培养信息科技核心素养。
  • 算法+AI系列:用专业方式系统化教授人工智能知识。
  • 生成式人工智能编程亲子课:让家长与孩子一起探索AI,打开未来之门。

理念:极致做产品,真诚做服务,已累计培养超500万孩子。


2.5 燧原科技:生态助力破局算力之困

燧原科技探讨了国产算力如何通过生态建设实现破局与发展。

算力产业的重要性
算力是AI发展的核心驱动力,模型性能与算力规模成正比。算力产业正以一己之力再造一个半导体产业。推理算力成本下降是AI普惠的关键,预计推理算力成本将以每年一个数量级的速度下降,并将在明年初超越训练算力成为主流。

国产算力的逆袭之路
回顾PC、手机、新能源汽车产业,中国企业的逆袭往往遵循“创新者破局 -> 众多玩家生态协作 -> 途中跑创新优势 -> 成熟期占据市场”的路径。国产算力崛起的关键在于生态建设。Transformer架构带来的技术范式转移,给了国产DSA(领域专用架构)芯片后发优势的机会。

智算中心2.0:重运营时代
当前智算中心面临“算力总体短缺”与“已建算力利用率不足(仅30%)”的矛盾。问题在于单有硬件不够,需要复杂的软件能力、运营能力和客户拓展能力。破局之道在于“AIDC + AI生态”双轮驱动,在建设之初就结合关键用户场景进行优化。

燧原的定位与生态策略
燧原聚焦算力本身,不做云服务和大模型,致力于打造行业最佳性价比的推理和训练产品。通过技术合作伙伴计划(ETP) 培养合作伙伴,支持终端客户,降低使用门槛。联合解决方案合作伙伴(如行业ISV)和云服务商,打通算力到应用的桥梁。与学术界优化技术公司合作,通过软件优化将性能提升3.5倍以上。

核心观点:国产算力的真正瓶颈不在于性能,而在于信心和使用门槛。通过构建一个包含算力公司、模型公司、优化技术公司、行业方案公司的创新生态网络,才能实现完整的商业化落地闭环,让算力普惠每一个人。


2.6 中科曙光:新质生产力加速引擎

中科曙光分享了其人工智能基础软件系统DAS如何作为新质生产力加速引擎。

DAS系统介绍
DAS是一套完整的人工智能基础软件系统,包含

22:2024年AIGC技术前瞻与产业实践 🚀

在本节课中,我们将学习生成式人工智能(AIGC)与大模型技术的前沿发展,以及它们在产业中的具体应用实践。课程内容涵盖了大模型的可控性、边缘计算、产业落地、数字城市建设、医疗健康及消费品营销等多个维度。


一、大模型时代的控制与智能 🤖

上一节我们介绍了课程的整体框架,本节中我们来看看大模型时代的核心问题:如何实现控制与智能。

智能的本质是控制系统。这一概念源于1948年的控制论,指任何能够感知自身状态并反馈以维持特定轨迹的系统,都可视为智能系统。

在现代人工智能语境下,“控制”常以“*化学习”的形式出现。*化学习指在复杂环境中,通过大规模神经网络学习环境信息与世界模型,并迭代优化价值函数与决策策略的过程。

公式示例:*化学习的目标函数

目标:最大化期望累积奖励 E[Σ γ^t * R_t]

其中,R_t 代表t时刻的奖励,γ 是折扣因子。

2014年的AlphaGo让公众首次广泛认知*化学习。如今,该技术已应用于游戏AI、机器人、自动驾驶乃至可控核聚变等尖端领域。

然而,当智能体(尤其是大模型)的能力超越人类理解与控制范围时,便产生了“对齐”问题。其核心是确保人工智能系统的目标与人类偏好保持一致。

目前主流的前沿对齐方法是通过人类反馈进行*化学习微调。其基本流程如下:

以下是其基本步骤:

  1. 监督微调:使用人类标注数据对预训练大模型进行初步微调。
  2. 奖励建模:收集简单的人类反馈数据(如点赞/点踩、偏好排序),训练一个模拟人类偏好的奖励模型。
  3. *化学习微调:将大模型的生成过程视为策略,使用奖励模型通过*化学习算法进行优化,使其输出更符合人类喜好。

但该方法存在局限,例如数据分布无法覆盖最优策略,导致“分布外偏移”。解决方案之一是采用嵌套式双层*化学习,同时对齐最优策略与数据分布,在机器人实验中可将效果提升60%以上。

在大语言模型场景下,对齐面临更多挑战,例如需同时满足不同用户群体的多样化偏好。研究通过设计多目标对齐算法,确保小众喜好不被主流淹没。此外,引入对抗性批评家进行对抗学习,或采用在线实时数据收集的*化学习算法,都能有效提升对齐效率。

*化学习在大模型中不仅用于对齐,还可用于加速推理。例如,“推测解码”技术让小模型先行生成,大模型负责监督校正,通过*化学习协调二者,可将推理速度提升超过两倍。

更进一步,业界正探索将对齐方法应用于复杂推理、编程及数学证明等任务,寻找对应最优策略的奖励函数(常被称为“Q*”)。研究显示,可在已对齐模型的解码层之上,训练一个轻量级*化学习头,将其对齐到更复杂的新奖励函数。

总而言之,大模型的可控性研究,核心在于引导这个*大的“外星来客”按照人类的意愿,在不同场景与应用中解决问题。


二、生成式AI:扩散模型与控制 🎨

上一节我们探讨了大语言模型的可控性,本节中我们来看看另一类重要模型:生成式AI,特别是扩散模型。

当我们提及生成式AI时,通常指代能够生成图像、视频、数字人乃至蛋白质结构的一系列算法。其发展历程中,变分自编码器(VAE)和生成对抗网络(GAN)都曾扮演重要角色。

然而,扩散模型从根本上改变了生成式AI的范式。它不再试图用一个复杂网络直接将噪声映射为数据,而是将其建模为一个可控的过程:学习如何一步步地将初始噪声“控制”成目标数据。

核心思想:扩散模型本质上是求一个随机微分方程的逆过程。从数据加噪成纯噪声是简单过程,而模型通过学习找到其逆过程的漂移函数。

从数学优化视角看,任何优化问题都可转化为生成问题。我们可以在已训练好的扩散模型上,添加一个基于梯度的引导控制量。这样既能优化任意新目标函数,又不会破坏模型已学习到的数据内在几何结构。

这使得扩散模型能泛化至许多意想不到的设计领域:

  • 硬件设计:用于生成电路图与芯片布局。
  • 材料科学:Google DeepMind曾用其生成220万个可合成的晶体结构,估计传统方法需耗时800年。
  • 生物医药:基于mRNA序列数据训练的语言模型,可生成翻译效率更高的mRNA序列,实验验证其效率比临床最佳疫苗高出30%以上。
  • 机器人控制:“扩散策略”可以直接从数据中学习机器人系统的内在几何结构,生成比原始数据更优的控制策略,已成为具身智能领域的常用技术。

因此,无论是扩散模型还是大语言模型,使其可控——既保障安全,又能满足具体需求、解决特定优化问题——是通向可用、可靠AGI的必经之路。


三、边缘计算与大模型赋能 🌐

上一节我们介绍了生成式AI的底层控制逻辑,本节中我们来看看大模型如何与边缘计算结合,赋能智能物联网。

目前,几乎所有大模型都在云端进行训练和部署,因其需要海量数据与计算资源。但这存在局限:资源受限、数据隐私顾虑、网络延迟高、可扩展性差。

边缘计算将计算任务推向网络边缘,靠近数据产生和使用的位置,能有效*服上述限制。随着AI兴起,“边缘计算”演进为“边缘AI”,即将训练好的模型部署到边缘设备进行推理。

那么,能否将大模型也部署到边缘设备?这催生了“边缘大模型”的研究。其优势在于,大模型*大的生成与理解能力,能完成传统AI模型难以胜任的复杂任务,如个性化健康咨询、家庭智能体、儿童教育辅导等。

实现边缘部署主要有两种思路:

  1. 模型压缩:对大模型进行剪枝、知识蒸馏、量化,减小其体积与计算需求。
  2. 开发小模型:针对特定任务,训练参数规模较小但性能优异的专用模型。

然而,单个边缘设备资源依然有限。因此,“协作式边缘计算”成为重要方向:将多个边缘设备(如家电、车辆、基站)通过网络连接,抽象成共享资源池,将大模型任务分割调度到不同设备上协同完成。

基于此理念,可以开发通用的边缘大模型部署调度软件系统。该系统需考虑异构资源,并能根据数据隐私和实时性要求动态进行任务切分与部署。实验表明,在多个节点上协同推理,相比单节点在速度与精度上均有显著提升。

在此平台上,可开发各类应用,如个性化的情感感知聊天机器人。它能通过对话分析用户情感与性格,并给出相应反馈。部署在边缘设备上,能更好地保护隐私、降低延迟,并可离线使用。

边缘大模型仍面临诸多挑战:资源受限下的精度损失、小模型开发成本高、持续学习与微调困难、输出不确定性等。未来研究方向包括:大规模协同推理的资源管理、动态任务切分与部署优化、数据隐私与安全、异构硬件加速以及联邦微调等。


四、产业创新:大模型的发展与应用实践 🏭

上一节我们探讨了技术在边缘的落地,本节中我们回归产业视角,看大模型如何驱动实际业务创新。

AIGC本质上是内容生产方式的革新,旨在用人工智能平衡内容生成的效率与质量。大模型技术使其生成质量达到用户可接受的水平,从而得以广泛应用。

技术价值呈现“微笑曲线”:高价值区间在左侧的基础核心技术(如Transformer)和右侧的颠覆性应用产品。产业应避免陷入中间的低价值简单集成竞争。

当前大模型发展似乎进入平台期,榜单分数攀升,但真正颠覆日常生活的大规模原生应用仍在探索中。同时,大模型的“幻觉”问题(生成错误或不可控内容)仍是产业落地的关键障碍,需将错误率从10-20%进一步压降。

以京东“言犀”大模型为例,其特点是深度融合产业知识。训练数据中约30%来自京东多年的零售、物流、金融、健康等业务数据,使其具备深厚的行业理解力。通过技术手段将行业知识注入模型,可在客服、商品属性抽取等任务上大幅提升准确率,降低幻觉。

大模型在京东已广泛应用于智能客服、营销文案、数字人、商品图生成、智能诊疗、物流仓储等数百个场景,并服务于平台上的大量合作商家。

技术正从纯文本向多模态演进。京东展示了AI在图像生成(如商品图创作、海报生成)、语音合成(生成带有情感、可用于外呼的语音)等方面的应用。

综合多种生成能力,催生了“数字人”这一颠覆性产品。京东通过“点线面”尝试,已为自身及格力、LG等企业打造数字分身,应用于直播带货、客户服务等场景。在刚过去的618期间,数字人服务了超5000家品牌,直播时长近40万小时,带动成交额超10亿。

更进一步,大模型正走向“具身智能”,驱动实体机器人完成复杂任务(如食堂收餐),从数字世界走入物理世界。

产业实践表明,大模型的发展需以产业需求牵引,着力打造高可靠、颠覆性的AIGC产品,让技术真正惠及每一个普通用户。


五、数字政府与AI基础设施建设 🏙️

上一节我们看到了大模型在企业端的广泛应用,本节中我们来看看AI技术如何助力城市数字化转型。

在数字政府建设中,人工智能已用于解决日常办公、政务服务、城市治理中确定、重复、稳定性的工作需求。随着大模型能力提升,构建全天候智能化服务成为可能。

例如,可以开发面向不同对象的智能应用:

  • 政务处置小助手:处理业务派单。
  • 居民服务数字社工:服务基层居民。
  • 营商数字店小二:服务企业。

目标是实现环境更宜居、生活更幸福、治理更高效、城市更智能。但在应用中也发现问题:需求表述不清、模型精度不足,背后是语料库、知识库、要素库的欠缺。

因此,城市智能化落地不仅需要算法和平台,更需要数据的归集整合、数据要素的建设和数据场景的赋能。核心是构建以城市治理要素(人、地、事、物、组织)为基础的标准数据要素体系,形成底层知识库。

同时,需构建城市治理与服务的模型训练基础平台与智能服务中枢,实现模型协同纳管与资源共享,为基层工作提供智能化辅助工具。

在为企服务方面,利用大模型加*语义理解与自动分类,实现诉求的智能派单。并通过“随申办”企业云等载体,实现全天候智能在线咨询与事项办理,让企业“边问边聊边办”。

安全是数字政府建设的底线,需在数据安全、隐私保护和分级授权等方面持续加*。政府也通过打造创新平台、配套政策与资源,吸引AI机构与人才,共同开拓AIGC应用新场景。


六、算力基石:大模型开发平台与实践 🛠️

上一节我们探讨了AI在城市治理中的应用,本节中我们来看看支撑大模型发展的数字基础设施与开发平台。

大模型落地产业,需要低门槛、高效率的工具平台。京东云“言犀”AI开发计算平台旨在解决这一问题,其架构分为三层:

以下是平台的三层架构:

  1. T1基础设施层:高性能计算平台。兼容多种GPU和低延迟网络,提供统一的高性能存储引擎,支撑从数据准备到模型训练的全流程。
  2. T2模型全生命周期开发层:支持从数据准备、开发、微调、评测到部署的全流程。提供有代码和无代码两种微调方式,并支持模型缩放、拼接等高级功能。
  3. T3智能体构建层:助力企业完成模型到应用的“最后一公里”。提供智能体构建、流程编排、插件管理等功能,并内置行业通用模板,加速应用落地。

基于该平台,可以快速构建各类企业级智能应用。例如,在营销增长场景,智能体可自动完成费用申请、活动页面搭建、策略配置、数据分析等复杂任务链条。

大模型在企业端的落地形态可分为三个阶段:

  1. 融合:在现有业务场景中嵌入大模型能力进行局部提升(如智能助手)。
  2. 重构:基于大模型完全颠覆原有业务解决方案(如数字人直播)。
  3. 原生:探索完全基于大模型能力衍生出的全新应用。

目前,京东在代码生成(“京易码”)、新能源电池设计知识中台、航空公司员工智能咨询等场景均已实现落地。平台的目标是“来自产业,理解产业,服务产业”,推动大模型与AIGC产业的蓬勃发展。


七、AI重塑医疗健康服务 🏥

上一节我们了解了支撑大模型的开发平台,本节中我们进入一个关键垂直领域:医疗健康。

医疗服务存在“不可能三角”:难以同时实现低成本、高质量和高便捷性。技术是打破这一三角的关键力量。人工智能被视为当前最大的机遇。

京东健康基于“精良千寻”医疗大模型构建了技术底座,融合多模态临床数据,并在此基础上开发了智能问诊、诊断、问答、数字疗法等产品,形成面向患者、医生、医院、企业的四大解决方案。

医疗大模型的发展聚焦三个核心:

  1. 提升安全围栏:在医疗场景,模型需达到极高的准确性(如99%以上),并学会在不确定时“拒答”,严守安全底线。
  2. 与院内系统结合:让大模型有效适配医院现有的、算力有限的信息化系统。
  3. 与个人数据结合:探索在保护隐私的前提下,让模型与患者个性化数据持续学习,实现真正的个性化健康管理。

垂直大模型的关键在于“说行内话”,获得行业认可。这意味着模型需遵循循证医学指南,符合医学推理逻辑。在训练中需深度融合医学知识、专家系统与业务工具。

识别合适的落地场景至关重要。京东健康探索了多个场景:

  • 诊前智慧服务:数字医生助理在患者候诊时进行预问诊,开具检验检查单,减少院内等待时间。
  • 诊间医生Copilot:作为医生的智能助手,辅助诊断、生成病历,提升效率并沉淀诊疗数据。
  • 诊后慢病管理:通过数字助理和IoT设备,持续跟踪患者康复情况,提高用药依从性,降低复发风险。
  • C端健康助手:通过产品(如“ABC健康”)为用户提供日常健康建议与医疗资源连接。

AI技术的目标,是推动中国医疗产业向更高效、更普惠、更个性化的方向发展。


八、AIGC成为品牌营销新生产力 📈

上一节我们探讨了AI在严肃医疗领域的应用,本节最后,我们来看AI如何在消费品营销端转化为实际生产力。

对于伊利这样的消费品集团,营销环境已变:消费者在新媒体渠道获取信息,品牌需每日生产并分发海量内容触达用户。这要求内容生产能力从“年/条”级跃升至“日/万条”级。

伊利数字科技中心构建了“数字内容中心2。0”,利用AI工具闭环管理从洞察、创意、制作、分发到数据分析的全流程。其核心是将AI能力嵌入内容运营的五大痛点流程:

以下是AI赋能内容营销的核心流程:

  1. 内容洞察提效:利用AI分析海量营销热点,快速匹配品牌调性,指导内容选题,降低试错成本。
  2. 创意策略提效:探索用生成式AI进行灵感生成和脚本创作,最终目标实现“文生视频”。
  3. 内容生产提效:这是应用最广泛的环节。包括:
    • 数字人直播:用数字人进行24小时直播,复用优秀话术,成本降至真人直播的十分之一以下。
    • AI混剪视频:基于模板批量生成视频,通过大量经销商、导购触点分发,极大提升内容覆盖效率。
    • 文生图/图生视频:特别适用于宠物产品等拍摄成本高、可控性差的场景,能大幅降低广告制作成本。
    • AI外呼:采集明星或专家声纹,生成带有情感的关怀式外呼,提升用户体验而非简单营销。
  4. 内容管理提效:利用AI进行素材自动打标、分类与合规检查,处理每日数万条素材,并反向沉淀有效内容标签指导生产。

AI在营销端的应用,已从节省成本的工具,演进为驱动增长、创造新体验的核心生产力。其未来在于与业务场景深度结合,探索更多原生创新模式。


课程总结 📚

本节课中,我们一起深入探讨了AIGC与大模型技术的前沿发展与产业实践。我们从大模型的可控性与对齐问题出发,了解了扩散模型的生成与控制原理。接着,我们探讨了边缘计算如何让大模型更贴近用户,并深入各行各业,看到了其在企业创新、城市治理、医疗健康和品牌营销等领域的具体应用与价值创造。最后,我们也了解了支撑这一切的算力基础设施与开发平台。整个旅程表明,技术正从实验室快速走向产业,在解决实际问题的过程中不断演进,其目标是创造真正普惠、高效、智能的未来。

23:探索AI办公最佳实践 🚀

在本节课中,我们将学习金山办公在AI办公领域的最新战略与实践。课程内容涵盖面向个人、政府及企业的AI产品发布,通过具体功能演示,展示AI如何提升办公效率、优化工作流程并赋能组织数字化转型。


一、 AI办公的战略演进与发布

上一节我们介绍了课程的整体框架,本节中我们来看看金山办公AI战略的升级与核心发布。

自2023年发布以来,WPS AI持续创新。经过一年的实践,其战略从1.0升级至2.0。新的战略不再仅从AI能力(如AIGC、Copilot、Insight)角度划分,而是从用户场景出发,聚焦三个核心领域:

  1. 面向个人用户(To C)的WPS AI办公助手
  2. 面向政府(To G)的WPS AI政务版解决方案
  3. 面向企业(To B)的WPS AI企业版

金山办公CEO张庆源指出,经过市场验证,纯粹的LUI(语言用户界面)交互模式在办公效率场景中存在局限。因此,WPS AI 2.0采用了 AGUI(智能图形界面)加 LUI 的整合交互方式,旨在提供更自然、高效的办公体验。


二、 WPS AI办公助手:四大效率神器

上一节我们了解了AI办公的战略布局,本节中我们将深入探讨面向个人用户的四大AI办公助手。

经过产品实践,WPS AI将能力整合为四个具体的助手,帮助用户从不同维度完成日常工作。以下是这四个助手及其核心功能:

1. AI写作助手

写作助手整合了AI续写、润色、扩写等能力,旨在让写作更流畅。

  • AI伴写:在用户写作时,AI实时预测并给出后续句子建议(以灰色文字显示)。用户若满意可按 Tab 键采纳,若不满意可继续自行输入,AI会根据新内容调整建议。公式用户输入 + AI预测 -> 按Tab采纳/继续输入
  • AI全文润色:将AI润色与WPS的“修订”功能结合。AI会以修订模式标注修改处,并在右侧说明修改原因,用户可以逐条接受或拒绝,且原文格式得以保留。

2. AI阅读助手

阅读助手帮助用户快速理解和消化文档内容。

  • AI总结:可快速解析长文档(如学术论文),提取关键词、研究结论、方法等重点信息。
  • AI解释:在阅读时,遇到不熟悉的概念(如“二阶贝齐尔曲线”),可直接让AI在上下文语境中进行解释,无需跳出文档搜索。

3. AI数据助手

数据助手旨在简化数据处理、分析与可视化流程。

  • AI表格操作:通过自然语言指令,让AI执行复杂操作。例如,输入“删除空白行”,AI会自动生成并执行相应的JS代码来完成清理。代码示例(模拟)AI.执行(“删除表格中的空白行”)
  • AI函数:提供特殊的AI函数,可对表格中的文本字段进行智能分类。例如,使用 WPSAI.classify() 函数,可自动将大量用户反馈归类为“服务态度”、“产品质量”等类型。
  • AI数据问答与可视化:支持自然语言转Python代码。用户只需提出如“按产品分类统计总利润并画柱状图”的要求,AI即可在云端执行数据分析并返回交互式图表。

4. AI设计助手

设计助手帮助用户将注意力集中在内容创作,而非样式排版上。

  • AI排版:对于纯内容文档(如毕业论文),AI能自动识别章节标题、摘要等语义,并一键套用预设的排版样式(如国家标准、各高校论文格式)。
  • 风格*隆:可以将一个已设计好的PPT的风格要素(配色、字体、主题)自动提取并应用到另一个内容PPT上,实现快速风格统一。
  • AI图片滤镜:统一PPT中风格各异的图片。选择一个滤镜(如“好莱坞”),可将其一键应用到所有图片,使整体视觉风格保持一致。

三、 WPS AI政务版:可信、高效的公文助手

上一节我们看到了AI如何提升个人办公效率,本节中我们来看看AI在垂直的政务办公场景中的应用。

政务办公场景具有格式严谨、用语规范、安全要求高等特点。WPS AI政务版是针对此场景打造的垂类解决方案,其核心是 一个经过专门训练的政务办公模型

该模型具有以下特点:

  • 专精公文:基于海量政务语料训练,并经过百万级人工精标数据调优,“从小读公文长大”。
  • 安全可信:支持全面信创化部署(客户端与服务端),兼容国产GPU。所有AI生成的回答均提供来源追溯,确保信息准确、可查。
  • 流程融合:将AI能力深度融入公文“撰写-修改-校对-排版”的全流程。

政务版主要提供三大类功能:

  1. 智能问答:回答政务相关问题,答案均附带出处引用,支持延伸阅读。
  2. 公文写作:支持在写作前添加“参考文献”,AI结合素材生成大纲;支持交互式分段撰写、内容扩写、文本润色和智能校对。
  3. 辅助工具:提供一站式智能检索、智能查重等功能,并可集成到现有政务系统中。

四、 WPS AI企业版:构建企业大脑,先备“燃料”

上一节我们探讨了AI在政务领域的深度应用,本节中我们转向更广泛的企业场景,看看AI如何赋能组织。

金山办公的企业AI愿景是 帮助每个组织构建自己的“企业大脑”。WPS AI企业版包含智能基座(AI Hub)、智能文档库(AI Docs)和智慧助理(Copilot Pro)三大组件。

在与超过100家企业客户共创后,金山办公总结出一条关键经验:建设企业大脑,必须先储备AI“燃料”——即企业的知识资产。如果AI不懂企业的专有知识、流程和文档,就无法真正发挥作用。

AI Docs智能文档库 是准备“燃料”的核心工具,它是一个一站式的企业非结构化数据治理方案,具有四大特性:

  1. 升级简单:对于已使用WPS云文档的客户,可一键将现有工作文件夹升级为智能文档库。
  2. 解析*大:依托金山30年文档技术,能精准解析复杂格式的文档(如多栏排版、含图表公式的PDF),确保信息提取准确。
  3. 权限继承:与WPS完整的文档权限体系打通,AI问答时自动进行权限校验,确保员工只能获取其有权访问的信息。
  4. 文档结构化:通过自然语言描述,即可从大量文档(如合同)中批量提取指定字段信息,并可通过API对接其他业务系统。

实践路径建议:企业启动AI办公的最佳实践是 先部署智能文档库,推动文档上云,将散落在员工电脑、邮件、OA附件中的知识集中化管理。当AI拥有了充足、准确的企业知识“燃料”后,才能通过智能问答、智能创作等应用,真正提升员工效率,并逐步与业务系统集成,构建专属的“企业大脑”。


课程总结

本节课中我们一起学习了金山办公WPS AI 2.0的战略全景与落地实践。我们从面向个人的四大AI办公助手(写作、阅读、数据、设计)看到了AI如何提升单点工作效率;从政务版看到了AI在垂直场景中如何做到安全、可信、流程融合;从企业版学到了构建组织级AI能力的关键在于 先行治理和沉淀企业知识资产。AI正从“玩具”变为真正的“工具”,深入办公核心流程,驱动办公领域新质生产力的发展。

24:几何机器学习与意识模型 🧠

在本节课中,我们将学习两个前沿领域的核心思想:几何机器学习意识计算模型。我们将从对称性这一古老数学概念出发,探讨它如何成为现代人工智能架构(如图神经网络)的设计基石,并了解一个受大脑启发的、形式化的意识模型——意识图灵机。


第一部分:几何机器学习 🔷

上一节我们概述了课程的两个主题,本节中我们来看看第一个主题:几何机器学习。它的核心思想是,许多成功的神经网络架构(如卷积神经网络)的成功,并非偶然,而是因为它们内建了数据所固有的对称性

对称性的悠久历史

对称性是人类理解秩序、美丽与完美的关键。古希腊哲学家柏拉图认为,对称的多面体(柏拉图立体)是构成世界的基础。几何学自欧几里得时代起,就建立在五大公理之上。

然而,关于平行线的第五公设引发了长达数个世纪的争论。直到19世纪,数学家们(如高斯、罗巴切夫斯基)才意识到,可以构建不依赖于该假设的、自洽的非欧几里得几何。这导致了多种几何(仿射、射影、双曲几何等)的“动物园”出现。

*莱因的埃尔朗根纲领

为了统一各种几何,德国数学家费利*斯·*莱因提出了革命性的埃尔朗根纲领。其核心观点是:

一种几何由其变换群所定义。

例如,欧几里得几何由刚体运动群(旋转、平移)定义,在此变换下,长度、角度、平行性保持不变。通过选择不同的变换群(如射影群),就能得到不同的几何。这一思想深刻影响了现代数学和物理学。

从物理对称性到机器学习

在20世纪初,物理学家埃米·诺特证明了可以从对称性推导出守恒定律(如能量守恒源于时间平移对称性)。这最终催生了描述基本粒子和相互作用的标准模型

那么,这与机器学习有何关系?过去十年,深度学习取得了巨大成功,但各种神经网络架构(如CNN、Transformer、GNN)似乎是从不同问题中“偶然”得出的,缺乏统一的数学原理。

几何深度学习旨在改变这一现状。它提出,这些成功架构的共同分母正是对称性与不变性。通过有意识地设计等变不变于特定变换群的网络,我们可以构建更*大、更高效的模型。

监督学习与维度诅咒

考虑一个经典的图像分类问题:区分猫和狗。从数学上看,这是一个函数逼近问题:我们有一些样本点(带标签的图片),希望预测未知点的函数值(新图片的标签)。

神经网络是*大的函数逼近器。然而,一个理论问题是维度诅咒:在高维空间中(如图像像素空间),要逼近一个复杂函数所需的样本数量会指数级增长,变得完全不切实际。

解决方案是引入几何先验:我们不需要网络从零开始学习所有规律,而是将我们对问题结构的先验知识(对称性)内建到网络架构中

卷积神经网络:平移不变性

卷积神经网络是这一思想的典范。其核心设计源于对视觉皮层的研究:

  1. 局部连接:神经元只对输入的一小片区域(感受野)响应。
  2. 参数共享:相同的滤波器(卷积核)被应用于输入的不同位置。

这带来了关键属性:平移不变性。无论猫出现在图像的哪个位置,网络都能识别它。这种内置的对称性极大地减少了需要学习的参数量,打破了维度诅咒。

公式描述卷积操作
对于一个二维图像输入 I 和卷积核 K,在位置 (i, j) 的输出 S(i, j) 为:
S(i, j) = (I * K)(i, j) = Σ_m Σ_n I(i-m, j-n) K(m, n)
其中 * 表示卷积运算。参数 K 在整个图像上共享。

图神经网络:置换不变性

许多数据天生是图结构的,如社交网络、分子、知识图谱。图中的节点没有自然的顺序,因此,处理图的神经网络必须对节点的排列顺序保持不变,即具备置换不变性

图神经网络通过消息传递机制实现这一点:

  1. 每个节点从其邻居节点收集信息(消息)。
  2. 使用一个对输入顺序不敏感的函数(如求和、求平均、求最大值)来聚合这些消息。
  3. 更新节点自身的状态。

这个过程在图中所有节点上重复进行。最终,整个图的表示可以通过另一个置换不变函数(如全局池化)来获得。

代码描述消息传递(伪代码)

for each node v in graph:
    # 1. 聚合邻居消息
    neighbor_messages = aggregate([h_u for u in neighbors(v)])
    # 2. 结合自身信息更新状态
    h_v_new = update(h_v, neighbor_messages)

几何图与 SE(3) 不变性

对于分子这样的几何图,节点(原子)不仅具有类别特征(原子类型),还具有三维空间坐标。分子的化学性质应不随其在空间中的旋转和平移而改变,即需要 SE(3) 不变性(特殊欧几里得群,包含旋转和平移)。

先进的图神经网络能够同时处理节点的类别特征和几何坐标,确保其预测对于分子的刚体运动是不变的。这在药物发现中至关重要,可以用于虚拟筛选数以亿计的分子,快速找到有潜力的候选药物。

在结构生物学与生成式AI中的应用

几何深度学习在科学领域取得了突破性成果:

  • 蛋白质结构预测:DeepMind的AlphaFold利用等变Transformer网络,仅从氨基酸序列就能高精度预测蛋白质的三维结构,解决了生物学界长达50年的重大挑战。
  • 蛋白质与药物设计:研究人员可以使用几何生成模型(如扩散模型)从头设计具有特定功能(如结合癌细胞靶点)的新型蛋白质或小分子,这些是自然界中从未存在过的。
  • 生成式AI:扩散模型等生成技术同样受维度诅咒困扰。通过引入几何约束(如在三维流形上操作),可以更高效地生成分子、蛋白质等复杂结构。

本节总结:在本节中,我们一起学习了几何机器学习的核心思想。我们看到,从古希腊的对称性观念,到*莱因的变换群理论,再到现代神经网络,对称性始终是理解和创造秩序的关键。通过将数据域的几何结构(如网格、图、流形)和相应的对称群(平移、置换、旋转)明确地编码到网络架构中,我们可以构建出更*大、更高效、更可解释的AI模型,并解决从计算机视觉到药物设计等一系列重大问题。


第二部分:意识图灵机模型 🤖

上一节我们探讨了如何用几何原理指导AI模型设计,本节中我们来看看一个更根本的问题:如何为意识本身建立一个形式化的计算模型。意识图灵机是一个试图解释意识现象并启发通用人工智能的数学模型。

为何研究意识?

意识——我们所看、所听、所感、所梦的一切——仍然是科学中最重大的未解之谜之一。理解意识不仅有助于我们认识自身,也可能为构建真正的通用人工智能提供蓝图。

理论计算机科学通过考虑资源限制(如计算时间、内存),为解决一些关于意识的古老悖论(如自由意志)提供了新视角。

全球剧场模型

神经科学家伯尼·巴斯提出了一个直观的意识模型:全球剧场。在这个比喻中,心智像一个剧场,众多无意识的“观众”(处理器)坐在台下。意识的内容就是舞台上“演讲者”所讲述的东西。当遇到问题(如忘记名字)时,相关的“观众”会尝试解决,并可能走上舞台广播信息。

意识图灵机的核心思想

意识图灵机融合了图灵机的形式简洁性和全球剧场模型的神经科学见解。它是一个高度简化的数学模型,旨在形式化地定义和解释意识。

以下是CTM的关键组成部分:

  1. 离散时间:以大约100毫秒为一个“滴答”,对应大脑的阿尔法节律。
  2. 有限处理器:包含约1000万个处理器,类比于大脑皮层中的皮层柱。
  3. 有限寿命:处理器的数量大致等于模型运行的总滴答数,这赋予了模型一个有限的“生命”跨度。
  4. 无中央执行者:与传统模型不同,CTM没有“总裁”或“指挥”来决定什么重要。决策通过一个锦标赛机制自下而上产生。
  5. :处理器间交流的基本信息单位,包含内容、生成时间、*度(重要性)和情绪(积极/消极效价)。

意识如何产生?

在CTM中,意识体验被定义为广播到所有处理器的信息块。每个处理器都能“听到”这个广播,从而“知道”当前意识的内容。

  • 意识的注意:即被广播的特定内容。
  • 意识的觉察:源于一个不断更新的世界模型,它预测接下来会发生什么,并让我们感觉在持续体验一个连贯的世界。

决策过程通过“赢家通吃”的锦标赛树实现:处理器两两竞争,获胜者获得失败者的“权重”(代表其信息的重要性)。最终到达树顶(即被广播)的块,其概率与它的总权重成正比。这确保了最重要的信息最有可能进入意识。

从婴儿到学习

我们可以用CTM模拟一个婴儿的心智发展:

  • 初始状态:处理器之间没有连接,权重随机。
  • 需求产生:专门的“计量器”处理器(如饥饿、疼痛)会因生理需求而增加其权重。
  • 首次意识:当某个需求(如缺氧)的权重累积到足以赢得锦标赛时,相应的块(“我需要氧气!”)被广播,触发输出(哭泣)。
  • 学习:哭泣行为带来了氧气(积极结果),这个因果联系被处理器学习并存储。婴儿逐渐学会通过特定行为来解决不同问题。

CTM的意义与验证

CTM是一个形式化模型,其正确性可以通过回答一系列既定的哲学和科学问题来检验。它避免了引入不必要的复杂性(奥卡姆剃刀原则),并试图证明,即使在完全确定的计算系统中,现象意识自由意志的体验也是可能出现的。

这个模型不仅为理解意识提供了新框架,也为构建AGI指明了方向:一个由大量异构、协作的专业处理器(如多个“谷歌”和“ChatGPT”实例)组成的系统,通过竞争和广播机制形成统一的智能体。

本节总结:在本节中,我们一起探索了意识图灵机这一大胆的理论模型。它将意识视为一个由大量并行处理器、通过特定通信和竞争规则涌现出来的计算过程。尽管高度简化,但CTM为我们形式化地思考意识、自由意志乃至通用人工智能的架构,提供了一个清晰且可计算的起点。


课程总结:在本节课中,我们一起学习了两个看似不同但深层相连的前沿领域。几何机器学习告诉我们,将世界的对称性结构内建于AI模型,是解决复杂高维问题的关键。意识图灵机模型则尝试用计算和形式化的语言,解释我们最内在的体验——意识本身。两者都体现了用清晰、基本的数学原理来理解和创造复杂智能系统的追求,共同指向了未来人工智能发展的智创之路。

25:智能社会与全球治理框架 🧠🌐

课程概述

在本节课中,我们将学习2024年世界人工智能大会智能社会论坛的核心内容。课程将聚焦于人工智能(AI)技术的发展、其带来的社会影响,以及构建全球治理框架的必要性与挑战。我们将从政策制定、技术应用、社会治理和国际合作等多个维度进行探讨。


一、论坛开幕与领导致辞 🎤

本次论坛由同济大学与上海市杨浦区人民政府联合举办,主题为“智能社会与全球治理框架”,旨在促进人工智能向善发展,造福人类社会。

领导致辞要点

以下是各位领导致辞的核心内容:

  • 上海市网信办副主任杨鑫:*调中国高度重视人工智能发展与全球治理,提出了“全球人工智能治理倡议”。杨浦区与同济大学共建的国家智能社会治理实验综合基地取得了显著成果,未来应加快推出服务治国理政的实验成果、落地前沿技术应用,并*化国际合作。
  • 上海市教育委员会副主任王浩:指出人工智能是上海着力发展的先导产业,教育需主动拥抱智能时代。他建议妥善平衡治理与发展、深入应用场景探索治理规则,并加*人工智能科技和治理人才的培养。
  • 同济大学党委书记方守恩:介绍了同济大学在人工智能领域的战略布局与成果,包括一系列国家级研究平台和“人工智能赋能学科创新发展行动计划”。学校将全面加快构建人工智能赋能教育教学的新形态。
  • 杨浦区委副书记、区长周海英:阐述了杨浦区在构建以数字经济为核心的产业体系和探索智能社会治理方面的努力。杨浦将着力打造人工智能产业新高地,并用心开拓智能社会治理实验田。

过渡:在了解了宏观的政策导向与区域实践后,接下来我们将具体看看论坛上发布了哪些重要的研究成果与实践项目。


二、专题成果发布 📚

本环节集中发布了一系列由同济大学、杨浦区及合作单位取得的智能社会建设相关成果。

发布成果列表

以下是发布的五项主要成果:

  1. 数字孪生底座IS3基础设施智慧服务系统:由同济大学自主研发,旨在将传统物理基础设施快速改造为数字基础设施,支撑数字治理、经济和生活的各类应用。其核心公式可概括为:物理设施 + 数字化改造 = 数字孪生底座
  2. 负责任人工智能风险管理指南:由艾森哲与同济大学联合编制。指南将AI风险分为对人、对组织、对生态三个层面,并建议企业从合法合规、嵌入原则、领导推动、建立文化四个维度进行管理。企业可根据成熟度(领军探索者、创新建设者、实践起步者)采取相应行动。
  3. 全球人工智能治理数据库:由同济大学开发建设,旨在汇集全球人工智能治理相关的政策、法规与案例,为研究与实践提供数据支持。
  4. 人工智能伦理、法律与智能社会治理系列丛书:共12本,由同济大学、杨浦区国家智能社会治理实验综合基地等单位策划出版,系统探讨相关前沿议题。
  5. 上海市杨浦区十大垂类大模型应用场景需求榜单:面向全社会“揭榜挂帅”,征集包括智能文娱、智能制造、智慧教育、智慧医疗等十大垂直领域的大模型落地方案,促进AI与实体经济深度融合。

过渡:这些成果展示了从技术底座到治理框架、从理论研究到场景应用的全面探索。那么,来自全球的顶尖专家学者对此又有哪些深刻的见解呢?


三、主旨演讲精要 🎓

六位国内外专家围绕智能社会的机遇、挑战与治理分享了他们的见解。

专家观点摘要

  1. 金耀初教授(西湖大学):回顾了AI发展历程,指出当前大模型仅有约60%的输出与人类认知吻合。他系统梳理了AI在安全性、隐私、公平性、可解释性等方面的风险及技术应对方案,并比较了中、美、欧治理法规的异同。他*调,治理应聚焦于AI产品与应用,而非单纯限制技术。
  2. 吴志*院士(同济大学):基于十年城市智能化实践,提出了“海主义”(HI,Human+AI)理念,*调人与AI的深度合作与共生共创。其五项原则是:人本互动、透明互信、安全互保、互动互控、伦理互吁
  3. Gabriele Mazzini(欧盟委员会,线上):详细解读了欧盟《人工智能法案》。该法案采用基于风险的分级监管模式,禁止不可接受的风险(如社会评分),对高风险AI系统实施严格准入(CE认证),并对通用人工智能模型(特别是具有系统风险的模型)设定了透明度与安全义务。
  4. Matt Sheehan(卡内基国际和平研究院):探讨了中美AI对话。他认为政府层面达成硬性协议困难,但“自上而下”的信号释放和“自下而上”的“平行安全”实践(科学家、企业、学者间的交流与最佳实践分享)更为现实且重要。
  5. Lu Kai(耶鲁大学):对比了中美AI治理生态的差异。美国治理权力分散,*调自愿准则与言论自由;中国则呈现从中央到地方、从政府到企业的多层次治理特征。他建议在开源AI、医疗AI、地方治理等具体领域加*对话。
  6. 苏俊教授(清华大学):从社会科学角度指出,AI在形成新质生产力的同时,也带来了信息茧房、群体极化、劳动替代、能源消耗等深层社会挑战。他呼吁精英、政府、群众和企业共同参与治理,为智能社会嵌入人文精神,探索“智能人文”发展道路。

过渡:专家们的演讲从技术、伦理、法律、国际关系等多角度勾勒出智能社会治理的复杂图景。那么,在具体的圆桌对话中,实践者们又碰撞出了哪些火花?


四、圆桌对话:治理的实践与碰撞 💬

本环节围绕AI治理中的核心矛盾与可行路径展开了深入讨论。

对话核心议题与观点

  • 全球治理与合作:*仁涵教授指出,AI基础理论体系尚未建立,导致结果不可控,治理至关重要。他认为中、美、欧治理模式各具特色,需在技术标准、知识产权、法律法规和共同监管上加*合作。他*调,没有中国参与的全球AI治理是难以想象的
  • 安全与发展的平衡:钟宁华教授以宏观经济预测和地方债务风险识别为例,说明了AI在经济治理中的赋能作用。平衡安全与发展的关键在于对训练数据的有效治理与隐私保护。
  • 数字权利与社会创新:吕鹏教授认为,维护数字时代的社会权利,除了立法与监管,更需要通过“社会创新”,利用技术手段(如社区治理APP)解决具体社会问题,赋能公民。
  • 企业视角:陈浩(字节跳动)从实践出发,认为当前AI技术本质仍是概率模型,远未达到威胁程度。企业看到的是AI在翻译、知识问答等场景中提升效率、替代重复性工作的巨大价值,当前应更关注如何让其蓬勃发展以增进福祉。
  • 总结:*仁涵教授用一句话总结:“AI是否要被关到笼子里?当前不一定,不远的未来必须。” 这揭示了发展与治理之间的动态平衡关系。


课程总结 🏁

本节课我们一起学习了智能社会建设与全球治理框架的前沿探讨。我们了解到:

  1. 政策层面:中国正积极推动人工智能向善发展与治理,并通过国家实验基地进行前沿探索。
  2. 技术层面:数字孪生、大模型等技术的发展既带来了效率革命,也伴生着安全、伦理等风险。
  3. 治理层面:全球主要经济体采取了不同的治理路径,但加*跨国、跨领域对话与合作已成为共识。
  4. 未来方向:构建智能社会的核心在于追求“人机共生”(海主义),平衡发展与安全,并最终以人文精神引领技术发展,实现“为万世开太平”的愿景。

智能社会的治理是一项长期、复杂且需全球共商共建的系统工程,需要政府、企业、学界与公众的共同努力。

26:2024商汤科技人工智能论坛核心内容解析与教程 🚀

在本课程中,我们将学习2024年商汤科技人工智能论坛的核心内容。本次论坛以“大爱无疆·向新力”为主题,汇聚了政府领导、行业专家、企业领袖及国际伙伴,共同探讨了人工智能(AI)技术的最新进展、产业应用、生态构建及国际合作。我们将重点解析大模型技术、智能汽车、智慧医疗、AI出海等关键议题,并以教程形式呈现,帮助初学者理解AI发展的前沿动态。


一、论坛开幕与领导致辞 🎤

论坛由商汤科技主办,世界人工智能大会组委会指导。多位上海市政府及临港新片区的领导出席并致辞,*调了人工智能作为新一轮科技革命和产业变革的核心驱动力。

上海市政府副秘书长庄木娣指出,上海已将人工智能作为三大先导产业之一,着力建设人工智能新高地,打造世界级产业集群。她鼓励关键核心技术攻关,支持通用大模型和垂直大模型的研发,并优化产业生态环境。

上海国有资本投资有限公司董事长袁国华分享了发展新生产力需要金融供给体系变革的观点。他提出,国有投资平台应发挥战略引领作用,支持人工智能产业,特别是在早期技术攻关和长周期投资方面。

核心公式新生产力 = 创新驱动 + 先进技术态


二、智能网联汽车的中国方案 🚗

上一节我们介绍了论坛的宏观背景与政策支持,本节中我们来看看人工智能在垂直领域——智能网联汽车中的具体应用。

中国工程院院士***教授发表了主旨演讲。他提出,智能网联汽车的发展应走“车路云一体化”的中国方案,而非单一依赖单车智能。

以下是该方案的核心要点:

  1. 一体化架构:基于新一代移动通信技术,实现车、路、云的深度融合。
  2. 两大技术特征:分层解耦与跨域共用,避免形成“烟囱式”系统。
  3. 三大标准:符合中国的道路法规、联网要求及产品标准。

*院士*调,自动驾驶大模型的训练需要海量性、完备性和准确性的数据。单一车企的数据无法满足完备性要求,必须通过车路云一体化系统,汇聚多方数据(包括路侧“上帝视角”),才能训练出可靠的模型。

他同时澄清了对特斯拉FSD的两个常见误解:第一,FSD仍是高级辅助驾驶,并非无人驾驶;第二,FSD本身也依赖云系统,并非纯粹的单车智能。

核心代码(概念性)

# 车路云一体化数据汇聚
def data_collection(vehicle_data, roadside_data, cloud_data):
    # 实现多源数据时空对齐与融合
    fused_data = align_and_fuse(vehicle_data, roadside_data, cloud_data)
    return fused_data

![](https://github.com/OpenDocCN/dsai-notes-pt1-zh/raw/master/docs/waic24/img/015082cd9172c91bfbf2417f45f7c01b_15.png)

![](https://github.com/OpenDocCN/dsai-notes-pt1-zh/raw/master/docs/waic24/img/015082cd9172c91bfbf2417f45f7c01b_17.png)

# 用于大模型训练的数据需具备三性
def check_training_data(data):
    if data.massive and data.complete and data.accurate:
        return True
    else:
        return False


三、大模型产业生态与空间载体 🏙️

临港集团数创平台董事长陈海慈介绍了全国首个专注于大模型生态的社区——“模术空间”。该空间通过提供算力、数据、评测、金融和备案服务五大共性平台,快速集聚了近百家大模型企业。

陈海慈分享了对产业趋势的观察:

  • 算法层:马太效应显著,头部模型已现,同时端侧模型小型化与压缩技术成为热点。
  • 供给层:国产算力、AI基础设施(Infra)及高质量数据是重要发展机遇。
  • 应用层:价值在自动驾驶、生物医药、AIPC/AI手机及AIGC四个领域涌现较快。

他特别指出,生成式AI带来的是生产范式的变革,如同互联网改变了知识获取方式一样深刻。


四、商汤科技新品发布:日日新5.5与绝影智能汽车 🆕

作为全球领先的AI公司,商汤科技发布了其大模型体系“日日新(SenseNova)”的最新升级。

日日新5.5 的核心升级

商汤科技董事长兼CEO徐立博士介绍,日日新5.5在短时间内实现了大幅性能提升:

  1. 基础能力提升:通过合成高阶思维链数据,将基座模型的推理与逻辑能力平均提升30%。
  2. 交互模式革新:推出国内首个“所见即所得”的流式交互模型——日日新5o(类似GPT-4o),重新定义人机交互。
  3. 端侧体验优化:端侧模型性能精度提升10%,首包延迟降低40%,推理效率提升15%,并推出9.9元包年的亲民价格,推动AI普惠。

现场演示了5o模型实时解析视频画面、进行多轮对话的能力,展现了*大的多模态交互潜力。

核心公式模型性能提升 = 基础模型 + 合成高阶思维链数据

绝影:智能汽车向超级智能体进化

商汤科技联合创始人王小刚博士发布了基于多模态大模型的智能汽车产品。

  1. 端云协同架构:率先实现原生多模态大模型在车端部署,在250TOPS算力平台上,首包延迟控制在200-300毫秒。
  2. DriveAGI:端到端自动驾驶方案。与“两段式”(感知与决策分离)方案不同,商汤的“一段式”方案输入视频,直接输出行驶轨迹,能更充分发挥大模型潜力,具备通用智能和更好的场景理解能力。
  3. 座舱交互变革
    • Flex Interface(随心界面):业内首个具备车载屏幕界面生成能力的产品,可根据用户指令(如“欧洲杯主题”)实时生成个性化UI。
    • Agent Flow:能理解车载App界面,并通过自然语言指令替用户操作(如“找一家能看欧洲杯的餐厅并预订”),实现任务自动化。


五、垂直行业应用案例 🏥

人工智能与大模型的结合正在深入各个垂直行业,解决实际痛点。

病理大模型:PaOrchestra

中华医学会病理学分会副主任委员王哲介绍了与商汤等机构联合开发的病理大模型。该模型利用30万张数字病理切片,涵盖20多种器官,能完成细胞分割、肿瘤分类、淋巴瘤诊断等100余种下游任务,旨在缓解我国病理医生短缺、分布不均的问题,提升诊断准确性与效率。

智慧医疗生态共创

论坛上举行了“智启未来-大模型赋能智慧医院创新示范”共创仪式,联合了商汤科技、上海市数字医学创新中心、华西医院、新华医院、清华长庚医院等机构,共同推动AI在医疗领域的落地应用。

AI出海:泰语大模型

商汤科技与泰国DTGO公司联合发布了泰语大模型。该模型具备中泰语互译、文化适配、本地知识库查询等功能,旨在帮助中国企业在泰国更好地理解当地法规、提升旅游服务质量,并助力泰国产业提升竞争力。


六、圆桌论坛:共建AI新生态 💡

在题为“共赢大模型时代,共建AI新生态”的圆桌论坛中,来自媒体、投资、金融、咨询、数据中心等行业的嘉宾分享了洞见:

  • 人民网 叶蓁蓁:经历从“震惊-焦虑-激动”的心路历程,认为颠覆必然,机会巨大。人民网聚焦“用AI治理AI”,建设主流价值语料库,并对内重构组织结构以拥抱AI。
  • 弘毅投资 曹永刚:AI正在改变投资行业的人才结构(基础分析能力被取代),并成为判断所有行业和企业的重要维度。投资机会存在于To C应用、行业效率提升、新载体(如眼镜、机器人)及上游算力基础设施。
  • 国泰君安证券 俞枫:金融行业积极拥抱AI,从“赋能”走向“变革流程”。正结合大模型与自身多年积累的语料、知识库,打造服务客户和投行业务的专属模型,以提升核心竞争力。
  • 上咨集团 孙卫:AI深刻改变了知识工作。咨询行业利用AI自动化简单工作,并借助其*大的案例与数据分析能力,让高级顾问聚焦于高附加值思考,未来可能重塑全业务流程。
  • 万国数据 梁艳:作为算力底座提供方,感受到客户需求剧变:单机柜功耗从几千瓦跃升至最高120千瓦;订单体量达100兆瓦起;交付速度要求极高(8.5个月完成海外数据中心建设);选址更看重能源保障与成本。

总结 📝

本节课中我们一起学习了2024商汤科技人工智能论坛的核心内容。我们了解到:

  1. 政策与资本正合力推动AI成为新质生产力的核心引擎。
  2. 技术发展上,大模型正朝着更*推理、更自然人机交互、更高效端云协同的方向演进。
  3. 产业落地在智能汽车(车路云一体化、端到端自动驾驶)、智慧医疗(病理诊断)、AI出海(本地化模型)等领域取得显著进展。
  4. 生态构建需要算法、算力、数据、应用、资本、政策等多方协同,形成“创新链-产业链-资金链-人才链”的深度融合。

人工智能的“超级时刻”依赖于我们共同营造的“超级应用”。未来已来,这场由技术驱动的深刻变革,正在重塑各行各业,并创造无限可能。

27:模型即服务(MaaS)加速大模型应用落地 🚀

概述

在本节课中,我们将学习模型即服务(MaaS)如何加速大模型在各行各业的落地应用。课程内容整理自阿里云主题论坛,涵盖了从大模型技术发展、开源生态、端侧部署到产业实践的全链条知识。我们将深入探讨核心概念,并通过公式和代码示例帮助初学者理解。


一、 开场致辞与行业背景

尊敬的各位来宾,阿里云“加速大模型应用落地”主题论坛活动即将开始。请尽快就座,并将手机调至静音模式。

人工智能已成为社会关注的焦点,大模型与AIGC技术正推动产业革命,催生新的商业模式。AI正成为引领时代发展的重要引擎,推动社会向智能化、数字化迈进。本次论坛汇聚产学研各界嘉宾,旨在深度探讨大模型的前沿技术、开发经验与应用落地。

上海市经济和信息化委员会副主任汤文侃先生为论坛致辞。他指出,大模型技术创新体系加速演进,已进入全面应用阶段。上海正着力打造世界级人工智能产业集群,具体表现在三个方面:

  1. 大模型龙头企业不断集聚:全市已有34款大模型通过备案,应用于制造、金融等领域。
  2. 自主可控计算生态不断升级:突破关键环节,已有数十款智能芯片流片量产,并建成规模化智算中心。
  3. 要素资源能级不断提升:通过大模型语料数据联盟,已开源4200亿token的语料数据。

面向未来,上海将夯实产业基础底座、加速人工智能落地应用、培育开源活跃生态。


二、 阿里云MaaS体系进展

上一节我们了解了行业背景,本节中我们来看看阿里云在模型即服务(MaaS)体系内的最新进展。阿里云首席技术官周靖仁先生指出,以模型为中心延展技术体系至关重要。

阿里云在两年前首次提出Model as a Service概念,如今已成为云上AI服务发展的重要方向。MaaS涉及多个层次:底层云计算支持、模型生态发展、开发者环境以及业务场景适配。

1. 模型层:通义大模型与开源战略

阿里云在模型创新上持续发力,通义千问系列模型能力不断增*。同时,阿里云坚持开源策略,旨在降低模型使用门槛,促进AI产业发展。

以下是通义开源模型家族的部分矩阵:

  • 通义千问-Qwen2:新一代开源模型,被评价为全球最*开源模型之一,在代码、推理、逻辑思考方面能力大幅提升。
  • 通义灵码:基于通义千问的编程助手,已集成到各种IDE中,拥有超过350万下载量。企业版可结合本地代码库,提供更精准的代码助手功能。
  • 通义APP:全能的AI助手,集成了听悟、万象等能力,覆盖工作、学习、生活场景。

2. 平台层:阿里云百炼

模型要应用到各行各业,需要进行定制化适配。阿里云百炼平台旨在结合云能力与模型能力,适配企业专属信息。

百炼平台的核心功能包括:

  • 丰富的模型生态:集成通义家族、开源模型及其他第三方模型,供开发者按需选择。
  • 极致的推理成本优化:通过提升推理架构的弹性与性能,持续降低大模型使用成本。
  • 低门槛的开发环境:提供以模型为中心的开发流程,简化模型定制。

为了帮助企业进行业务适配,百炼提供了以下关键工具链:

a. Prompt Engineering优化

  • 提供各行业场景的Prompt模板,方便快速上手。
  • 支持通过 Meta Prompting 方式,让模型自动帮助优化Prompt,提升效果。

b. 企业知识融合与RAG框架

  • 支持多种RAG框架,保障数据在客户专属域内的安全。
  • 简化流程,通过少量代码即可将企业知识与大模型融合。
  • 提供高效、低延迟、高并发的专用RAG框架,并自动进行算法调优。

c. Assistant API

  • 通过统一的API,将插件管理、Prompt工程、记忆(Memory)管理等能力编排在一起,提供一站式开发体验,极度简化应用开发流程。

d. 模型微调工具链

  • 提供完整工具链,支持数据准备、模型微调架构支持到评测的全流程,帮助开发者基于百炼底座进行二次开发与有效评估。

此外,百炼产品也已以 Model Studio 的名称部署在阿里云海外基础设施,为出海企业提供全球化支持。


三、 大模型时代的“摩尔定律”

与芯片的摩尔定律类似,大模型的发展也遵循着特定规律。清华大学刘志远教授提出了大模型时代的“摩尔定律”——知识密度的持续增*。

1. 核心概念:知识密度

知识密度是高效大模型的第一性原理,其核心在于用更小的参数规模实现更*的能力。

我们可以用以下公式来理解模型的效率:
模型效率 ∝ 模型能力 / 参与计算的参数规模
一个知识密度更高的模型,意味着其能力更*,且每次计算所消耗的参数规模更小

2. 实践:端侧大模型MiniCPM

面壁智能专注于提升模型知识密度,研发了能在手机等端侧设备运行的MiniCPM系列模型。其关键在于通过“模型沙盒”进行科学化探索,在训练前于小模型上进行成千上百次演练,寻找最优数据与超参配置,并成功外推至大模型。

最新发布的 MiniCPM-S 模型采用了创新的稀疏化架构:

  • 灵感来源:模仿人脑功能分区、稀疏激活的特性。
  • 技术实现:采用ReLU激活函数,使模型在训练中自发涌现渐进式稀疏性。
  • 效果:在保持性能无损的前提下,达到约88%的稀疏度,使全连接层能耗降低约84%,推理速度比稠密模型提升近3倍。

3. 开发套件:MobileCPM

为了加速端侧智能生态发展,面壁智能推出了 MobileCPM 开发套件,旨在让开发者一键开发端侧大模型应用。该套件包含:

  • 基础SDK套件
  • 通用端侧模型
  • 预装了大量“意图”的插件平台

端侧模型具备毫秒级响应、本地计算保护隐私、弱网/无网环境可用等优势,将揭开端侧AI生态的序幕。


四、 产业实践:AIPC与智能助手

大模型技术正在与各类终端设备深度融合,本节我们来看看在个人电脑和手机上的创新实践。

1. 联想AIPC创新实践

联想集团提出了混合式人工智能框架,融合云、边、端三侧智能,并以大模型为基础构建智能体。联想AIPC具备五大特征:

  1. 本地运行的个性化智能体,可与云端大模型协同。
  2. CPU、GPU、NPU的异构计算混合调度。
  3. 掌握跨设备的个人知识库。
  4. 开放的AI应用生态。
  5. 本地的数据安全处理。

关键技术突破

  • 模型压缩与推理优化:通过结构化剪枝、量化、微调等静态优化,以及异构计算调度、KV缓存管理等动态优化,让大模型流畅运行于主流PC。
  • 个人知识库(RAG):对RAG各环节深度优化,并创新性地实现检索器与生成器的协同优化,使二者“相向而行”,提升结果质量。同时支持构建跨设备的分布式索引。
  • 智能体架构:采用大模型+小模型+规则结合的混合方案处理意图理解和任务规划,对于复杂规划问题,引入经典算法(如蒙特卡洛树搜索)与外挂机制相结合的方式。

2. 小爱同学的大模型实践

小米小爱同学作为AI助手,已覆盖手机、汽车、AIoT等多类设备。大模型技术为其带来了跨越式升级:

  • 通用对话:满足度从30%提升至80%以上。
  • 垂直场景:如小米商品助手,通过RAG技术理解复杂知识,回答产品参数、使用指南等问题。
  • NLU任务:利用大模型通用能力,以少量数据微调即可解决各垂直任务,改变“有多少人工就有多少智能”的局面。

小爱同学的技术架构将用户请求分为四类进行处理:

  1. 工具/控制类:由NLU小模型直接执行。
  2. 内容类:大模型理解意图,传统搜索/推荐系统满足需求。
  3. 生成类:大模型直接生成内容。
  4. 知识类:对准确性要求极高,挑战大模型通用能力,依赖模型持续进化。

小爱同学未来将聚焦于:AI Agent复杂任务、多模态场景、OS深度整合以及端侧大模型。


五、 技术普惠:公益项目“追星星的AI”

科技的发展应充满温度。阿里巴巴志愿者联合上海美术电影制片厂等机构,开发了关爱孤独症儿童的公益AI绘本工具——“追星星的AI”。

该项目基于通义大模型和ModelScope Agent,能够根据一句话的故事梗概,生成符合“星宝”(孤独症儿童)认知特点和喜好的有声故事绘本。该项目已上线通义APP公测,并计划将技术开源,以技术捐赠的方式惠及更多家庭。

这体现了“人有了温度,AI才会有温度”的理念,是技术普惠的生动实践。


六、 圆桌讨论:开源共享,生态繁荣

在圆桌讨论环节,来自阿里云、面壁智能、上海AI实验室等机构的专家就大模型开源生态展开讨论。

核心观点摘要

  • 模型发展:通义千问的快速迭代得益于开源社区开发者的持续反馈与共同优化。面壁智能选择深耕端侧模型,是基于对“知识密度”提升和端侧海量算力潜力的判断。
  • 模型评测:评测是模型研发和应用的前置环节。OpenCompass等评测体系旨在保障模型基础能力下限,并需持续进化以应对“刷榜”和评估垂直行业能力。未来需要自动化工具快速构建高精度垂域评测集。
  • 产业落地:阿里云无影产品基于云端一体优势,在系统级整合、用户行为感知、算力无感等方面创新,打造了“小影”智能体,实现跨应用业务流程处理、端云协同管理等能力。
  • 开源社区:魔搭社区围绕大模型与AIGC,提供从推理、微调、评测到RAG的全套工具链,并通过与阿里云百炼平台联动,为企业级用户提供可扩展的生产级能力。

总结

本节课中,我们一起学习了模型即服务(MaaS)的核心内涵与发展现状。我们从阿里云的MaaS体系进展出发,探讨了大模型发展的“摩尔定律”——知识密度,并深入了解了AIPC、智能助手等前沿产业实践案例。最后,我们看到了技术向善的公益应用,并围绕开源生态的繁荣进行了讨论。可以预见,只有实现AI与云的高度协同,并以开源开放降低使用门槛,才能真正推动大模型技术在千行百业的规模化落地,共创智能未来。

28:AI规模新经济——投融资主题论坛核心观点解析 📊

课程概述

在本节课中,我们将学习2024世界人工智能大会投融资主题论坛的核心内容。课程将围绕“AI规模新经济”这一主题,系统梳理多位专家关于人工智能发展趋势、经济影响、投融资机遇与挑战的见解。我们将重点关注AI的规模定律、对宏观经济和产业的影响,以及资本市场如何支持AI创新。


第一节:论坛开幕与核心主题介绍 🎤

本次论坛由中金公司承办,聚焦“AI规模新经济”。论坛指出,自2022年ChatGPT发布以来,全球掀起了AI热潮。当前AI进步的一个突出特征是遵循规模定律(Scaling Law)。中国凭借庞大的人口和市场,有利于加速技术追赶,并可能在应用层实现引领性创新,为经济增长注入新动能。


第二节:领导致辞与宏观展望 🌐

上一节我们介绍了论坛的核心主题,本节中我们来看看与会领导对AI发展的宏观展望。

中金公司董事长陈亮先生指出,人工智能作为新质生产力的代表,正以前所未有的速度重构各行业。中国超大规模市场带来的规模经济优势,有望在AI时代转化为技术发展优势。例如,基于完整的工业体系和庞大数据,AI能助力中国制造业从追赶式创新向引领式创新、从传统制造向智能制造转变。

科技发展离不开金融支持。中金公司持续为科技创新企业提供金融支持,并发布了《AI经济学》研究报告。报告估算,到2030年,中国AI产业市场需求将达5.6万亿元,2024-2030年总投资规模将超过10万亿元

上海市人民政府副秘书长庄木弟先生*调,AI技术进步体现出明显的规模定律,其推广应用将呈现规模经济效应,引发经济结构重大变革。上海将人工智能作为重点发展的先导产业之一,积极发挥财政资金引导作用,推动设立人工智能产业投资母基金,并优化融资体系,支持产业投资与创新。


第三节:诺贝尔奖得主视角:AI的本质与影响 🧠

在了解了宏观政策导向后,本节我们将从经济学理论视角,深入探讨AI的本质及其社会经济影响。

2011年诺贝尔经济学奖得主托马斯·萨金特(Thomas Sargent)教授分享了他的见解。他首先定义了智能(Intelligence)的三项核心活动:

  1. 模式识别(Pattern Recognition):从海量数据中压缩提取关键模式。
  2. 泛化(Generalization):将从一个情境中学到的模式应用于新情境。
  3. 决策(Decision-Making):利用模式和泛化来指导选择。

人工智能(AI)即是让机器执行这些活动。萨金特教授指出,创造AI的工具(如统计学、生物学、经济学、物理学)恰恰是人类天生不擅长的领域,这是一个有趣的悖论。

他以AlphaGo为例,说明现代AI是融合多学科工具的“烹饪”结果:

  • 经济学:价格与价值评估、博弈论。
  • 数学与统计学:动态规划、蒙特卡洛模拟。
  • 计算机科学:分布式计算。
  • 生物学:进化算法(适者生存)。

萨金特教授提出了一个关键问题:模式识别是否足够? 他的答案是:对于某些目的,模式识别足以解决问题;但对于其他目的(如科学发现、理解经济系统运行规则),它仅是起点,并不足够。这区分了AI当前的能力与前沿挑战。

他进一步探讨了AI与经济学的关系:

  • 对劳动力市场的影响:过去十多年,在许多国家,劳动收入占国民生产总值(GNP)的份额下降,而资本份额上升。软件(包括AI)对劳动力的替代以及由此带来的企业溢价能力提升,是可能的原因之一。这引发了关于收入分配和市场力量的关注。
  • 数字金融(Digital Finance):AI正在推动金融活动变革。数字金融本质上是利用新技术(如电子账本、平台)更快、更便宜地执行存贷款、支付等传统金融活动。平台通过记录行为、排除不良参与者来建立信任和执行合约,成本远低于传统法庭和律师。这带来了新的监管问题,例如平台应由谁运营(私营企业、银行还是政府)以及如何实现跨平台互操作性。

萨金特教授总结道,数字金融在中国帮助中小企业以更低成本获得了以前无法享受的金融服务,展现了巨大的应用潜力。


第四节:中金《AI经济学》报告核心发现 📈

上一节萨金特教授从理论层面分析了AI的影响,本节我们聚焦于中金公司研究部发布的《AI经济学》报告,看看其如何从规模经济主线出发,进行实证与前瞻分析。

报告的主线是规模经济效应。AI大模型的发展遵循规模定律,存在投入门槛,这与传统工业规模经济有相似之处,即规模越大,单位成本越低,效率越高。

以下是报告的主要分析维度与结论:

产业视角:中国的机遇与挑战

报告认为,AI作为通用目的技术(GPT),其产业化推广呈S型曲线。目前AI已越过技术可行性的“第一拐点”,进入产业化应用阶段。中国的优势在于庞大的应用市场与完整的工业体系。

投资需求估算:报告初步估算,到2030年,中国AI算力与模型层市场规模约5.2万亿元,AI应用层市场规模约9.4万亿元

应用潜力分析:AI赋能产业可分为两个路径:

  1. AI产业化:创造新商业模式(如具身智能、人形机器人)。其潜力取决于操作的标准化程度和容错率。
  2. 产业AI化:现有产业利用AI提升效率。中国在此具有显著规模优势。

面临的制约:AI的规模效应也存在极限,并受到算力能耗、数据供给等因素制约。中国在数据生产端和流通市场规模上相对小于美国,需在数据公开共享、隐私保护与知识产权平衡方面做出努力。

国际视角:收敛还是分化?

历史上,技术革命可能导致国家间收入水平“大分流”(如工业革命),也可能导致“大收敛”(如战后部分东亚经济体的追赶)。当前,AI可能引发“第二次大分流”,使中美等大国进一步领先。

报告构建了“AI竞争指数”,从技术层(算力、数据、人才、金融)和应用层(经济暴露度)评估各国竞争力。中国指数约为美国的0.7,位居第二,优势主要在应用层,但风险投资相对不足。

宏观视角:对就业与增长的影响

报告没有简单回答“AI是否导致失业”,而是将人类工作任务拆解为16种“元任务”(如体力型、智力型)。AI替代的是具体任务而非整个人。行业分析师调研绘制了各行业“元任务”的时间分布。

一个重要发现是:结合具身智能,体力劳动可能比纯脑力劳动面临更大的替代潜力,例如在采矿、农业、资源加工等领域。

增长潜力估算:基于分析,报告预计AI有望在未来十年为中国每年额外贡献约0.8个百分点的经济增长。

公共政策含义:技术进步虽不会导致长期大规模失业,但会造成劳动力转换和部分群体受损,需要公共政策干预以促进公平。报告建议利用AI提升的效率,优先用于改善社会保障体系(尤其是农村地区)的公平性与覆盖面,而非急于推行全民基本收入(UBI)。


第五节:高端对话:技术演变、商业化与资本助力 💡

在学习了系统的研究报告后,本节我们通过高端对话,聆听产业界与投资界一线专家对技术发展、商业化落地及资本角色的真知灼见。

议题一:AI技术演变与真实潜力

  • 吴军博士(人工智能专家):AI发展历经四波浪潮,当前处于深度学习与Transformer架构驱动的阶段。AI仍处早期,潜力巨大。当前AI擅长回答问题,但提出好问题的能力仍是人类的独特优势。
  • 朱云来(金融专业人士):本轮AI(如GPT)的进步给人以全新感受,显示人类在模仿智能上“找到了感觉”。其潜力可能达到工业革命级别。当前AI基于模式识别,存在“一本正经胡说八道”的问题。未来需要结合“证明”环节,形成“观察-归纳-证明-推理”的完整智能链条,前景广阔。

议题二:投资过热、商业化与能源挑战

  • 吴军博士:全球AI投资(如估算的1万亿美元)是长期累计值,相对于全球经济总量和科技公司研发投入并非过高。当前问题是投资分散,建议“国家队”等大基金重点扶持少数几家基座模型公司,鼓励更多力量投入数据服务、行业应用等环节。
  • 朱云来:从宏观比例看,AI投资占全球经济比重不高。关于能耗,初步估算全球现有芯片全速运行年耗电约5000亿至1万亿度,占当前全球总用电量(约30万亿度)的1/30左右,并非不可承受。随着光伏加储能技术的成熟,绿电供给可解决能源问题。

议题三:中国AI发展的挑战与应对

  • 吴军博士:AI发展依赖算力、算法、数据三大要素。建议中国:1) 研制针对AI算法的专用芯片;2) 加*基础算法研究,而非仅跟随开源;3) 构建开放网络,获取全球数据,并发挥在数据标注与管理上的经验优势。
  • 朱云来:除了算力算法数据,还需考虑算法背后的社会共识与立法问题(如自动驾驶伦理)。当前最大挑战之一是商业模式。大模型的公共属性*,可能需要探索公共部门与私人部门协调的新型投资模式,在激励创新与保障公共效益、投资回报之间取得平衡。

第六节:圆桌讨论(全):产业发展与投融资趋势 🚀

上一节我们探讨了宏观趋势,本节进入更具体的产业与资本市场对接环节。第一场圆桌聚焦通用人工智能(AGI)产业发展及投融资趋势。

交易所视角:资本市场如何支持AI企业

  • 上海证券交易所:科创板坚持“硬科技”定位,已支持31家AI产业链企业上市。将优先支持突破关键核心技术的硬科技企业,依法依规支持符合条件的未盈利企业上市,并优化再融资、股权激励等制度。
  • 香港交易所:2018年上市改革后,已成为新经济公司重要融资地。新推出的《上市规则》第18C章(特专科技)允许包括新一代信息技术(如AI)在内的五大领域无收入公司上市。港股市场再融资便利,周期可短至一周左右,适合AI公司持续融资需求。建议企业规划好团队、专业资本市场队伍、投资人、中介机构及估值融资策略。

投资机构视角:系统性机会与耐心资本

  • 云启资本陈昱:投资机会将从上层的基座模型向下层应用转移。重点关注四大方向:
    1. 生产力提升:信息获取、内容生成、任务自动化。
    2. AI for Science:新药研发、材料发现等科学研究。
    3. 具身智能:可执行多种任务的机器人。
    4. 娱乐:游戏内容生成、情感陪伴等。
    • 呼吁“耐心资本”,希望人民币基金能像美元基金一样拥有较长存续期,支持企业长期成长。

企业视角(算力层、模型层、应用层)

  • 算力层(壁仞科技*新荣):AI是系统工程,需要资本、人才、资源密集投入。选择自带产业资源(如供应链、落地支持)的投资人至关重要。ChatGPT证明了千亿模型可训练及To C应用可行,为算力供应商带来新需求。
  • 模型层(微软中国、智谱AI、百川智能)
    • 商业化差异:中国To B市场及C端付费意愿与海外存在差异,需寻找适合本土的商业模式。AGI技术仍在快速演进,需关注多模态、超级智能等新方向。
    • 企业定位:需明确是做基座模型公司还是行业应用公司。基座模型公司竞争收敛,投入巨大;行业应用公司需深刻理解场景。
    • 差异化竞争:中国创业公司在基座模型上与大厂仍有博弈空间。可采取“超级模型+超级应用”双轮驱动,并在基座模型中融入差异化技术主张(如医疗、法律等垂直领域能力)。
  • 应用层(云迹科技*全印 - 机器人):机器人商业化需把握四点:1) 匹配真实需求:做人类不能干或不想干的事;2) 性价比:价值与价格匹配;3) 可用好用:注重交互细节与用户体验;4) 可运维可交付:保障稳定可靠的服务交付。移动通用能力加通用抓取能力是服务机器人的未来。

第七节:圆桌讨论(二):创新趋势与应用落地展望 🔮

最后一场圆桌讨论聚焦AI创新趋势与应用落地,汇集了投资机构、算力基础设施、医疗AI、光芯片、脑机接口等多元领域的嘉宾。

技术信仰 vs. 市场信仰

嘉宾普遍认为两者并非对立,而是相辅相成、螺旋上升。

  • 创新工场任博冰:投资人需两者兼顾。商业化取决于模型性能、推理成本、模态、生态四要素的成熟度。
  • 超聚变范瑞琦:是“基础设施先行”还是“应用驱动”,如同“先有鸡还是先有蛋”,需辩证看待,是技术驱动与客户驱动的结合。
  • 商汤科技张少霆:通用领域坚定看技术(Scaling Law),垂类领域则必须深入场景,结合应用才能迭代出价值。
  • 曦智科技张红:硬件技术与应用市场唇齿相依。大模型的发展让硬件公司从“拿着榔头找钉子”变为客户主动上门寻求解决方案。
  • *脑科技BrainCo倪骁:不同阶段侧重点不同。技术突破期需坚定技术信仰;技术成熟后,必须通过真实世界应用创造价值。生成式AI与脑机接口可形成闭环,相互促进,在脑健康领域潜力巨大。

硬件层进展与机遇

  • 超聚变范瑞琦:关注三大硬件方向:1) 供电与散热(液冷等);2) 高速互联(硅光、光模块、全光交换);3) 纸面算力转化为可用算力的相关服务。
  • 曦智科技张红:硅光技术有望像光纤取代铜线一样,在算力基础设施中解决传输带宽、速率、功耗等瓶颈,不仅在云端,在边缘端、卫星、汽车等领域也有广泛应用前景。

应用层突破与未来

  • 商汤科技张少霆(医疗):AI+医疗分两条路径:1) To B(赋能医生):保收入下限,有望出现百亿市值公司;2) To C(健康助手):撑估值天花板,需结合持续健康数据监测,与穿戴设备公司深度合作,形成壁垒。
  • *脑科技BrainCo倪骁(脑机接口):生成式AI对脑机接口是颠覆性的。通过AI解析脑电信号,可实现意念控制假肢、机器人。在精神健康领域,AI可基于实时脑电数据生成个性化调控方案,并形成“评估-干预-反馈”闭环,想象空间巨大。

未来投资机会展望

  • 创新工场任博冰:关注两个关键节点:1) 普惠拐点(24-48个月内,推理成本降至千分之一);2) 智能拐点(3-4年内,出现GPT-6级模型)。投资将沿推动拐点的四要素展开:
    • 模型性能(大模型)。
    • 多模态(视频生成、具身智能)。
    • 推理成本(算力及生态)。
    • AI生态(应用)。应用发展将按阶段展开:To B应用 → 生产力工具 → 高日活To C应用 → 融入吃喝玩乐衣食住行。当前处于第一阶段向第二阶段过渡期。

课程总结

本节课中,我们一起学习了“AI规模新经济”投融资论坛的核心内容。我们从宏观政策与经济学理论出发,理解了AI的规模定律及其对经济结构、劳动力市场和国际格局的潜在影响。通过中金公司的《AI经济学》报告,我们系统分析了AI在中国产业应用、投资需求、增长贡献等方面的具体前景。最后,通过两场高质量的圆桌讨论,我们聆听了来自交易所、投资机构、算力硬件、大模型公司、前沿应用企业的专家们,对技术趋势、商业化挑战、资本市场对接以及未来机遇的深刻见解。整体而言,AI作为驱动新质生产力的核心,其发展离不开技术与市场的双轮驱动,以及科技、产业与金融的良性循环。中国在应用层面拥有规模优势,但也需在基础创新、数据生态、商业模式和耐心资本等方面持续努力。

29:AI前沿趋势与产业应用深度解析 🚀

课程概述

在本节课中,我们将学习人工智能(AI)领域的最新发展趋势,特别是大模型、具身智能、算力网络以及AI在医疗、金融等垂直行业的应用落地。课程内容整理自华泰证券科技金融创新论坛的嘉宾演讲,旨在为初学者提供清晰、全面的知识概览。


第一节:AI发展回顾与宏观趋势 🌍

上一节我们介绍了课程的整体框架,本节中我们来看看AI发展的宏观背景与核心驱动力。

人工智能在过去一年发展迅猛,大模型技术持续爆发,呈现出模态丰富、能力增*、成本下降等特点。以生成式人工智能为代表的技术革新速度前所未有,并在医疗、金融、教育、法律等多个垂直行业加速落地。

科技是驱动变革的关键力量。在金融领域,移动互联网催生了掌上财富通等应用,实现了零售业务的跨越式成长。在机构服务领域,数字化转型打造了FICC大象交易平台等多个专业平台,提升了服务能力。

随着人工智能成为新生产工具、数据成为新生产要素、算力成为新基础设施,这“三新”体系与产业加速融合,必将带来深远影响,其方向是确定且不可逆的。


第二节:AI+医疗:精准诊疗与健康管理 🏥

上一节我们探讨了AI的宏观趋势,本节中我们将聚焦AI在医疗领域的创新应用。

AI与医疗的结合正在改变传统的诊疗模式。例如,GPT-4在没有接受医学训练的情况下,已能通过美国职业医师考试,这引发了关于AI是否会替代医生的讨论。更重要的应用在于,AI可以通过整合影像、基因、动力学等数据,构建数字孪生体,为心脏病的诊断与治疗带来变革。

医疗设备正在变得更加智能化。几乎所有先进的影像诊断设备(如CT、磁共振)和实验室检验设备都已嵌入AI技术。

AI能够赋能临床全流程,从疾病预防、早筛、诊断到治疗、监测和随访。通过整合多源异构数据,AI可以辅助医生进行决策。例如,在手术室中,医生可以实时调取并融合患者的CT、超声、病理等多种信息,并通过三维重建技术进行手术规划。

在危急重症救治中,AI能显著提升效率。以脑卒中为例,通过一站式诊疗设备和AI技术,可以将关键的DNT时间(从入院到开始治疗的时间)从国内平均的90分钟以上缩短至15分钟以内,极大地提高了救治成功率。

AI的终极目标是实现全生命周期的健康管理。通过构建患者的数字孪生体,可以模拟疾病发展和治疗效果。例如,数字心脏可以模拟心脏的电生理和机械性能,帮助医生在植入起搏器前评估手术方案的有效性,实现个性化治疗。

此外,增*现实(AR)和虚拟现实(VR)技术也已应用于临床教学和手术导航,提升了医生的培训效率和手术精准度。

核心公式/概念

  • 数字孪生Digital Twin = f(影像数据, 基因数据, 生理数据...)
  • 关键救治指标DNT时间(Door-to-Needle Time)


第三节:具身智能:机器人的AGI之路 🤖

上一节我们看到了AI在虚拟世界的*大能力,本节中我们来看看AI如何与物理世界交互,即具身智能。

具身智能*调智能体通过身体与环境的交互来获取认知和产生行为。其发展遵循三条核心原则:

  1. 系统不依赖预定义的复杂逻辑。
  2. 系统需要具有面向环境的进化学习机制(如*化学习)。
  3. 环境对物理行为和认知结构至关重要。

大模型的出现部分解决了第一条原则的通用性问题。多模态大模型(如GPT-4V)和机器人具身大模型(如RT-2)是当前的研究热点。然而,它们仍面临推理速度慢和操作精度不足的挑战。

解决方案方向

  • 架构优化:采用Mamba、MOE等更高效的架构替代部分Transformer,以提升推理速度。
  • 空间智能:引入动作轨迹预测、空间关系理解和3D信息,以提高操作的精度和成功率。

*化学习是实现第二条原则(环境适应)的关键。它使机器人能够利用最优和次优数据,通过与环境交互来学习策略。人类反馈*化学习(RLHF)、决策大模型(如ReinforceM)等技术正在推动这一领域的发展。

仿真环境是应对第三条原则(环境)挑战的重要手段。通过构建高保真的虚拟环境,可以低成本、高效率地训练机器人策略。目前,利用大量仿真数据加少量真实数据训练出的模型,已在四足机器人上展现出优秀的运动、导航和操作能力。

未来趋势

  1. 大模型:持续提升通用性,解决幻觉、泛化、推理等问题。
  2. *化学习:与大模型深度融合,提升“小脑”(运动控制)的泛化能力,或实现大小脑合一的通用智能。
  3. 环境仿真:通过软硬件协同,不断缩小仿真与现实的差距(Sim2Real)。

核心公式/概念

  • *化学习核心策略π = argmax Σ(奖励R)
  • 仿真到现实策略性能 = g(仿真保真度, 自适应算法)


第四节:AI算力产业链的重构与机遇 ⚡

上一节我们探讨了AI的“大脑”和“身体”,本节中我们来看看支撑这一切的“基础能源”——算力。

AI发展带来了投资顺序的变化:算力基础设施 -> 终端 -> 模型 -> 应用。英伟达凭借其软硬件一体的生态(CUDA平台 + GPU),抓住了开发者和用户,成为了AI时代的平台型企业,市值增长惊人。

核心趋势判断

  1. 服务器市场超越手机:预计到2030年,服务器市场规模将达到5500亿美元,超过手机,成为最大的硬件品类。算力需求的核心衡量指标正从“机柜数量”转向“能耗功率”。
  2. 中美算力产业链平行发展:地缘政治等因素导致供应链重构,中国企业在英伟达产业链中占比很低,但这为国产算力生态创造了发展窗口。
  3. AI催生新硬件形态:从AI手机/AI PC,到XR设备,再到机器人、智能汽车,AI能力将驱动新一代硬件创新。
  4. 服务器产业链迭代机会:在AI服务器市场中,光模块(向1.6T演进)、散热(液冷)等核心零部件将迎来量价齐升的成长机会。

中国企业的机遇与挑战

  • 前景光明:消费电子全球化趋势不变,中国制造优势稳固;AI应用出海(如TikTok、拼多多)表现亮眼。
  • 挑战巨大但必须做:算力产业链国产化(芯片、软件)和基础大模型研发,是艰难但至关重要的任务。
  • 挑战较大:国产算力部件融入全球主流生态、打造全球竞争力的AI手机、在数据跨境受限下实现大模型全球化,都面临较大困难。

核心公式/概念

  • 平台型企业公式生态护城河 = 开发者数量 × 用户粘性
  • 产业链价值零部件成长 = 服务器出货量 × 单品价值提升

第五节:构建下一代AI算力基础设施 🌐

上一节我们分析了算力产业的宏观格局,本节中我们深入看看如何构建高效、自主的算力基础设施。

当前AI算力面临多重挑战:供给短缺、软硬件技术被锁定、建设运营成本高昂。真正的算力需求是“开箱即用”的、弹性的服务,而非简单的机器租赁。

新一代AI算力基础设施的核心是软件定义和智能调度。它需要一套复杂的软件栈来管理异构算力(包括国产GPU),实现资源的池化、优化和高效调度,并为上层的大模型训练和推理提供稳定支撑。

关键技术与参与者

  • 算力调度与操作系统:提供底层资源管理和调度能力,是算力池化的核心。
  • 高性能网络与互联:低延迟、高带宽的网络是万卡集群协同工作的基础。涉及DPU智能网卡、高速交换芯片等。
  • 集群建设与运维:提供从组网、部署到性能调优的全栈解决方案,确保大规模智算集群的稳定高效运行。

国产化与出海

  • 在软件、分布式系统等领域,国内团队与全球领先水平的差距相对较小,部分已达到并跑。
  • 在芯片等硬件领域,需要持续投入,追赶先进工艺和生态。
  • 出海是必然趋势。中国科技企业凭借在中国市场锤炼出的竞争力,在海外市场具备优势。但需注意地缘政治风险,可通过设立海外主体、发展本地合作伙伴等策略灵活应对。

核心公式/概念

  • 有效算力有效算力 = 硬件峰值算力 × 利用率 × 软件效率
  • 网络性能集群效率 ∝ 1 / 网络延迟, 受最慢节点制约

第六节:AI垂直应用落地与产业化 🏢

上一节我们探讨了支撑AI的算力基础,本节中我们来看看AI如何在各行各业落地生根。

大模型正在加速与各行各业深度融合,其落地需要紧密结合行业知识、场景和数据。

应用案例与特色

  • AI+安全:将大模型用于威胁检测、事件分析、自动化响应,提升安全运营效率。360智脑依托安全数据积累,构建了覆盖攻击、防御、内容安全的全栈安全大模型。
  • AI+产业赋能:智普AI等厂商在智能座舱、医疗研发、工业运维、零售导购、金融投顾等领域已有大量成功案例,帮助传统企业实现智能化升级。
  • AI+医疗:讯飞医疗等公司专注于医疗垂直大模型,通过“算法研究员+医学专家”的协同模式,深耕临床场景,在基层诊疗、医院管理、医保控费等方面落地产品。
  • AI+金融:商汤科技等企业利用多模态大模型能力,赋能金融机构在智能投研、风险管理、数据资产挖掘等场景,旨在降本增效和辅助决策。

产业化过程中的关键考量

  • 安全与隐私:尤其在医疗、金融等领域,需通过私有化部署、数据加密、合规认证等方式保障数据安全与用户隐私。
  • 自主可控:从训练框架、算法到推理的全链路自主可控,是保障供应链安全和持续创新的基础。
  • 行业深化:行业大模型的成功关键在于“用得好”和“用得起”。需要深入理解行业场景,并优化模型与成本,适配国产算力,满足不同客户的ROI要求。

未来展望
大模型的下半场将围绕 “三个融合” 展开:

  1. 端云融合:端侧小模型保障隐私与实时性,云侧大模型提供*大能力,实现统一体验。
  2. 多模态融合:文本、图像、视频、语音等多模态输入输出,极大扩展人机交互带宽和应用边界。
  3. 多模型融合:通过统一的模型管理平台,灵活调度和使用不同规模、不同能力的模型,以应对复杂任务。

核心公式/概念

  • 行业大模型价值业务价值 = 模型通用能力 × 行业知识注入 × 场景契合度
  • 落地关键成功落地 = 技术能力 ∩ 数据安全 ∩ 成本可控 ∩ 业务需求

课程总结 🎯

本节课中,我们一起学习了人工智能领域从技术到产业的多维度发展趋势:

  1. 宏观层面:AI作为“三新”体系的核心,正不可逆地推动各行业变革。
  2. 技术前沿AI+医疗走向精准与全生命周期管理;具身智能通过大模型、*化学习与仿真技术,迈向通用机器人;算力网络是支撑AI发展的基石,正经历重构与自主化建设。
  3. 产业应用:大模型正在金融、医疗、工业、安全等垂直行业深度落地,解决实际业务问题,其未来发展将聚焦于端云融合、多模态融合与多模型融合。
  4. 中国路径:在全球化与自主化并行的背景下,中国企业正凭借在应用创新、软件技术及庞大市场方面的优势,积极探索符合自身特点的AI发展道路。

希望本教程能帮助你建立起对AI前沿趋势与产业应用的系统性认知。

30:AI与商业创新项目路演解析 🚀

课程概述

在本节课中,我们将学习2024年7月5日“未来之星创新项目路演(Ⅱ)”中多家科技公司的核心内容。课程将涵盖具身智能、AI文档处理、AR/VR应用、智能办公、碳普惠平台及AI制药等多个前沿领域。我们将深入解析各公司的技术方案、商业模式及市场前景,帮助初学者理解AI技术如何重塑千行百业。


一、跨维智能:基于Sim-to-Real的高通用性具身智能解决方案 🤖

跨维智能成立于2021年6月,专注于通过Sim-to-Real技术实现高通用性具身智能。公司成立当年即获得真格基金和综合资本的天使轮融资,2022年产品初步商业化,2023年实现千万级营收。

1.1 对具身智能的理解

传统机器人多为定制化方案,缺乏通用性。例如,物流机器人只能抓取特定货架上的箱子,制造业机器人更换工件需重新编程。具身智能需具备通用性,能感知物理世界并决策交互,处理任意物体与多样任务。

核心公式
通用性 = 感知能力 + 决策能力 + 交互能力

1.2 具身智能发展路径

公司参考自动驾驶L1-L5分级,规划具身智能发展路径:

  • L1-L2阶段:半结构化场景(如制造业),用特定或通用机器人操作任意对象。
  • L3-L4阶段:非结构化场景(如家庭),用通用机器人处理未知任务。
  • L5阶段:完全未知环境(如火星),用通用机器人执行任务。

核心逻辑
处理对象 → 处理环境 → 处理任务

1.3 技术核心:合成数据与物理引擎

3D数据在互联网中难以获取,传统数据采集成本高、规模有限。跨维智能通过自研物理仿真引擎,低成本生成海量高质量3D合成数据,解决虚拟域与真实域的统计分布差异。

代码示例(合成数据生成流程):

# 伪代码:基于物理引擎生成合成数据
def generate_synthetic_data(cad_model, textures, lighting):
    # 加载CAD模型
    model = load_model(cad_model)
    # 添加不同纹理与光照
    for texture in textures:
        for light in lighting:
            scene = apply_texture_and_light(model, texture, light)
            # 仿真物体散落姿态
            pose = simulate_falling(scene)
            # 生成训练数据
            data = render_scene(scene, pose)
            save_data(data)

1.4 产品与商业化

公司定位为“具身智能大脑”,提供软硬件一体化产品。目前已服务30多家制造业客户,实现千万级营收。2024年发布纯视觉解决方案,用RGB相机实现3D场景感知,并在室外及高速场景商业化落地。


二、韦长梦智能:液压人形机器人的创新与应用 🦿

韦长梦智能成立于2021年,专注于液压人形机器人研发。公司选择液压技术路线,因其爆发力*、续航久、噪音低,适用于服务与工业场景。

2.1 技术优势

  • 液压动力系统:自研液压泵(流量14升/分钟)与比例阀,支持机器人以4公里/小时行走。
  • 行为决策模型:支持多任务合并与自然交互,如从冰箱取水时顺带取牛奶。
  • 运动控制算法:基于液压的连续轨迹控制,实现类人行走姿态。

核心公式
液压动力效率 > 电机动力效率

2.2 商业化路径

  • 机器人咖啡屋:2024年9-10月运营,单店月净收入目标2-3万元。
  • 24小时便利店:2025年3月运营,采用集装箱快速部署。
  • 工业应用:与919厂、东方电网合作,从事喷涂、电力巡检等有毒高危作业。

售价:机器人30万元,机器人加咖啡屋套餐50万元,未来目标降至15万元。


三、易控智驾:露天矿无人驾驶运输解决方案 🚛

易控智驾专注于矿山无人驾驶,解决招工难、安全性低及绿色化需求。公司通过车路云一体化方案,以单车智能为主,实现规模化应用。

3.1 技术架构

  • 车端智能:不依赖网络,保障安全与泛化能力。
  • 云端协同:负责调度与效率优化。
  • V2V通信:实现车辆间轨迹同步与协同。

代码示例(车辆协同调度):

# 伪代码:基于V2V的车辆协同
def vehicle_coordination(vehicle_list, network_status):
    for vehicle in vehicle_list:
        if network_status == 'stable':
            trajectory = cloud_scheduling(vehicle)
        else:
            # 依赖V2V通信
            trajectory = v2v_sync(vehicle, vehicle_list)
        execute_trajectory(vehicle, trajectory)

3.2 商业化进展

  • 全球最大无人驾驶车队:200多台车在露天煤矿常态化运营18个月。
  • 全矿无人化案例:石灰石矿实现全矿运输车辆无人驾驶,班次人员从25人降至4人。
  • 驻山2.0发布:引入BEV、Transformer等多模态感知,实现均匀碾压、障碍绕行等功能。

四、英领之途:一键生成AR/VR内容的神器 🕶️

英领之途成立于2016年,原为AR眼镜公司,现转型为AR/VR内容生成平台。公司通过标准化产品,让中小企业低成本创建AR内容。

4.1 产品功能

  • 识别图生成:上传图片、视频、模型,一键生成AR内容。
  • 3D模型放置:适用于汽车、家装、工业设备展示。
  • 虚拟展厅:拖拽式创建,支持3D扫描与电商交易。
  • 虚拟人导航:结合AR导览与实时交互。

代码示例(AR内容生成):

# 伪代码:AR内容一键生成
def generate_ar_content(image, video, model):
    # 上传素材
    assets = upload_assets(image, video, model)
    # 选择模板
    template = select_template('poster')
    # 生成AR小程序
    ar_app = render_ar(assets, template)
    return ar_app

4.2 商业化模式

  • 收费标准:年费2万元(展会期间1万元),3D建模单模型100元。
  • 目标客户:工业、大消费、家居、餐饮等行业。
  • 未来规划:推出AR魔方硬件,结合C端用户积累,拓展硬件生态。

五、BU科技:新一代智能文档处理平台 📄

BU科技是AI文档连续创业团队,2020年成立,2023年获百度投资。公司专注于文档垂类模型,2024年发布U Talk智能文档平台,全网用户突破1000万。

5.1 技术框架

  • 数据层:整合本地与互联网数据。
  • 模型层:结合大模型与小模型(MOE),处理排版、长文本、动效等任务。
  • 输出层:支持Word、PPT、合同等多种格式生成。

核心公式
智能文档 = 数据 + 模型 + 交互

5.2 产品矩阵

  • 插件版:集成于Office,通过Chat交互调整字体、排版等。
  • 企业版:支持SaaS与API,服务金融、教育等行业。
  • U Talk 3.0:实时智能文档,支持内容多形态表达(PPT、脑图等)。

代码示例(文档智能生成):

# 伪代码:文档多形态生成
def generate_document(content, format):
    # 内容分析
    analyzed_content = analyze_content(content)
    # 选择输出形态
    if format == 'ppt':
        output = render_ppt(analyzed_content)
    elif format == 'mindmap':
        output = render_mindmap(analyzed_content)
    return output

六、玄武纪:AIoT赋能智能办公 🏢

玄武纪成立于2024年4月,专注于AIoT在办公场景的应用。公司通过智能机器人提升印章、合同、档案管理的效率与安全性。

6.1 解决方案

  • 智能盖章机器人:无人值守,实现身份识别、风险检测与自动用印。
  • 合同管理机器人:自动拟定、审查合同,规避法律风险。
  • 档案管理机器人:结合IoT传感器,实现档案自动查找与存取。

售价:智能工作站10万元,分子公司终端2万元。

6.2 商业化进展

公司已积累3000多家企业客户,其中5家正在试点智能盖章机器人。未来计划拓展至合同与档案管理场景,为中小企业提供一站式服务。


七、绿球金科:低碳大模型与碳普惠平台 🌱

绿球金科聚焦数字金融与绿色低碳,推出“护碳行”碳普惠平台,通过区块链与数字人民币激励用户低碳行为。

7.1 平台机制

  • 碳足迹计量:记录用户绿色出行等行为,转化为碳减排量。
  • 区块链存证:保障数据安全与碳资产可信。
  • 数字人民币激励:以现金形式返还用户。

核心公式
碳普惠 = 行为计量 + 资产存证 + 激励返还

7.2 商业化进展

平台已覆盖上海地区,与哈啰骑行、上海交通卡、T3出行等合作,用户超33万,碳减排量3万多吨。未来计划拓展至长三角及全国,覆盖衣食住行全场景。


八、一触科技:人工智能触觉交互解决方案 ✋

一触科技专注于触觉交互,通过振动触觉模拟材质感,提升数字内容体验。公司由中科院、北航、港科大实验室孵化,获奇绩创坛、红杉资本投资。

8.1 技术核心

  • 触觉AI算法:实时解析内容材质感,驱动线性马达振动。
  • 低延迟匹配:波形匹配误差低于1毫秒。
  • 跨平台兼容:支持iOS、安卓及AR/VR设备。

代码示例(触觉效果渲染):

# 伪代码:触觉效果实时渲染
def render_haptic(content, device):
    # 分析内容材质
    texture = analyze_texture(content)
    # 生成振动信号
    signal = generate_vibration_signal(texture)
    # 驱动设备马达
    device.vibrate(signal)

8.2 商业化应用

  • 品牌营销:服务LVMH、开云集团,为广告片添加触觉效果。
  • 智能座舱:与保时捷、奥迪合作,推出触觉座椅、方向盘及中控屏。
  • 内容生态:为B站、小红书提供触觉技术支持。

九、探硅智慧:AI驱动的分子设计平台 🧪

探硅智慧专注于AI制药,通过生成式AI与自动化实验加速小分子药物研发。公司由360前AI研究院院长与浙大教授联合创立。

9.1 技术平台

  • DrugFlow平台:集成分子对接、活性预测、成药性分析等模块。
  • 生成式AI:探索更大化学空间,生成新型分子。
  • 自动化实验:验证AI生成分子,形成闭环优化。

核心公式
药物研发加速 = AI生成 + 实验验证 + 闭环优化

9.2 商业化进展

平台已注册用户2000多名,服务英伟达、智源等企业。案例显示,通过生成96万分子、筛选合成5个,获得高活性分子,大幅提升研发效率。


十、寻明生物:AI赋能抗体设计 🧬

寻明生物结合生成式AI与数字生物学,加速抗体发现。公司创始人来自UCSF,团队博士占比高,已与5家MNC合作,合同金额超500万美元。

10.1 技术平台

  • OrcaQuest:酵母自进化平台,月产10亿级数据。
  • OrcaGo:功能性筛选平台,单细胞水平验证抗体活性。
  • OrcaPicasso:生成式AI模型,动态结构预测与抗体设计。

核心公式
抗体发现 = 高通量数据 + AI生成 + 功能筛选

10.2 商业化案例

  • GPCR抗体优化:6周内将亲和力提升10倍。
  • 双抗分子发现:12周内获得10个高质量候选分子。

课程总结

本节课我们一起学习了10家创新公司的技术方案与商业模式。从具身智能到AI制药,我们看到AI技术正深入各行各业,推动生产力变革。关键要点包括:

  1. Sim-to-Real 解决数据瓶颈,提升机器人通用性。
  2. 液压机器人 在续航与静音方面具备优势。
  3. 车路云一体化 实现矿山无人驾驶规模化。
  4. AR/VR内容生成 降低中小企业使用门槛。
  5. 智能文档平台 实现内容与格式的自动生成。
  6. AIoT 赋能办公场景的智能化管理。
  7. 碳普惠平台 通过区块链与数字人民币激励低碳行为。
  8. 触觉交互 补齐数字世界感官通道。
  9. 生成式AI 加速药物分子发现与抗体设计。

这些案例表明,AI技术不仅提升效率、降低成本,更在创造新的商业价值与社会福祉。未来,AI与人类的协作将进一步深化,推动千行百业迈向智能化新时代。

31:迈向AGI:大模型焕新与产业赋能论坛全记录 📚

概述

在本课程中,我们将系统性地学习2024年世界人工智能大会“迈向AGI:大模型焕新与产业赋能”论坛的核心内容。课程将涵盖从政府政策、产业生态、前沿技术研究到具体行业应用的全景图,深入探讨大模型(Large Language Models, LLMs)的发展现状、面临的挑战以及未来的产业落地路径。我们将重点关注技术原理、产业实践、安全治理和端侧智能等关键议题。


第一讲:开幕致辞与产业生态展望 🏛️

徐汇区产业实践与政策支持

上海市徐汇区副区长于林伟先生回顾了徐汇区在人工智能领域的发展历程。自2018年首届世界人工智能大会在西岸召开以来,徐汇区创建了首个人工智能产业集聚区,并于2019年入选国家首批战略性新兴产业集群。

核心发展数据

  • 2023年,徐汇创建了上海首个大模型产业生态社区。
  • 目前已有22个大模型通过国家网信办备案,占全市三分之二,占全国近五分之一。
  • 全区聚集了超过160家大模型企业,其中商汤、智谱、MiniMax等基础模型企业占比约50%,并在上半年发布了对标GPT-4.0的模型。

未来三大努力方向

  1. 扩大物理空间:9月,三期、四期共4万平方米空间将投入使用,可容纳超100家大模型企业。
  2. 深化产业政策:已发布支持大模型发展的扶持意见,并于论坛当天发布了支持人工智能大模型科创街区建设的若干意见。下月还将发布支持行业大模型发展的政策。
  3. 完善产业生态:在巩固大模型企业聚集优势的同时,积极引进上游芯片和下游智能终端等生态链企业。

中国信通院的角色与使命

中国信息通信研究院院长余晓晖先生指出,以大模型为代表的人工智能技术正突飞猛进,但同时也面临算力消耗大、训练数据要求高、存在“幻觉”、可解释性不足等问题。全球正在探索世界模型、类脑计算等多种技术路线共同迈向AGI。

中国信通院的五项核心工作

  1. 深化战略研究:发布人工智能系列白皮书。
  2. 打造技术服务平台:承建工信部大模型公共服务平台、人工智能关键技术应用测评重点实验室,推出大模型性能和安全基准测试。
  3. 推动标准建设:牵头制定50多项人工智能国际和国内标准。
  4. 构建产业协作网络:发起成立中国人工智能产业发展联盟(会员超1000家),举办“新智杯”大赛,开展大模型赋能新型工业化供需对接活动。
  5. 推动国际合作:参与联合国、国际电联等机构的人工智能治理工作,筹建金砖国家人工智能发展与合作研究中心。

本节过渡:在了解了宏观的产业政策与生态布局后,我们将深入技术层面,探讨大模型本身的工作原理与发展边界。


第二讲:大模型的“道”与“术”:原理、边界与挑战 🤔

澳大利亚科学院院士陶大程教授从哲学思辨角度探讨了大模型的“道”(工作机制与边界)与“术”(实现与实践路径)。

神经网络发展简史与启示

陶院士回顾了神经网络80年的关键节点:

  • 1943年:McCulloch和Pitts提出神经元数学模型。
  • 1957年:Rosenblatt提出感知机,并使用随机梯度下降算法。
  • 1986年:Hinton引入反向传播算法优化多层感知机。
  • 2012年:AlexNet成功前,神经网络曾因感知机解决不了异或问题(1969年)和统计学习理论的批评而两次陷入低谷。

核心观点:神经网络的发展动力主要来自算力和数据的增长。当前已进入由大模型驱动的“超级深度学习时代”。

大模型的“涌现能力”与可靠性反思

陶院士对“涌现能力”提出了深刻质疑。他通过一个比喻引发思考:如果两个学生考试分数不同,但考前复习资料高度重合,分数是否能真实反映智力水平?这类比了大模型在训练和测试数据高度相似时,其表现可能并非真正的“理解”和“推理”。

实证测试

  1. 逻辑推理:向大模型提问一个小学生逻辑题(两人交替跑步求相遇时间)。模型在规律总结、简单加法上均出现错误。
  2. 几何推理:提问小学生几何图形组合题。模型给出了错误答案,并为所有选项都提供了看似合理的错误解释。

核心挑战

  • 不可解释性:大模型的工作原理尚不清晰,“幻觉”何时发生、为何发生难以预测。
  • 是否真在思考:通过视觉错觉图测试,发现模型回答前后不一致,怀疑其并非进行真正的逻辑推理。
  • 多模态问题:跨语言翻译误差传递、文生图的视觉文本错误、手部畸形、多模态混合生成错误等。
  • 安全问题:包括内生安全(鲁棒性、隐私、公平、透明)和衍生安全(可靠性、偏见、毒性)。

未来方向

  • 作为效率工具:在娱乐、电商、搜索等领域有良好应用前景。
  • 革新交互方式:大模型将推动人机交互向全感知、沉浸式、无边界、无障碍发展,实现“无形胜有形”。

本节总结:陶院士引用庄子“天下莫大于秋毫之末,而泰山为小”和老子“天下皆知美之为美,斯恶已”,提醒业界思考大模型的必要边界,避免无休止的内卷,寻求新的发展路径。

本节过渡:认识到大模型的局限性后,我们来看产业界如何从多模态和视觉角度寻求突破,并利用“幻觉”激发创意。


第三讲:多模态大模型与视觉交互新界面 🎨

加拿大工程院外籍院士、智象未来CEO梅涛院士分享了多模态大模型,特别是视觉生成模型的发展与产业应用。

生成式AI的产业前景与两条技术路线

梅院士引用数据指出,生成式AI将为全球GDP带来14%的增长,影响全球74%的经济总量。目前,世界500*中超过50%的企业已开始规模化使用AI技术。

两条核心技术发展曲线

  1. 语言模型曲线(GPT路线):通过“下一个词预测”压缩知识。目前发展趋于平缓,有预测认为2026年人类现有语料将被消耗殆尽。
  2. 扩散模型曲线:从视觉角度对物理世界进行建模和模拟。目前处于类似GPT-2的发展阶段,未来可能与语言模型曲线融合。

一个关键预测:到2026年,AI生成的图片数量将超过人类一年拍摄的所有图片数量。这标志着我们将走到一个数据与创新的十字路口。

视频生成技术的五个阶段

梅院士将视频生成技术的成熟度类比自动驾驶,分为L1到L5五个阶段:

  • L1-L2:单镜头内容生成(当前主流技术,如智象未来的模型)。
  • L3-L5:向多镜头、多故事性、连续性视频生成演进,终极目标是输入一部小说,AI能自动完成分镜、生成镜头并制作成完整电视剧。

当前挑战:成本(生成1秒视频约1元人民币)、效率(生成耗时)和体验(天花板高,尚未从服务专业用户过渡到普通用户)。

智象未来的策略:采用“基础大模型 + 产品应用型小模型(智能体)”的架构,服务千行百业。其“智象大模型2.0”是视频和图像混合训练的原生模型,支持可变时长及多镜头生成。

本节过渡:多模态模型拓展了能力边界,但当大模型要深入严谨的行业时,其“幻觉”和推理能力不足就成了必须跨越的障碍。


第四讲:可信大模型:产业智能升级的基石 🔒

蚂蚁集团大模型应用部总经理顾静杰聚焦于如何让大模型在严谨的产业应用中变得“可信”。

产业应用的三大挑战与可信实践

顾总指出,大模型在产业落地中面临三大挑战:

  1. 领域知识深度不足:大量行业知识(如医疗经验)尚未数字化或不在公开数据中。
  2. 复杂专业决策能力弱:涉及多步推理的专业任务容易出错。
  3. 与传统AI工具融合难:如何将大模型与现有成熟的AI工具链结合。

蚂蚁的三大实践方向

  1. 领域知识增*:发现传统的检索增*生成(RAG)也存在幻觉问题。蚂蚁提出用可信领域知识(如知识图谱) 替代非结构化文档作为参考,显著提升生成准确性。蚂蚁与浙大联合发布了统一知识抽取框架OneKE,并参与开源了知识引擎框架OpenSPG。
  2. 专业决策与深度评测
    • 在医疗领域,提出 “知识图谱思维链” ,模仿医生的决策路径进行诊断推理。
    • 在金融领域,推出 “智能体宇宙”框架,与专家共同构建“1+4+1”分析框架,让大模型模仿金融专家思考。
    • 联合上海财经大学、上海市仁济医院发布了金融和医疗领域的推理评测数据集。
  3. 大模型与基础AI融合:通过工业级认知推理框架,将大模型与图学习、大规模知识引擎、运筹优化决策引擎等传统AI能力结合,打造更*大的产业智能体。

本节过渡:在追求技术能力提升的同时,我们必须同步思考人工智能的治理问题,确保其发展合乎伦理、向善而行。


第五讲:善治理促进善智能与善智慧 ⚖️

中国科学院自动化研究所研究员、联合国AI高层顾问机构专家曾毅教授从伦理与治理的宏观视角,探讨了人工智能的发展路径。

发展路径的治理:超越“内卷”

曾教授指出,当国内出现数百个大模型时,我们需要思考发展路径的选择。他建议,前沿机构可将50%力量投入大模型,另外50%投入 “大模型的焕新” ,即颠覆性创新。

焕新的科学问题

  • 能否用更小规模的数据和功耗解决同样问题?
  • 如何让人工智能具有真正的理解能力?
  • 如何实现从“合乎伦理”到“具有道德”的跨越?

类脑通用人工智能的探索

曾教授介绍了其团队在类脑AI方向的探索,旨在重塑AI的根基:

  • 自我驱动与具身理解:*调“我思故我在”对机器不成立,需为AI构建自我模型和具身理解能力。
  • 引入“胶质细胞”:人脑中胶质细胞数量是神经元的10倍,参与学习。团队构建了融合脉冲神经元和胶质细胞的类脑神经网络模型,在能耗和内存上显示出优势。
  • 结构演化:引入“抑制性神经元”和演化原理,让神经网络结构根据任务动态演化,在能耗和性能上实现跃迁。

对当前AI的判断与倡议

  • 当前AI仍是“看似智能的信息处理工具”,不具备真正智能。
  • 安全与能力不是正交关系,提升安全也是提升能力。
  • 倡议:负责任、稳健地发展和适度地使用AI,无需让AI无处不在。

本节过渡:治理框架为发展划定方向,而要将大模型能力普惠到每个人身边,离不开运营商和算力基础设施的支撑。


第六讲:算网数智联通,AI普惠化实践 📡

中国联通人工智能创新中心首席科学家连世国分享了中国联通推动AI普惠化的实践。

“1+1+M”大模型体系与普惠理念

中国联通布局“1+1+M”大模型体系:

  • 第一个“1”:一套基础大模型,探索不同参数模型的能力边界,追求高性价比,避免“大炮打蚊子”。
  • 第二个“1”:一个大模型平台,提供零代码、低门槛的开发工具和方法论。
  • “M”:众多行业大模型,由行业专家塑造“职业技能”,真正应用于具体场景。

应用案例

  • 公众业务:赋能“联通助理”产品,打造反诈大模型。
  • 文化领域:与国家博物馆、外文局共创“文物活化大模型”,实现文物知识问答与文创生成。
  • 工业领域:通过大模型与小模型协同,实现产品质检、流程合规监测等,已服务全国70多个工业客户。

大模型安全实践

作为国资委AI内生安全任务牵头单位,中国联通在安全方面做了三项工作:

  1. 构建全面评测集:开源了覆盖五大类31小类的安全风险评估数据集。
  2. 打造安全增*工具:对模型进行针对性补*。例如,对Llama3-8B英文模型进行中文能力、安全和价值观补*,形成中文版。
  3. 建设安全工具链:打造模型服务端到端安全工具链,让模型可靠应用。

本节过渡:运营商的网络是普惠的通道,而蚂蚁集团则从产业实践角度,系统化地提出了大模型安全发展的解决方案。


第七讲:大模型安全实践与一体化解决方案 🛡️

蚂蚁集团与清华大学联合发布《大模型安全实践2024》及“倚天剑”大模型安全一体化解决方案。

多模态“鉴真”解决方案

面对AIGC技术带来的深度伪造风险(如证件、视频伪造),蚂蚁推出“倚天鉴”多模态鉴真方案,支持图像、视频、音频、文本内容的真伪检测,图像识别准确率达99.9%。

“倚天剑”安全一体化解决方案2.0

该方案具备三大特点:

  1. 攻防兼备:融合安全评测、内置护栏防御、外置风险拦截。
  2. 以AI对抗AI:通过智能体调度各种安全组件,提升适应性。
  3. 集成专项成果:集成了多模态鉴真、大模型基础设施供应链安全、大模型幻觉修正等专项能力。

方案核心模块

  • 大模型安全测评:从攻击者视角扫描供应链安全风险。
  • 内生防护:在训练阶段进行数据清洗和风险抑制。
  • 外置护栏:融合智能风控,精准拦截输入输出风险内容。

本节过渡:解决了云端的安全与能力问题,大模型要真正融入万物,还需走向边缘,在终端侧释放价值。


第八讲:边缘AI:打造千行百业智能体 🤖

云天励飞董事长兼CEO陈宁阐述了边缘AI在推动大模型落地中的关键作用。

边缘AI的价值与场景

与云端AI相比,边缘AI具备三大特点:成本更低、数据隐私保护更好、响应速度更快。它适合将大模型带到每个人身边,渗透到物理世界的各个角落。

三类应用场景

  1. 个人助手:AI Phone、可穿戴设备。
  2. 家庭助手:无人驾驶、低空经济无人机、人形机器人。
  3. 城市/行业助手:电力、交通、能源、教育、医疗等行业的专业助手。

边缘AI的发展阶段与云天励飞实践

陈宁将边缘AI发展分为四个阶段,当前正从 “小模型边缘计算”“多模态大模型赋能AIPC/AIPhone” 过渡,未来将进入 “端到端行为大模型驱动机器人” 的阶段。

云天励飞基于 “算法+芯片”双技术平台,拓展了智能硬件、智算运营和行业解决方案三大业务,并定义了场景智能化的L1-L5等级(从数字化到自进化),推动边缘AI生态建设。

本节过渡:边缘设备需要智能,而智能的诞生离不开*大的底层算力。如何高效、普惠地管理和调度算力,是下一个关键问题。


第九讲:智算操作系统:软件定义算力的新世界 💻

九章云极DataCanvas董事长方磊提出了“智算操作系统”的概念,以解决算力普惠的难题。

智算操作系统的必要性与价值

当前,许多智算中心仅提供“裸金属”算力,如同没有操作系统的手机或电脑,无法灵活调度。智算操作系统的核心任务是:向下管理硬件,向上提供易用的算力服务

核心价值:推动进入 “普惠算力” 时代。通过软件将庞大的硬件池转换为可度量、可切分、可零售的小块算力,让中小企业也能像用电一样灵活使用算力。

九章云极的实践:Aalaya “新世界”

九章云极的智算操作系统Aalaya通过以下技术实现普惠算力:

  • 新内核与存储:专为大模型设计的存储系统(如DingoFS),支持数据“物化视图”共享,避免重复拷贝,实现“断点续算”。
  • AI Native交互:操作系统本身即智能体。用户可用自然语言指令(如“用这3T数据微调某个基座模型”)驱动系统自动完成运算和调度。
  • 性能优化:训练效率提升100%,GPU利用率提升50%,推理速度大幅提升。

本节过渡:算力是基础,医疗则是关乎民生的重要应用领域。大模型如何在这个严谨的领域发挥作用?


第十讲:AI蝶变,洞见医疗未来 🏥

联影智能联合创始人周*博士探讨了大模型在医疗健康领域的应用与挑战。

医疗大模型的挑战与“混合模型”路径

周博士指出,医疗数据多但利用率低,且大模型存在根本性缺陷(如他提出的“字母计数挑战”)。因此,“自上而下的大模型”与“自下而上的垂域模型”融合,是关键路径。

联影智能的实践

  1. 影像大模型:用Transformer实现“一扫多查”,用Diffusion Model生成医疗影像数据以训练分析算法,提升检测准确性。
  2. 文本大模型:通过RAG等技术,应用于信息总结、证据提取、个性化推理,并开发了能听懂放射科医生口述、自动生成结构化报告的AI助手。
  3. 多模态与数据融合:将摄像头、投影仪与VR结合,用于手术导航(如颌面外科手术)。未来,医院信息系统将因大模型而整合,实现生数据融合。

未来愿景:构建“元医院”,实现数据、模型、多模态的全面融合。

本节过渡:从严肃的医疗场景回到日常的知识工作,大模型如何成为我们得力的“第二大脑”?


第十一讲:AI赋能的“第二大脑”:知识管理新范式 📝

32:重塑生产力:AI开创增长前沿论坛精华解读 🚀

在本课程中,我们将学习“重塑生产力:AI开创增长前沿”论坛的核心内容。论坛探讨了人工智能,特别是生成式AI,如何成为塑造新质生产力的关键引擎,并深入分析了其在技术、数据、治理及行业应用等方面的挑战与机遇。


论坛开幕与致辞 🎤

尊敬的各位领导、各位来宾、女士们先生们,大家下午好。欢迎大家来到艾森哲“重塑生产力:AI开创增长前沿”专题论坛的现场。

本次论坛在世界人工智能大会组委会办公室指导下,由艾森哲(中国)有限公司主办,第一财经支持,线上线下同步举行。作为推动未来发展的战略性技术和通用技术,人工智能已被认定为形成新质生产力的重要引擎。

在本次世界人工智能大会期间,艾森哲特别筹办了本场专题论坛,旨在共同开启一场AI赋能千行百业的智航之旅,探索AI重塑商业模式的无限可能。


主旨演讲:人工智能的治理与国际合作 🌍

上一节我们介绍了论坛的背景,本节中我们来看看人工智能治理这一核心议题。

世界经济论坛大中华区主席陈黎明先生回顾了人工智能波浪式的发展历程。他指出,每一项重大技术都像双刃剑,在带来红利的同时也可能伴随长期代价,例如蒸汽机与气候变化、农药与生态平衡、核能与安全困境。

人工智能的崛起同样需要警醒。其潜在风险包括但不限于:

  • 隐私与真实性风险:Deepfake等技术可能颠覆“眼见为实”,导致新闻造假、网络诈骗等问题。
  • 能源消耗:AI模型运行需消耗巨大电能。
  • 职业再平衡:AI会替代部分岗位,同时创造新岗位,但对个体而言可能是职业生涯的重大挑战。
  • 未知风险(Unknown Unknowns):我们可能因认知局限,在“科技向善”的初衷下无意中造成损害。

因此,在迫切寻求AI应用的同时,必须重视风险管控,在发展创新与可持续发展间取得微妙平衡。这需要政府立法、企业践行科技伦理、开发者坚守底线思维三者协同。


核心洞察:生成式AI重塑企业生产力 🔄

在了解了宏观治理框架后,我们聚焦到企业层面,看看生成式AI如何具体重塑生产力。

艾森哲全球副总裁、大中华区技术服务事业部总裁俞毅博士指出,当前企业对生成式AI的认知已从“为何要做”转向“如何做好”,落地实践正走向纵深和端到端。特别是在中国企业出海场景中,生成式AI在合规、客服、销售知识、供应链计划等方面已成为刚需。

他认为,这一轮生成式AI浪潮与以往不同,是真正以人为中心的革命性技术。其能力曲线在语言理解、推理、数学等方面提升显著。然而,要规模化推动生成式AI解决方案,企业需构建五大关键能力:

  1. 价值为先:从单点场景优化转向梳理整个价值链的价值基线,明确投资回报。
  2. 打造数字核心:评估并完善企业的数据架构,确保能支撑结构化和非结构化数据的处理。
  3. 重塑人才与团队:AI投资1元,人员投入可能需要2元。组织需重新设计岗位、绩效考核与培训机制。
  4. 践行负责任AI:建立跨法务、技术、业务的治理架构或委员会,管理合规、隐私及更广泛的风险。
  5. 拥抱动态环境:技术迭代迅速,需保持敏捷和学习心态。

数据基石:解锁生成式AI潜力的六大关键 🔑

企业应用AI离不开数据基础。上一节我们讨论了企业所需的综合能力,本节我们深入探讨其中最核心的要素——数据。

艾森哲全球副总裁、全球数据能力主管董小山博士*调,数据将是企业未来竞争和安全管理生成式AI的基础。生成式AI对数据准备提出了新的要求,主要体现在六个方面的变革:

  1. 专有数据即竞争优势:企业的专有数据是使通用大模型变得相关、准确的关键,需像对待产品一样投资和管理数据。
    • 公式:模型准确性 ≈ 基础模型能力 + 专有数据质量
  2. 非结构化数据蕴含潜力:企业70%的数据是非结构化的(文档、音视频等)。生成式AI擅长从中提取信息,但需建立相应的治理流程。
  3. 合成数据填补空白:在数据缺失或获取成本高时,可利用生成式AI、数字孪生和专家知识生成合成数据,以推动创新。
  4. 数据应用更便捷,风险也加速:生成式AI降低了跨领域使用数据的门槛,但也增加了数据泄露等风险。企业需为全员提供培训和工具,并考虑使用“模型网关”来脱敏和保护敏感数据。
  5. 生成式AI加速数据就绪:生成式AI本身能用于加速数据准备工作,如生成测试用例、转换代码、创建数据产品文档等,从而反哺数据战略。
  6. 行动建议:企业应立即开始,利用已验证的用例获取生产力收益,并以此为基础资金推动更战略性的数据项目。

圆桌对话(全):数据价值的深度探讨 💬

基于董小山博士提出的数据六大关键,我们进一步探讨其具体应用。

在与俞毅博士的对话中,董小山博士分享了中美AI发展的观察:中国市场的模型选择更多元,企业更早关注模型对比和成本效益,且在特定领域(如小语言模型/垂直模型)的探索可能领先。她*调,专有数据是差异化的核心,企业需思考如何将数据产品化、货币化。

在释放数据价值方面,除了提升内部效率,还可用于跨部门协作创新、以及与合作伙伴共创新的商业模式(如在保护隐私的前提下联合分析数据,提升整体客流量)。

关于所需的新人才,她指出“领域教练”至关重要。他们需要指导业务人员如何应用AI、确保输出质量、并设定符合品牌调性的“语义层”。


圆桌对话(二):AI变革业务运营与人才未来 🧑‍💼

数据之外,人才与组织是AI落地的另一支柱。本节我们关注AI如何变革运营并重塑人才需求。

联想集团高级副总裁高岚分享了联想的“AI for All”(人工智能普惠)战略,其核心是“人本智能”,包括为人类福祉服务的底线、为人带来便利与安全的技术、以及促进可持续发展的理念。

她认为,AI将深刻影响业务模式、管理模式与客户对接模式。企业高管需要快速学习、提升在不确定环境下的数据决策与迭代能力。对员工而言,批判性思维、创造力、终身学习以及积极拥抱变化的心态,是区别于机器、适应未来的关键技能。

在生态合作上,她提出“共生”理念:各方应基于共同认可的规则(如负责任的AI),发挥各自优势(如联想设备与艾森哲行业实践),互利共赢,共同推动市场繁荣。


圆桌对话(三):生成式AI提升企业收益 ✈️

让我们将视角转向具体行业,看生成式AI如何解锁增长新动力。

国泰航空数码部总经理邹明诺先生介绍,国泰航空自2017年起夯实数据与云基础,已在机器学习(如智能配餐)、生成式AI(升级智能客服“小泰”)和流程自动化(引入“数字化员工”)三大领域广泛应用AI。

生成式AI正在改变与顾客的沟通方式,未来可能实现行程规划、订票、改座等服务的自然语言交互。同时,它极大提升了开发人员的效率。

在大湾区布局中,国泰视其为“延伸的总部市场”,通过海空联运、人才培训计划(如IT培训生项目)、科技创新活动(如编程马拉松)等方式深度参与。技术融合的关键在于生态合作,包括在合规前提下共享数据优化运营、与科技公司及初创企业合作、以及行业间共同学习与引领变革。


圆桌对话(四):工业企业的AI突破与实践 ⚙️

最后,我们深入实体经济核心,探讨AI在工业企业的突破。

汇川技术副总裁*瑞林先生介绍,汇川在工业AI领域已深耕12年,应用于外观检测、预测性维护、能源管理、数字孪生等多个环节。他指出了工业AI面临的三大挑战:数据来源复杂且标准不一、需与多物理学科机理结合、以及保护客户知识产权的需求

为应对挑战,汇川采取了三大措施:董事长挂帅的数据治理变革、工业AI研究所进行技术探索与平台打造、以及集团级的AI技术管理委员会进行协调。

他认为,目前已在六个方向形成商业闭环:预测性维护、质量控制、能源管理、研发数字孪生、产品设计创新、以及客户服务与知识管理。例如,生成式AI可大幅提升技术文档多语言翻译的效率与质量。

展望未来,AI将改变工业企业的商业模式(如盘活存量资产、实现真正柔性定制)和生产运营方式(如研产销一体化、智能制造自动化深化、能源高效化)。他呼吁行业需加*在数据标准与共享方面的生态合作。


论坛总结 🎯

在本课程中,我们一起学习了“重塑生产力:AI开创增长前沿”论坛的核心内容。我们从人工智能的全球治理与合作必要性出发,深入探讨了生成式AI作为新质生产力引擎,在企业价值实现、数据基石构建、人才组织重塑、以及航空、工业等具体行业应用中的无限可能与现实挑战。

关键共识在于:AI,特别是生成式AI,已不仅是技术工具,更是驱动业务转型、重塑竞争格局的核心力量。其成功应用需要技术、数据、人才、治理及生态合作的全面协同。企业需秉持负责任和以人为本的理念,积极拥抱变化,在动态中探索前行,方能驾驭AI浪潮,开创增长新前沿。

33:中国电信星辰人工智能生态论坛解读 🚀

在本节课中,我们将学习中国电信在人工智能领域的战略布局、核心能力与生态构建。课程内容基于“星辰注智 焕新领航”论坛,我们将系统性地梳理中国电信如何以“星辰”品牌为核心,打造自主可控的AI技术体系,并赋能千行百业。


概述:人工智能引领智能化新时代

以大模型为代表的人工智能技术正在引领世界进入智能化新时代。中国电信率先提出打造关键核心技术自主掌控的科技型企业。

上一节我们介绍了人工智能的时代背景,本节中我们来看看中国电信的整体战略布局。

一、 核心战略与总体布局 🎯

中国电信坚持云网基础设施建设,把握人工智能发展方向。其战略核心是围绕 “1+1+1+M+N” 的人工智能发展布局。

以下是该布局的具体内涵:

  • 一个算力底座:提供*大的智能算力支撑。
  • 一个大数据底座:汇聚高质量数据要素。
  • 一个通用大模型底座:自主研发基础大模型能力。
  • M个内部大模型:用于企业内部数字化转型。
  • N个行业大模型:赋能外部垂直行业。

该布局旨在夯实由算力、数据、大模型构成的坚实底座,构建全面且成熟的大模型产品体系,勇担人工智能“国家队”的角色,并打造 “中国电信星辰大模型” 品牌。

中国电信致力于成为国内领先的智能服务商、通用大模型的领跑者以及行业大模型的主导者,以点亮星辰AI新时代。


二、 三大核心底座详解 🏗️

上一节我们了解了“1+1+1+M+N”的总体框架,本节中我们深入剖析构成基石的三大核心底座。

1. 云智一体算力底座 ☁️➡️🧠

云是智能化的算力底座。基于全面的资源布局和领先的计算技术,中国电信已经构建了业界领先的智算底座。

以下是算力底座的关键举措:

  • 领先的梯度布局:率先提出辐射全国的 “2+3+7+X+Y” 梯度性智算布局,处于行业领先水平。
  • 国产化智能算力:提前布局国产化智能算力,持续引领智算公有云国产化建设发展,同时自主构建了全栈智算服务。
  • 核心平台体系:通过“云志”超一体化基础设施平台、“云骁”计算加速平台、“熙壤”(全国首个算力互联互通验证平台)以及“汇聚”一站式智算服务平台,形成云智一体的计算服务体系。
  • 自主可控:实现全栈计算能力的自主可控。

2. 高质量数据底座 📊

中国电信依托数据要素资源禀赋,整合多元数据,打造“星海”大数据产品体系。

以下是数据底座的核心能力:

  • 建设数据流通设施:建设“临泽”数据要素服务平台,构建跨行业、跨区域、跨机构的数据流通基础设施。
  • 技术协同创新:突破大数据平台关键技术与人工智能协同创新,支撑数据集高效管理,充分释放数据要素价值。
  • 广泛数据合作:同卫健、教育、交通、文旅等领域 30余 家单位开展数据合作对接,引入高质量数据集,用于大模型研发、内部数字化转型及联合产品打造。

3. 基础大模型底座 🤖

“星辰”系列大模型是中国电信完全自主研发的大模型,参数规模超过千亿。

以下是基础大模型的特点:

  • 四类基础模型:包含语义、语音、多模态、视觉四个基础大模型,构成中国电信独一无二的基础大模型底座。
  • 央企首个开源:星辰大模型是国内首个央企开源的大模型,目前已开源 7B、12B、52B 参数规模的语义大模型。
  • 特色能力:支持 30种 方言自由混说,吸引了国内外开源社区开发者广泛讨论和使用,积累超过 40万 用户。

三、 行业赋能与生态平台 🤝

上一节我们探讨了技术底座,本节中我们来看看中国电信如何将这些能力应用于行业并构建开放生态。

1. 深耕行业应用

中国电信凭借在各行业深耕多年的优势和经验,联合头部生态伙伴,构建了涵盖教育、政务、应急等 20多个 行业大模型,深入推动大模型与各行各业的融合,切实赋能千行百业转型升级。

2. 星辰MaaS平台 🌐

中国电信星辰MaaS平台作为统一的AI运营生态平台,是连接合作伙伴自有AI能力和行业客户的纽带。

以下是星辰MaaS平台的核心功能:

  • 多维能力集成:平台从模型、数据集、算力、应用和工具多个维度,打造合作伙伴能力池。
  • 标准化服务:以标准化服务方式,赋能多行业伙伴不同层次的产品和能力,实现生态共赢。
  • 端到端解决方案:提供涵盖“评、选、部、数、构、训、推、用”的端到端大模型解决方案,一站式满足用户多云算力调度、大模型选配、应用场景创新的需求。
  • 专属运营服务:为行业客户提供专属的生态运营服务,让教育提质注智焕新,为文旅体验聚智护航,让政务服务提质增效。

总结

本节课中我们一起学习了中国电信“星辰注智”人工智能生态的核心内容。我们从 “1+1+1+M+N” 的战略布局出发,详细解读了其 云智一体算力底座高质量数据底座自主研发的基础大模型底座 三大核心支柱。最后,我们了解了中国电信通过构建 行业大模型星辰MaaS开放平台,将AI能力深度赋能至政务、工业、文旅等千行百业,践行其“焕新领航”的使命,致力于成为人工智能时代的核心推动力量。

34:中信集团“人工智能+”行动发布会解读 🚀

概述

在本节课中,我们将学习中信集团在2024世界人工智能大会上发布的“人工智能+”行动方案。我们将了解人工智能如何与金融、制造、农业、建筑等多个产业深度融合,探索大模型技术在各行各业的具体应用案例,并分析企业智能化升级的战略路径。


一、 人工智能的时代背景与战略意义 🌍

人工智能正在全球范围内引发一场技术革命,它不仅震动科技界,更在社会生活的方方面面带来深刻变化。在中国,人工智能发展日新月异,已全面融入金融、医疗、农业、工业等领域。

国家的战略布局为AI发展提供了坚实保障,推动人工智能与经济社会各领域深度融合,成为经济增长的重要驱动力量。中信集团积极响应国家战略,领航发起“人工智能+”行动。


二、 中信集团的“人工智能+”战略蓝图 🗺️

上一节我们介绍了人工智能的时代背景,本节中我们来看看中信集团的具体战略规划。中信集团致力于将人工智能与集团业务布局深度融合发展,深化行业合作,全面推动数字化转型和智能化升级。

集团将围绕打造世界一流科技型卓越企业集团的目标,把人工智能作为发展新质生产力的重要驱动力。其战略核心是按照 “1234” 的总体思路推进:

  • 1条主线:人工智能与产业发展深度融合。
  • 2个抓手:场景验证和能力建设。
  • 3步走目标:从示范应用到深度应用,最终构建创新生态。
  • 4大实施路径:*化应用牵引、打造大模型生态、布局算力网络、筑牢安全屏障。

三、 三大行业大模型应用发布 🤖

通过持续创新实践,中信集团在人工智能应用上取得了一系列成果。以下是本次发布会重点发布的三个大模型应用方案。

1. 中信证券:债券智能助手

该模型是金融行业首个债券类大模型,服务于投行承揽、承做、承销的核心流程。

  • 核心功能
    • 商机挖掘:从海量信息中自动识别业务机会,主体识别率超98%,线索采纳率超60%。
    • 风险管理:实时监测舆情,并将负面新闻细化为200多个风险标签,实现全流程一体化风控。
    • 智慧办公:利用大模型的分析推理能力,将报告生成时间从1小时缩短至1分钟。
    • 项目运营:通过自动化管理提升运营精度。
  • 技术保障:采用隐私计算、数据脱敏确保安全合规,通过训练微调保障效果可用性。

2. 中信银行:全栈自主可控大模型平台“仓颉”

“仓颉”是一个一站式大模型能力服务平台,支持千亿级大模型的训练、推理与发布。

  • 平台特点
    • 全面:支持主流大模型技术。
    • 易用:提供100多个预置模板和可视化流程编排工具,降低应用门槛。
    • 安全:引入金融级安全解决方案。
  • 创新融合
    • 大模型 + 空间交互:在低性能设备上实现高质量渲染,赋能数字人提供个性化服务。
    • 大模型 + 金融量化:提供“千人千面”的智能投资陪伴服务。

3. 中信出版:出版行业AIGC平台“夸父”

“夸父”平台旨在以数字化推动出版行业升级,打造智慧知识新生态。

  • 平台架构
    1. 数字化底座:云、大数据及智慧知识库。
    2. 大模型引擎:模型丰富、能力全面、效果可控。
    3. 应用体系:覆盖出版流程、通用AI赋能及对外服务。
  • 应用成果:已实现面向17类场景的120多个AI应用,全面嵌入出版业务流程,每本书的创作生产均有AI参与。

四、 AI赋能产业转型升级的实践案例 🏭

人工智能的价值最终体现在解决实际业务问题上。以下是中信集团在不同产业中推动智能化升级的典型案例。

1. 智能投研(中信建投证券)

基于大模型增*的智能投研平台,旨在提升效率、普惠服务和发现投资价值。

  • 应用效果
    • 快速提取招股书摘要和关键信息。
    • 将2小时的研究会音频在1分钟内转为报告。
    • 构建数百个另类数据投资因子,相关资管产品收益显著提升。

2. 灯塔工厂(中信泰富特钢)

打造全球特钢行业首座“灯塔工厂”,实现生产全流程的数字化与智能化。

  • 关键技术
    • 智能闭环控制:提升质量,不合格品率下降47.3%。
    • AI预测模型:提升轧钢产线效率,技术产量提升15%。
    • 高炉数字孪生:将“黑箱”透明化,炉况异常时间减少84.8%,能耗下降9.1%。
    • 智慧能源管控:煤气放散率下降89%,吨钢耗新水下降30.1%。

3. 工业互联网(中信戴卡)

建设工业互联网制造协同平台,应对汽车行业快速变革的挑战。

  • AI应用场景
    • AI质检:在压铸X光探伤环节替代90%以上人工,更快更准。
    • 工艺参数自优化:根据检测结果自动调整压铸参数,提升效率与质量。
    • 设备智能提效:动态优化机床参数,实现加工效率提升5%。
    • 全流程追溯:通过产品数字标识,实现“一物一码”的全球质量追溯。

4. 智慧育种(华智生物)

开发生物育种智能决策系统“种谷大脑”,整合基因型、表型、环境型数据。

  • 核心平台
    • 基因型平台:国产化高通量检测,年处理样品45万份。
    • 表型平台:AI图像识别设备,如智能禽蛋检测仪效率提升100倍。
    • 环境型平台:智能监测设备部署于全国49个数字农业基地。
  • 目标:通过智能育种大模型,提高效率、缩短周期、降低成本。

5. 智慧建筑(中信和业)

在北京中信大厦部署超高层AI智慧建筑运营系统。

  • 系统能力
    • 连接:集成12个主系统、3.4万台设备、65万个控制点。
    • 安全:AI集成安防、消防系统,实现技防、人防、物防三位一体。
    • 绿色:执行40多种能源策略,年节省费用超150万元。
    • 高效:电梯平均等候时间仅25秒,从1层到91层仅需60秒。

五、 生态共建:联合创新启动仪式

发展人工智能是事关全局的系统性工程,需要社会各界的携手合作。在本次发布会上,中信集团与众多领先企业、高校及研究机构启动了多项联合共创计划。

以下是主要的共创领域:

  • 金融大模型共创:与百度、华为等合作,构筑金融领域应用智慧。
  • 钢铁大模型共创:联合清华大学、北科大等,聚焦视觉、预测、自然语言处理与生产制造深度融合。
  • 铝制汽车零部件大模型共创:与西门子、商汤、华为等合作,赋能制造工艺优化与研发设计。
  • 育种大模型共创:联合中国农科院、华为等,提升农业病虫害智能防控与抗性育种水平。
  • 全链级绿色制造解决方案共创:与中国船级社、德国莱茵、中国外运合作,构建覆盖原材料、制造、运输、回收的全生命周期绿色体系。
  • 辅助生殖医疗大模型共创:中信湘雅医院与商汤科技等合作,探索细分领域医疗AI应用。

总结

本节课中,我们一起学习了中信集团“人工智能+”行动的核心内容。我们看到了AI如何从一项前沿技术,转变为赋能千行百业、驱动产业升级的核心基础设施。从金融大模型的精准服务,到制造工厂的智能化生产,再到农业育种的智慧决策,人工智能正在与实体经济深度结合,创造切实的价值。

中信集团的实践表明,企业推进智能化升级需要:明确的战略主线、扎实的场景应用、开放的合作生态以及可靠的安全保障。未来已来,人工智能与产业的融合必将催生更多新模式、新业态,为社会经济发展注入新的*大动能。

35:制造数字劳动力,打造新质生产力 🚀

在本节课中,我们将学习如何利用大模型技术制造数字劳动力,从而打造新质生产力。课程内容基于一场行业论坛的讨论,涵盖了数字劳动力的概念、大模型的技术基础、行业应用实践以及未来的挑战与展望。


概述:什么是数字劳动力?🤖

数字劳动力是一个新兴概念。它不仅代表了自动化和智能化的生产力,更象征着人类智慧与技术创新的结晶。在金融等数据密集型行业,数字劳动力正成为推动数字化转型和效率提升的关键力量。


第一节:大模型的技术基础与能力边界 🧠

上一节我们介绍了数字劳动力的概念。本节中,我们来看看其核心依托技术——大模型的能力边界与发展现状。

大模型的核心是进行下一个词元(next token)的预测。其基本公式可以表示为:

P(下一个词元 | 已生成序列)

无论模型如何变形或增加多模态能力,其核心思想仍是基于已输入内容,预测下一个最可能出现的词元。

大模型的训练通常包含四个关键步骤:

  1. 大规模预训练:在海量数据上进行训练,完成知识的压缩与表示。
  2. 有监督微调:使用少量高质量数据,让模型学会执行特定任务(如问答、翻译)。
  3. 奖励模型训练:通过人工标注,训练一个能判断生成结果好坏的模型。
  4. *化学习:利用奖励模型的反馈,优化大模型的生成策略,使其输出更符合人类偏好。

然而,大模型的能力存在边界:

  • 知识记忆依赖曝光频率:模型要可靠记住一个知识,需要该知识以不同形式出现约1000次。行业数据往往曝光不足,导致模型难以掌握。
  • 能力需逐项注入:模型不具备“涌现”的万能能力。想让模型具备某项能力(如阅读理解),必须在微调阶段提供相应的训练数据。
  • 存在内生幻觉:作为概率模型,其事实性错误难以完全避免,通常需要结合搜索增*等技术来弥补。
  • 90分落地困难:达到演示水平(60分)相对容易,但要达到稳定可靠的落地水平(90分)则非常困难,需要精心的数据设计和调优。

第二节:数字劳动力的建设路径与实践 🛠️

理解了技术基础后,我们来看看如何将这些技术转化为具体的数字劳动力。

太保集团对数字劳动力的定义是:具备完成端到端服务能力,并能通过“慢思考”解决具体专业问题的智能体(Professional Agent)。这区别于简单的对话问答或检索应用,后者无法带来深刻的业务变革。

以下是数字劳动力建设的三个阶段:

  1. 搭台(基础设施建设):建设算力平台、部署私有化大模型、构建数据壁垒和开发平台。
  2. 推进(场景验证与推广):在关键业务岗位(如理赔、客服、培训)部署数字劳动力,提升劳动生产率。
  3. 深化(规模化与模式创新):提升数字劳动力的业务渗透率,并探索其带来的全新业务模式。

第三节:金融保险行业的应用案例 📊

理论需要实践验证。以下是数字劳动力在保险行业的具体应用案例,展示了其如何解决实际业务痛点。

案例一:车险在线理赔数字劳动力

  • 背景:传统车险理赔存在查勘等待时间长、流程复杂的问题。
  • 解决方案:引入数字劳动力作为在线助手,与人工坐席协同工作。
  • 实现功能
    • 接管非紧急的信息收集和客户提醒等碎片化任务。
    • 灵活理解客户非标准化的提问和意图。
    • 根据事故信息提供专业的保险责任建议。
  • 价值:实现7×24小时服务,提升案件处理效率和客户体验。

案例二:寿险代理人智能陪练助手

  • 背景:传统代理人培训依赖固定脚本,无法应对复杂多变的真实对话场景。
  • 解决方案:利用大模型模拟真实客户,与代理人进行销售对话陪练。
  • 实现功能
    • 根据客户画像生成个性化的对话剧本。
    • 结合心理学模型,使虚拟客户的反应符合真实逻辑。
    • 对代理人的表现提供实时点评和话术建议。
  • 价值:显著提升代理人,尤其是新人的销售实战能力和异议处理能力。

案例三:健康险理赔审核数字劳动力

  • 背景:健康险理赔审核成本高、依赖专业人工、自动化率遇到瓶颈。
  • 解决方案:打造具备综合能力的数字审核员,端到端处理理赔案件。
  • 所需能力:该数字劳动力需融合阅读理解保险条款解析医学知识判断逻辑推理数学计算等多种能力。
  • 价值:在责任清晰的案件中,审核效率和准确率已优于初级员工,未来有望实现商保“直赔”,革命性提升客户体验。

第四节:跨领域合作与生态建设 🌐

数字劳动力的发展离不开跨领域的合作。以下是两个重要的生态合作方向。

方向一:数据合作生态

金融机构间通过隐私计算、区块链等技术,在保障数据安全的前提下实现数据价值的共享与挖掘。例如,银行与保险公司合作,可以优化产品推荐、整合账户服务,共同提升客户服务能力。

方向二:气象大模型与风险减量

精准气象预测对保险业的风险评估至关重要。

  • 伏羲气象大模型:利用AI技术,提供全球中期天气预报、区域高分辨率预测和次季节气候预测,精度和效率优于传统数值模式。
  • 保险应用:用于预测极端天气(如台风、暴雨),提前进行灾害预警和防灾部署,实现从“险后理赔”到“险前减量”的转变。

第五节:风险、挑战与未来展望 ⚖️

在积极应用的同时,我们必须正视大模型带来的风险与挑战。

核心风险与应对

  1. 安全与伦理风险:包括数据隐私泄露、模型生成有害内容、深度伪造(如AI换脸诈骗)等。
    • 应对:需要技术(如内容过滤、反欺诈检测)、管理(如API权限控制)和立法(伦理规范)多层面协同治理。
  2. 模型幻觉与可控性:大模型可能“一本正经地胡说八道”,且在调用外部工具时可能执行危险操作。
    • 应对:关键场景需结合搜索增*(RAG)确保事实性,并对工具调用设置严格的安全边界。
  3. 落地成本与效益评估:大模型训练与推理成本高昂,需谨慎评估投入产出比。
    • 应对:采用“场景驱动”策略,优先选择验证容易、价值明确的场景切入,并探索通过模型分层设计优化成本。

未来发展的两条路径

  1. 通往AGI之路:追求通用人工智能,需要海量算力、数据投入和理论突破,道路漫长且不确定。
  2. 深耕应用之路:不相信短期AGI能实现,聚焦特定领域和任务,打造高价值的专业数字劳动力。这是当前更务实的选择。

场景选择的关键维度

选择大模型应用场景时,可参考两个维度:

  • Y轴:任务工作量(AI能替代多少人工)。
  • X轴:验证难易度(人类验证AI结果的成本)。
    理想场景是工作量替代大、且验证容易的领域(如生成摘要、初步审核)。应避免验证极其困难的场景。

总结与展望 🌟

本节课中,我们一起学习了数字劳动力的内涵、其背后的大模型技术原理,以及在金融保险行业的具体实践案例。我们看到,真正的数字劳动力是能端到端解决问题的智能体,它的建设需要扎实的技术基础、清晰的场景规划和持续的迭代优化。

同时,我们必须以审慎的态度面对其带来的安全、伦理和成本挑战。未来,通过深化技术合作、构建开放生态、并聚焦于能创造明确价值的专业场景,数字劳动力必将成为驱动各行业发展的新质生产力,为社会创造更大价值。

解放生产力,释放想象力,让我们共同迎接数字劳动力新时代的到来。

36:GLM大模型技术前沿与产业应用论坛精华解读 📚

课程概述

在本节课中,我们将系统性地学习由智谱AI、清华大学知识工程实验室等机构联合举办的“新一代基座大模型技术前沿与产业应用论坛”的核心内容。课程将涵盖大模型的技术原理、产业落地实践、安全对齐、以及在法律、代码生成、时间序列分析等垂直领域的应用探索,旨在为初学者提供一个全面、清晰的大模型知识图谱。


第一节:大模型落地应用的整体探索 🚀

上一节我们介绍了课程的整体框架,本节中我们来看看智谱AI首席执行官张鹏先生关于大模型落地应用的整体思考与实践。

智谱AI在大模型领域已深耕四年多,其自主研发的GLM(General Language Model)算法框架,融合了BERT的自编码和GPT的自回归思想,形成了独特的技术路径。该框架在部分国际评测中展现出优秀的鲁棒性和较低的校准误差,这意味着它在控制大模型“幻觉”问题上具有潜力。

基于GLM框架,智谱AI逐步推出了对标国际顶尖水平的模型系列,最新的GLM-4模型在多项能力上已追平甚至超越GPT-4。其核心能力体现在:

  • 长文本处理:上下文长度可达128K,能一次性精准处理近百万字的文档。
  • 多模态理解:在图像理解等任务上达到与GPT-4V相当的水平。
  • 智能体(Agent)能力:支持工具调用,让普通用户也能快速开发AI应用。

在应用层面,智谱AI聚焦于赋能个人与企业:

  • 个人赋能:通过“智谱清言”APP,提供AI超级助手平台,用户可创建个性化智能体,用于文档总结、文案生成、图像创作等,实现“AI for Everyone”。
  • 企业赋能:提出“企业大模型落地就绪度(LLM Ready)”方法论,从技术栈、管理、数据、基础设施、业务适配五个维度评估企业现状,并提供定制化咨询与实施方案。例如,在保险核保、金融财报分析等场景中,通过大模型实现业务流程自动化,显著提升效率与用户体验。

智谱AI通过开放平台提供模型即服务(MaaS),已服务超40万客户,覆盖金融、医疗、汽车等16个行业。同时,公司积极承担社会责任,参与全球AI安全承诺与国内行业标准制定,倡导安全、向善的AI发展道路。

核心公式/概念

  • GLM框架GLM = 融合(BERT自编码, GPT自回归)
  • 企业就绪度LLM_Ready = f(技术栈, 管理, 数据, 基础设施, 业务适配)

第二节:大模型的安全与超级对齐研究 🔒

上一节我们探讨了大模型如何落地应用,本节中我们来看看当模型智能超越人类时,如何确保其安全与对齐——即清华大学黄民烈教授分享的“超级对齐”前沿研究。

当前的大模型训练(如SFT、RLHF)基于一个*假设:人类提供的监督信号(如标注数据、奖励函数)是绝对正确(Ground Truth)的。然而,当AI能力超越人类智能后,人类将无法提供可靠监督,这个假设便不再成立。超级对齐的核心就是研究如何在弱监督甚至不可靠监督下,让*AI模型持续、安全地进化。

黄教授团队围绕该问题展开了一系列探索:

  1. 复杂任务分解:面对竞赛级代码生成等超人类难度的任务,研究如何让大模型先将任务分解为子任务,再由人类对分解方案进行偏好标注(如A分解优于B),最后分别求解子任务。该方法能显著提升人类解题效率,甚至让未经专业训练者达到专业水平。
  2. 模型权重外插:一种无需训练即可提升模型性能的方法。给定两个模型检查点(Checkpoint)参数θ和θ1,通过公式 θ2 = θ1 + α * (θ1 - θ) 进行外插,即可获得一个能力更*的模型θ2。这证明了现有模型仍有未被充分挖掘的潜力。
  3. 精确对齐优化:针对当前流行的DPO(直接偏好优化)方法会学习到一个“平均分布”而非数据真实“主峰”的问题,团队提出了理论推导更严谨的EXO方法,能更精确地拟合最优输出分布。
  4. 提示词自动优化:通过大模型自动重写用户输入的提示词(Prompt),使其对模型更友好,从而激发模型潜能,在各类任务上可获得显著的胜率提升。
  5. 自我迭代与净化:构建一个自动化系统,让模型自动发现自身漏洞(如通过“出题-答题-判卷”流程),并基于漏洞数据重新训练,实现模型的自我迭代与能力提升。

这些研究为构建安全、可控、持续进化的超级智能提供了重要的技术思路。

核心公式/概念

  • 模型权重外插θ_enhanced = θ1 + α * (θ1 - θ)
  • 超级对齐定义:研究在 Human_Intelligence < AI_Intelligence 时,如何实现 Weak_Supervision -> Strong_AI 的泛化。

第三节:大模型处理结构化数据的挑战与实践 📊

上一节我们深入探讨了超级智能的对齐问题,本节中我们回到当前更普遍的应用场景:如何让大模型理解和处理海量的结构化数据。中国人民大学张静副教授分享了在此领域的系列工作。

结构化数据(如数据库、电子表格)是产业数据的核心形态,但大模型直接处理它们面临幻觉和逻辑能力不足的挑战。张静老师团队从数据存储形式出发,研究了三种场景:

  1. 数据库场景(Text-to-SQL):目标是将自然语言查询转换为SQL语句。挑战在于数据库模式(Schema)复杂、表名歧义。解决方案是设计高质量的数据库提示(Prompt),包含表关系、列描述等,并采用双向数据增*方法,在缺乏标注数据的新数据库上快速微调适配模型。
  2. 电子表格场景(Table QA & 操作):目标是让模型支持对Excel/CSV文件的查询、修改、绘图等多样操作。团队通过大模型扩充现有QA数据的推理链(COT),并利用交叉验证(Crowd-Way) 生成高质量的操作指令-答案对,从而训练出能处理多种表格任务的统一模型。
  3. 工具调用场景:当数据封装在API后,目标是让大模型学会规划并调用一系列有依赖关系的工具。例如,在学术搜索系统中,回答“某人引用最高的论文”需要依次调用“找人->找论文->获取每篇引用数->排序”等多个API。团队通过预定义API序列并生成包含循环、判断逻辑的代码,比传统的树状规划更高效。

未来的研究方向包括:数据格式统一与清理、更复杂的表格函数支持、训练数据与真实用户请求的分布对齐、以及为代码等严谨任务构建高质量的偏好数据(Preference Data)。

核心概念

  • 双向数据增*(NL -> SQL) + (SQL -> NL) 循环,生成适配新数据库的微调数据。
  • 交叉验证(Crowd-Way):通过不同方法(如直接推理、代码执行)生成答案,一致性检查通过则视为高质量数据。

第四节:面向时间序列的垂直领域大模型探索 ⏳

上一节我们讨论了大模型处理表格和数据库,本节中我们聚焦另一种重要的结构化数据——时间序列。浙江大学杨洋教授分享了在脑电、电力等领域构建垂直大模型的实践。

时间序列数据广泛存在于医疗、金融、工业等领域,但直接套用文本大模型的“暴力预训练”范式效果不佳,核心在于时间序列缺乏像文本词元(Token)那样天然可泛化的基本单元。杨洋教授团队提出了实现时间序列模型泛化的三个层面:

  • 个体可泛化:用患者A数据训练的模型,能直接用于患者B。
  • 任务可泛化:一个模型能完成多种任务(如癫痫检测、情感识别、运动检测)。
  • 领域可泛化:小领域间(如颅内脑电SEEG到头皮脑电EEG)甚至大领域间(如脑电到金融)的迁移。

脑电大模型为例,团队发现“脑电信号传播模式”是一个可泛化的桥梁。他们通过结构学习算法构建大脑区域的传播图,并以此为基础设计模型架构,捕捉信号在时间和空间上的关联性。第一代模型(SEEG数据训练)在癫痫检测等任务上表现出色;第二代模型融合了多源、多模态生理数据(如眼电、心电),实现了更广泛的任务可泛化。

电力大模型方面,团队基于国家电网多年的用电负荷数据,训练了统一的10亿参数模型。该模型能够理解用电行为背后的物理意义(如行业关联性、季节性变化),从而支撑线损预测、反窃电、用户画像等44种不同的下游任务,实现了“一个模型搞定所有事情”。

核心经验是:在时间序列领域构建有效的大模型,需要显式地编码可泛化的领域知识(如传播机理、物理规律),而不能仅仅依赖数据规模的堆砌。

核心概念

  • 时间序列泛化三层面个体泛化 < 任务泛化 < 领域泛化
  • 领域知识桥梁:在时间序列中寻找(如信号传播模式)作为预训练的可泛化目标。


第五节:代码大模型的进化与开源发布 💻

上一节我们了解了时间序列大模型的构建,本节中我们转向一个生产力工具的核心——代码大模型。智谱AI的CodeGeeX团队负责人郑秦凯分享了最新进展。

CodeGeeX项目历时两年多,用户已超百万。其演进路径是从AI辅助编程迈向项目级编程助手。团队研究发现,追求完全自动化的“AI软件工程师”当前成功率低、难以调试。因此,更务实的路径是*化模型在真实开发环境(IDE)中的能力,利用项目文件、依赖关系、命令行等丰富信息,解决“理解新项目、定位修改点、跨文件改动”等实际痛点。

为此,团队发布了 CodeGeeX 4-9B 模型,定位为“百亿参数下性能最*的全能代码模型”。其特点包括:

  • 功能全面(All-in-One):集代码补全、生成、聊天、解释器、联网搜索、工具调用、仓库级问答于一体,覆盖全开发场景。
  • 性能*劲:在HumanEval、NaturalCodeBench等权威基准上,媲美甚至超越更大规模的模型。
  • 长上下文:支持128K上下文,可处理超万行代码的项目,并在“代码大海捞针”测试中实现100%召回率。
  • 高效推理:相比前代模型,推理速度显著提升。

本次论坛的重要彩蛋是:CodeGeeX 4-9B 模型宣布开源。开发者可以访问开源仓库,获取这一高性能代码模型,并将其集成到本地IDE插件中,在完全保护代码隐私的前提下提升开发效率。现场演示了其项目级代码理解、自动生成Commit Message、跨语言翻译等*大能力。

核心概念

  • 项目级编程助手:利用IDE上下文信息(项目结构、已打开文件等)进行智能编码辅助。
  • 开源模型CodeGeeX 4-9Bhttps://github.com/THUDM/CodeGeeX 开源。

第六节:智能体(Agent)技术的演进与平台化 🧠

上一节我们见证了代码大模型的最新突破,本节中我们来看看大模型能力的集大成者——智能体(Agent)。智谱AI技术团队负责人顾小涛博士分享了GLM模型在智能体方向上的探索。

智谱AI的技术迭代始终沿着两条主线:基座模型能力越来越*,以及面向智能体的能力不断拓展。一个智能体需要具备感知(从环境获取信息)、决策(规划并采取行动)、学习(自我改进)的能力。

为评估智能体能力,团队构建了 AgentBench 评测基准,涵盖操作系统、数据库、知识库、游戏、网页浏览器等8类复杂环境。评测发现,基座模型的能力从根本上决定了智能体的上限,GLM-4模型在其中表现卓越。

围绕智能体面临的挑战,团队进行了多项技术优化:

  1. 扩展内存(长上下文):通过调整位置编码与长文本数据继续预训练,将模型上下文窗口扩展至128K,并优化训练时的数据打包策略,以高效处理长序列。
  2. 提升智能体能力而不损失泛化性:通过Self-Instruct生成大量智能体指令数据,并与通用文本数据按比例(20% vs 80%)混合训练,使模型在智能体任务上提升显著,同时保持原有通用能力。
  3. 增*多模态感知:推出多模态模型CogVLM,通过引入“视觉专家”模块,更好地融合视觉与语言信息,使其能处理图像、文档、图表等多种视觉输入。
  4. 赋能图形界面(GUI)操作:基于CogVLM开发了CogAgent,能理解屏幕像素信息,自动完成点击、输入等GUI操作,打开了更广阔的应用场景。

基于以上能力,智谱AI在“智谱清言”APP中推出了 All Tools 功能,GLM-4作为中枢大脑,可自动调用联网搜索、代码解释器、绘图等工具完成复杂任务。同时,平台开放了智能体API,开发者可基于此构建更灵活的工作流。未来,智能体技术将在提升计算效率、确保安全可控等方面持续探索。

核心概念

  • 智能体能力三角感知 -> 决策 -> 学习
  • 混合训练Final_Model = SFT(基座模型, 混合数据[20% Agent数据 + 80% 通用数据])

第七节:大模型在法律垂直领域的深度应用 ⚖️

上一节我们探讨了通用智能体的发展,本节中我们深入一个严肃而专业的垂直领域——法律,看看大模型如何在此落地。幂律智能创始人涂存超分享了法律大模型的构建与应用。

法律场景天然适合大模型(文本输入/输出),但通用模型直接应用存在严重幻觉、专业概念理解偏差、回答缺乏可操作性等问题。构建有效的法律垂直模型需要兼顾通用能力专业能力

幂律智能与智谱AI合作,基于GLM-130B基座模型,采用了两步走策略:

  1. 增量预训练(通读法律知识):使用海量法律文本(裁判文书、法条、合同、书籍)对基座模型进行全参数增量训练,使其“通读”法律领域知识。
  2. 有监督微调(学习法律人思维):使用百万级法律对话数据对模型进行SFT,使其回答风格更贴近专业法律人(如引用明确法条、给出确定结论)。

然而,仅有模型还不够,必须结合法律行业机理。例如,合同起草并非完全端到端生成,而是基于高质量模板的修订。因此,在应用层需将大模型与外部知识库(法条、案例、合同模板)、以及法律任务逻辑(如合同审查步骤拆解)深度结合。

在实际应用中,大模型显著改变了法律服务工作模式:

  • 智能合同审查定制化:以往为客户定制合同审查点需大量标注数据和模型训练。现在,法律研究员可直接通过与大模型对话,以“提示工程”方式快速配置审查逻辑,极大降低了定制门槛和周期。
  • 合同管理智能化:通过自然语言对话即可查询合同库信息(如“上半年金额超50万的合同”),或自动抽取合同关键信息填充表单。
    大模型已成为法律科技公司解决专业应用问题的核心能力,正在服务众多对AI接受度高的行业头部客户。

核心概念

  • 垂直模型构建法律大模型 = 增量预训练(GL基座, 法律文本) + SFT(法律对话数据) + 行业机理融合
  • 应用模式变革:从“标注数据 -> 训练小模型”的厚重模式,转向“提示交互 -> 配置逻辑”的敏捷模式。

第八节:圆桌讨论:大模型的产业机遇与中小企业入局策略 💡

在系统学习了技术前沿与各领域应用后,本节我们通过圆桌讨论的形式,聆听嘉宾们对产业宏观问题的思考。论坛围绕三个核心问题展开:

问题一:大模型能否实现跨领域通用性?

  • 共识:大模型的核心价值在于其通用性和泛化能力。基座模型提供了*大的智能基础,通过少量垂类数据微调或外部工具(RAG、插件)接入,就能在特定领域发挥价值。因此,其通用性是其赋能千行百业的前提。
  • 补充视角:通用性有“程度”之分。基础的理解、推理能力通用程度高;但深入到具体行业的专业细节(如法律条款的细粒度抽取),仍需行业特定知识增*。长期看,随着数据虹吸效应,通用能力会越来越*。

问题二:成本高企,中小企业如何入局大模型?

  • 明确建议不建议中小企业从头研发基座大模型,这是资源密集型竞争。应聚焦于应用层创新
  • 可行路径
    1. 利用API服务:直接调用智谱AI等公司的开放平台API,快速集成大模型能力,成本可控。
    2. 基于开源模型微调:如果对数据隐私要求高,可基于开源模型,利用自身领域数据进行轻量级微调。
    3. 关注工具链:现有工具链(如提示词工程、RAG框架)日益成熟,非技术背景人员也能参与构建应用。
    4. 发挥自身优势:中小企业组织灵活,能更快地利用大模型重塑业务流程,与专注技术的公司形成双向促进。

问题三:大模型长远看将引发何种产业变革?

  • 生产力解放:最直接的影响是替代重复性劳动,极大提升生产效率。即使是当前水平的模型,只要用好(如“写代码前先写注释”这样的管理动作配合),就能产生巨大价值。
  • 行业重塑:知识密集型、文本密集型行业(如法律、教育、内容创作)可能首当其冲。例如,若法律大模型达到普通律师水平,将极大提升法律服务的可及性,改变行业格局。
  • 人机协同新范式:变革未必是AI完全取代人,而是形成新的分工。人类专注于创意、战略和监管,AI负责执行、计算和初

37:盘古大模型重塑千行万业 🚀

概述

在本节课中,我们将学习华为云盘古大模型5.0的核心能力、技术创新及其在多个行业(如自动驾驶、工业设计、医疗、钢铁、气象等)中的实际应用案例。课程将深入探讨大模型如何解决行业难题,并介绍其技术架构、开发平台及生态合作。


一、盘古大模型5.0:全栈能力与行业赋能

尊敬的各位嘉宾,欢迎来到2024世界人工智能大会华为云盘古大模型论坛。本次论坛旨在探讨在AI大模型新时代,企业如何拥抱人工智能,基于大模型突破行业关键技术瓶颈,实现提质、增效、降本、节能,构建智慧未来的新商业蓝图。

华为云盘古大模型5.0于近期发布,带来了一系列升级和突破。它具备以下核心特点:

  1. 全系列参数规格:包含从10亿、百亿、千亿到万亿系列参数规格的模型。
  2. 多模态能力:支持文字、视频、图片、卫星遥感、红外等多种模态数据的训练与理解。
  3. *思维能力:结合思维链和策略搜索技术,增*模型在数学、物理等理科领域的推理能力。

二、多模态生成:解决物理世界难题

上一节我们介绍了盘古大模型5.0的概览,本节中我们来看看其多模态生成能力如何解决物理世界的具体难题。

1. 自动驾驶场景生成

在自动驾驶模型训练中,需要大量符合真实物理规律的场景数据。传统生成内容可能违反物理规律(如车辆驶入人行道),无法用于训练。

盘古大模型通过可控时空生成技术,生成符合物理规律的连贯多视角视频。例如,它能生成一辆汽车从正前方、左前方、左后方、后方等6个摄像头视角的连贯行驶视频,且车辆状态、行驶轨迹、速度方向均符合真实驾驶规律。

核心公式/概念

可控生成 = 基础生成模型 + 物理规律约束(轨迹、速度、状态一致性)

这使得生成的视频可用于自动驾驶模型的训练,大幅降低真实数据采集成本。

2. 工业设计与建筑设计

在工业领域,设计周期长是普遍难题。例如,汽车设计从图纸到3D模型再到油泥模型,通常需要1-2年。

盘古大模型能够通过自然语言描述或草图,直接生成符合要求的3D模型,并输出为工业设计软件(如CAD)所需格式,实现“所想即所见,所见即所得”。

在建筑领域,以著名的圣家族大教堂为例,传统设计耗时极长。盘古大模型与华南理工大学合作,能够将建筑草图直接转化为3D模型,极大提升设计效率,让设计师的灵感快速实现。


三、深入核心行业:视觉与预测求解的应用

多模态能力不仅限于生成,更在于对复杂场景的理解与优化。以下是其在核心行业中的应用。

1. 高铁安全检测

中国高铁的安全依赖于夜间检修。传统人工检测耗时耗力(每辆车约40分钟),且环境艰苦。

通过盘古大模型的多模态能力,可以训练出“分割一切、检测一切”的故障识别模型。该模型能分析高铁底部图像,自动识别故障点。在实际测试中,模型检测故障的准确率已达到90%,未来提升至95%或99%后,将比人工检测更安全、高效。

2. 钢铁制造工艺优化

钢铁制造流程复杂,工艺参数调优困难。例如,在热轧环节,需在几分钟内将260毫米厚的钢坯压至1点几毫米,且厚度误差需控制在0.01-0.05毫米。

盘古大模型能够学习海量的工艺参数表格、图像等多模态数据,寻找生产过程中的最优解。目前,该技术已应用于轧钢工艺优化,未来有望进一步用于高炉炼铁等“黑箱”过程的优化,推动制造行业能力升级。

3. 气象预测

传统气象预报依赖数千行数学方程计算。盘古气象大模型改变了这一范式。

去年,盘古大模型已实现全球台风预报。今年,通过与深圳、香港等地气象局合作,融入本地区域气象数据,能够实现1公里、3公里、5公里精度的天气预报,让“天有可测风云”。


四、技术架构与创新:如何炼成盘古大模型

了解了应用场景后,我们来看看支撑这些能力的底层技术创新。盘古大模型采用三层解耦架构。

1. 三层架构

  • L0:基础大模型:华为聚焦于打造包括自然语言、计算机视觉、预测与科学计算在内的多模态基础大模型。
  • L1:行业大模型:基于基础大模型,与客户和伙伴合作,注入行业知识,打造金融、工业、医疗等行业大模型。
  • L2:场景模型:客户可直接使用或基于行业大模型微调,得到最终部署的场景化模型。

2. 关键技术创新

以下是盘古大模型5.0背后的部分核心技术:

  • 数据工程与合成数据:约30%的训练数据来自模型合成或AI改写,用于增*模型能力(如长文本理解)。采用课程学习策略,让模型像孩子一样循序渐进地学习不同难度的数据。
  • 模型架构创新(盘古π架构)
    • 改进自注意力机制,缓解深层网络中的特征坍塌问题。
    • 增*FFN层,采用极数激活函数组合提升非线性能力,在昇腾芯片上推理速度提升约25%。
  • 高效大集群训练:通过多维度并行计算、通信流水线等技术,优化万卡集群的训练效率,保持高算力利用率。
  • 统一视觉编码器:训练一个统一的编码器,使其能同时理解自然图像、文档、图表等多种视觉信息,并支持动态分辨率输入。
  • *化复杂推理(STaR技术):通过多步生成、策略搜索、过程监督等技术,让模型进行“慢思考”,在多步推理任务(如数学、几何)上获得显著提升,等效于使用更大参数模型的能力。

核心公式/概念

STaR = 思维链 (Chain-of-Thought) + 策略搜索 (Strategy Search) + 过程奖励模型 (Process Reward Model)


五、行业实践案例精选

案例一:医疗大模型(润达医疗)

目标:解决优质医疗资源不足与分布不均的问题。
解决方案

  1. “良医”智能体:辅助医生进行病情判断、病历撰写、科研与患者全周期管理。在临床测评中,其综合得分已超过人类医生平均水平,实现医疗同质化。
  2. “小慧”健康智能体:为个人提供健康档案管理、千人千面的健康咨询与计划。通过拍照上传化验单等,自动生成结构化健康档案。
  3. 数据要素化:利用大模型对海量非结构化医疗数据进行治理(结构化、标准化),使其成为可在合规前提下流通、配置的数据要素,赋能药企研发、保险精算等。

案例二:知识服务大模型(中国知网)

目标:将专业知识与大模型结合,提供可信、专业、可回溯的知识服务。
解决方案:打造“华智大模型”(中华知识大模型)。

  • 三次知识增*:预训练加入知网高质量数据;应用时结合向量数据库;关键领域(如医疗)引入专家知识。
  • 应用场景
    • AI科研助手:对话式文献检索与研读。
    • 长文本生成:快速生成调研报告、综述。
    • 专利分析:自动抽取技术要点、生成技术交底书。
    • AIGC检测:识别AI生成内容。
    • 专科专病模型:如与北京儿童医院合作的模型,结合大模型与专家知识图谱,辅助诊疗与医生培训。

案例三:钢铁行业大模型(华为矿山军团)

核心理念:人工智能应像Excel一样,成为深入工作流的工具。
落地关键

  1. 解决五大问题:针对算法精度低、通用性差、负样本无穷尽、数据安全、人才短缺等行业痛点。
  2. 部署架构:采用“集团私有云训练开发 + 边缘侧推理 + 云边协同”的模式,确保数据不出园区,安全可控。
  3. 核心应用
    • 视觉质检:皮带机撕裂、钢板表面缺陷检测(如汽车板),替代人工巡检,提升质量与效率。
    • 预测求解:优化热轧工艺参数,提高成材率,降低能耗。

六、开发者生态:华为开发者大赛

为推动AI应用创新,华为云每年举办华为开发者大赛。

  • 2024大赛亮点
    • 双赛道:“应用创新”赛道聚焦现代化应用开发;“算法”赛道与中国气象局合作,聚焦防灾减灾。
    • 丰厚资源:提供昇腾、鲲鹏等算力资源,ModelArts等开发平台,以及总额200万的奖金池。
    • 创业扶持:引入VC投资对接,优秀项目可获得最高100万云资源扶持。
  • 参与价值:获得技术赋能、奖金激励、品牌曝光及投融资机会。

总结

本节课中,我们一起学习了华为云盘古大模型5.0如何通过其全栈能力、多模态生成与理解、*大的行业模型以及持续的技术创新,深入千行万业“解难题、做难事”。从自动驾驶的数字孪生,到工业制造的工艺优化,再到医疗普惠的知识赋能,盘古大模型正与合作伙伴共同构建AI时代的行业智能底座。华为云也通过开发者大赛等生态活动,持续赋能广大开发者,共同加速各行各业的智能化进程。

38:人工智能新进展与社会科学的未来论坛(P38)🎓

概述

在本节课中,我们将学习2024年世界人工智能大会“人工智能新进展与社会科学的未来”论坛的核心内容。课程将涵盖人工智能技术发展、其对社会科学的深远影响、相关的法律与伦理框架,以及全球治理与合作等关键议题。我们将以简洁直白的方式,整理并翻译论坛主旨报告与圆桌讨论的精华,帮助初学者理解这一交叉领域的前沿动态。


论坛开幕与致辞 🌟

尊敬的各位嘉宾、各位专家学者、女士们、先生们、朋友们,下午好。欢迎大家来到本次论坛。

当今世界,新一轮科技革命和产业变革深入发展,技术创新进入了前所未有的密集活跃区。人工智能是新一轮科技革命和产业变革的重要驱动力量,将对全球经济社会发展和人类文明进步产生深远影响。中国愿同世界各国一道,把握数字化、网络化、智能化的发展机遇,深化人工智能发展和治理国际合作。

2024年世界人工智能大会以“共商促共享,以善治促善智”为主题,突出反映了对人工智能发展中社会规范、科技伦理议题的高度关注。本次论坛旨在探索人工智能与社会科学的双向赋能路径,推进两者的融合发展,为人工智能的健康良性发展提供有力的社科支撑。

本次论坛由上海市社会科学界联合会主办,多家高校及研究机构承办,并得到了相关企业的特别支持。


主旨报告一:促进人工智能发展创新的法治框架 ⚖️

上一节我们介绍了论坛的背景与目标,本节中我们来看看法律框架在人工智能发展中的关键作用。

报告人首先阐述了构建人工智能法治框架的七个必要性理由:

  1. 人工智能是解放人、塑造人,使人真正成其为人的最前沿、最重要的功绩之一。
  2. 人工智能是当今世界竞争最为激烈的领域之一。
  3. 人工智能在带给人类福祉的同时,也带来了诸多风险。
  4. 人工智能在带来确定性好处的同时间,也带来了诸多不确定性。
  5. 法治是最稳定、最可预期、最具有效力的治理工具。
  6. 速度最快的机器或动力装置,无一不配有良好的安全阀和制动阀。
  7. 当今全球的科技竞争,不仅是新型智能基础设施的角逐,更是数字文明和创新制度生态的比拼。

接着,报告人从三个方面提出了构建法治框架的思路:

1. 治理理念:六个统一

  • 坚持以人为本与尊重客观规律相统一。
  • 做到防风险与谋发展、保创新相统一。
  • 做到防止垄断和数字鸿沟与促进公平竞争相统一。
  • 维护个人权利与促进数据流通和应用相统一。
  • 确保国家安全与促进国际交流合作相统一。
  • 维护数字产权与谋求社会共生、互信、普惠相统一。

2. 治理内容:四个“既要又要”

  • 既要构建完备的人工智能法律规范体系,又要完善法治实施体系。
  • 既要规范设计者、制造者,又要规范平台建造者、传播者和使用者。
  • 既要对数据进行规制,又要对算法和算力进行规制。
  • 既要为所有相关主体配置权利,也要为其设定义务和明确责任。

3. 治理策略:十二个结合
以下是治理策略中需要关注的若干结合点:

  • 立规与立德相结合。
  • 赋权与课责相结合。
  • 设置底线与包容审慎监管相结合。
  • 统制与分类相结合。
  • 他治与自治相结合。
  • 政府治理与社会组织治理相结合。
  • 硬治理与软治理相结合。
  • 规制治理与技术治理相结合。
  • 事后救济与事前预防相结合。
  • 敏捷治理与前周期治理相结合。
  • 系统治理与重点治理相结合。
  • “批发”与“零售”(即系统性立法与个案司法积累)相结合。

总之,人工智能治理是一个系统工程和长期过程,需要逐步总结经验,形成体系化的法律治理体系。


主旨报告二:科技创新与科技伦理 🔬

上一节我们探讨了法律框架,本节我们将关注科技创新背后的伦理维度。

报告人基于自身四十年的科技政策研究经历,分享了四点认识:

1. 科技发展的规律性
从工业革命到信息技术革命,再到即将到来的人工智能革命,技术发展是人的功能延伸:工业革命延伸了人的肢体,信息技术革命延伸了人的神经系统,而人工智能革命将延伸人的大脑(内脑技术)。

2. 科技的进步性取决于科技伦理
科技本身不一定是进步的,也可能是反动的。其进步性取决于是否遵循良好的科技伦理。例如,信息技术革命催生了严重的电信诈骗问题;人工智能在围棋领域击败人类顶尖选手,可能消解人类文化活动的乐趣;无人机在农业中的应用造福社会,但在军事冲突中的应用则带来破坏。因此,必须为人工智能设定伦理边界和负面清单。

3. 从科技革命到产业革命具有选择性
一次科技革命具有选择性,并非所有发明都能转化为产业革命。例如,历史上晶体管战胜了激光,数字技术战胜了模拟技术。当前对元宇宙的过度热衷可能是一种误判。新科技革命必然集中在一个关键领域突破,并形成产业群和供应链。

4. 中国如何在人工智能新科技革命中走在前列
报告人提出了一个金字塔框架来认识人工智能:

  • 顶层(原创与伦理): 狠抓原创技术(如芯片、操作系统)和科技伦理建设。
  • 中层(新基础设施): 建设数字时代的新基础设施,如区块链、量子通信、5G/6G、算力算法、云计算与大数据。
  • 底层(应用场景): 大力发展人工智能应用场景产业。

此外,需要清晰认识新质生产力的本质是人工智能赋能各种业态。在原创上要紧追国际先进水平。对于上海而言,应集中优势寻求突破,例如利用其在临床医疗和数据方面的优势,重点突破生物医药领域的人工智能应用。


主旨报告三:人类世界中的人工智能 🤖

上一节我们讨论了科技伦理,本节我们从计算机科学家的视角审视人工智能在人类世界中的融入。

报告人指出,人工智能革命正以史无前例的速度到来,其普及速度远超互联网和工业革命。以ChatGPT为例,其用户增长和公司收入增长速度创造了历史记录。

人工智能早已潜移默化地融入生活:

  • 导航系统: 智能手机或车载导航中寻找最短路径的算法(A*搜索)源于20世纪70年代的机器人研究。
  • 流媒体推荐: 如Netflix,其内容排列、推荐甚至展示图片都由人工智能决定,超过80%的观看内容来自AI推荐,这意味着我们的“世界观”正被AI中介化。

然而,当前的人工智能(如大语言模型)仍有明显缺陷,它们基于概率预测而非真正理解,有时会犯低级错误。

关于人工智能对就业的影响,报告人认为一些预测(如英国央行行长预测50%的英国工作面临风险)过于悲观。这些分析忽略了新岗位的创造、人口结构变化和工作时长缩短等因素。自动化的影响因工作而异:

  • 可能被自动化的工作: 出租车司机、卡车司机(因成本驱动)。
  • 不太可能被自动化的工作: 自行车修理工(经济上不合理,且其社交功能无法替代)、时装模特(已被生成式AI部分替代)、飞行员(技术上可行,但心理上人类仍需“在环”)。

人类在人工智能时代的机遇三角
报告人提出了一个“机遇三角”模型,指出人类应专注于三个机器不擅长的角落:

  1. 发明未来: 从事创造性和研发工作。
  2. 社交与情感智能: 从事需要领导力、同理心、人际交流的职业,如CEO、销售、医生、政治家。
  3. 创造力与艺术: 从事与人类独特体验(如爱、失去、死亡)深刻共鸣的艺术创作,即使机器能创作,其作品也缺乏这种人类情感的联结。

主旨报告四:人工智能与未来社会 🚀

上一节我们看到了人工智能与人类的互补性,本节我们将深入技术路径,探讨人工智能的真正潜力与局限。

报告人从技术史角度分析,指出当前主流的人工智能研究有两条脉络:一是维纳的控制论(*调反馈与调节),二是图灵、冯·诺依曼的符号计算与架构。当前火热的大语言模型(如基于Transformer架构的GPT)属于“知识智能”,它通过阅读人类总结的文本知识进行学习,获得了语言知识、百科知识和部分常识。

然而,这种路径存在根本局限:

  • 缺乏验证机制: 人脑采用“预测-验证”机制,而Transformer只有预测,不知道自己不知道。
  • 无法产生意识与情感: 其结构与人脑中产生意识的神经结构不同。
  • 只能学习显性知识: 无法学习人类大脑中未被文字化的“隐知识”和“活知识”。
  • 能耗极高: 超大规模数据中心的建设面临电力瓶颈。

通往通用人工智能(AGI)可能需要其他路径,例如:

  • 构建世界模型: 在四维时空场中通过*化学习获得常识和经验。
  • 显性逻辑推导: 结合人类的第一性原理和哲学思维。
  • 运用数学进行高维验证: 利用数学工具进行后验概率计算。

人工智能对商业生态系统的影响
互联网和移动互联网时代催生了“交易平台”巨头(如电商、社交平台),它们通过网络效应实现赢者通吃。AIoT时代,交互方式将变为以语言为核心。这将催生代表消费者利益的AI代理,改变消费者与厂商的关系,传统交易平台可能被重塑。

人工智能对社会与全球化的影响
技术替代职业的速度可能快于人类职业转换和退休的节奏,导致社会动荡,需要政策干预。对于美国,AI和机器人可能使其重振制造业。中国的优势在于技术实现、应用开发和设备制造,而美国*于科学探索与原始创新。

全球化3.0可能不再是单一的全球产业链分工,而是趋向于区域性、内聚性的技术-生产-消费循环,例如中国“胖东来”式的、注重员工福祉与社区价值的模式可能提供另一种范式。


主旨报告五:人工智能的全球治理与合作 🌍

上一节我们展望了人工智能对社会结构的可能重塑,本节我们聚焦于如何在全球层面治理这一*大技术。

人工智能的迅猛发展带来了技术系统、伦理安全、社会应用和国家治理四个层面的风险,使得全球治理变得至关重要。过去一年,从联合国专家组到英美人工智能安全峰会,再到欧盟人工智能法案,全球各方已积极行动起来。

然而,人工智能全球治理面临诸多挑战:

1. 地缘政治
中美科技合作空间因所谓的“小院高墙”策略而被极度压缩,从基础研究、商用技术到前沿技术,合作几乎停滞。缺乏基本信任和安全感,严重阻碍了在人工智能安全等关键技术领域的实质性对话与合作。

2. 技术路径依赖
对“规模定律”的盲目信仰可能是片面的,需要探索多元化的技术发展路径。

3. 治理步调失调
技术发展快,而法律法规和制度变革慢,存在“步调不一致”问题。

4. 机制复合体困境
多个国际机制、组织、标准同时涉及人工智能治理,彼此缺乏协调,导致规则碎片化,令企业和从业者无所适从。

5. 监督执行困难
与核技术不同,人工智能研发隐蔽性*,难以像监控核设施那样进行有效监督。

为应对挑战,报告人提出以下建议:

  • 分层分类治理: 对治理问题进行分类,分工协作,自下而上推进。
  • 推动全球公共产品: 将人工智能治理与安全作为全球公共产品,而非小圈子俱乐部产品。
  • 促进中美有限合作: 在人工智能安全等共同关切领域重启对话与合作。
  • 拓展多层次交流: 加*双边、多边、二轨等多渠道的学术与政策对话。
  • 开展大科学研究: 各国科学家合作,共同研究制定应对人工智能失控等极端情况的应急预案。

社会科学的两大使命
对于社会科学而言,在人工智能时代肩负两大使命:

  1. 为人工智能发展的公共政策: 研究如何推动AI发展、防控其风险。
  2. 用于公共政策的人工智能: 研究如何利用AI工具改进公共政策的制定、执行与评估。

论坛总结与展望 ✨

在本节课中,我们一起学习了“人工智能新进展与社会科学的未来”论坛的核心内容。我们从开幕致辞中了解了论坛召开的背景与意义,随后深入探讨了五个主旨报告:从构建促进人工智能创新的法治框架,到审视科技伦理对技术方向的根本约束;从计算机科学家眼中人工智能融入人类世界的现实与机遇,到技术专家对人工智能发展路径与未来社会的深刻剖析,最后上升到全球治理与合作面临的挑战与出路。

两场圆桌讨论进一步丰富了这些议题,学者们从政治学、哲学、金融学、公共管理学等多学科视角,探讨了人工智能对社会结构、就业、金融风险、哲学思考以及跨学科研究方法的深刻影响。共识在于,人工智能不仅是工具,更是正在重塑社会的基本力量;社会科学必须深度介入,通过跨学科合作,在伦理、法律、治理等方面引导其健康发展。

本次论坛标志着社会科学界有组织地系统回应人工智能时代挑战的开始。未来,相关研究、对话与国际合作将持续推进,旨在以“善治”促“善智”,让人工智能更好地造福人类社会。


总结:
本节课系统梳理了人工智能与社会科学交叉领域的前沿讨论,涵盖了技术、法律、伦理、经济、全球治理等多个维度。核心在于认识到人工智能发展的复杂性和深远社会影响,并*调必须通过健全的法治、坚实的伦理、有效的全球合作以及社会科学的深度赋能,共同引导其向有利于人类福祉的方向发展。

39:AI for Science 十问论坛精华解读 🧠

概述

在本节课中,我们将一起学习由多位顶尖科学家和行业领袖在“AI for Science 十问论坛”上分享的核心观点。课程将围绕人工智能与自然科学交叉领域的前沿问题展开,涵盖生命科学、物质科学、地球科学及高端制造等多个方向,探讨AI如何重新定义科学研究和实践方法。


第一节:智能的形式及其与科学的关系 🤔

在论坛的开场,主持人欧阳万里提出了第一个核心问题:智能有哪些形式,与科学有何关系?这个问题引导我们宏观地思考智能的本质。

上一节我们介绍了课程概述,本节中我们来看看Michael Levitt教授(诺贝尔奖得主、斯坦福大学教授)对于智能的深入见解。他通过录播视频发表了题为“Biological Intelligence, Human Intelligence and Machine Intelligence: All for Science”的主旨报告。

Michael Levitt教授阐述了三种智能形式:

  • 生命智能:源于自然进化,其核心启示是多样性对于在不可预测的未来中保持稳定和安全至关重要。
  • 人类智能:*调知识与经验的传承。他以自身在剑桥MRC分子生物学实验室的经历为例,说明了优秀的科研环境(如给予年轻科学家独立性、消除官僚主义、提供高*度的同行压力)如何催生卓越成果(该实验室在60年间产生了28位诺贝尔奖得主)。
  • 机器智能:特别是生成式人工智能。其基础思想模仿了生物神经元的工作方式,即对输入信号进行加权求和并通过激活函数产生输出。用简单的数学公式描述为:
    输出 = 激活函数(权重 × 输入 + 偏置)
    当前的大语言模型(如GPT)通过将词汇转化为高维向量,并利用Transformer架构学习上下文关系,从而预测序列中的下一个词,展现出令人惊讶的能力。

Michael Levitt教授总结道,这三种智能相互影响,共同构成了一个“智能三位一体”。他预测未来将是“男人、女人和计算机”共同创造的超复杂时代。

过渡:从Michael Levitt教授的宏观视角,我们了解到智能的多元性与交融性。接下来,让我们将目光聚焦到一个具体而火热的领域——生物医药,看看AI在这里的着力点究竟在哪里。


第二节:AI在生物医药领域的着力点 🧬

复旦大学马剑鹏教授针对“AI在生物医药领域的着力点”这一问题,给出了基于蛋白质结构研究的答案。

马教授指出,AI已渗透药物研发全链条。他重点阐述了三个与结构生物学相关的“皇冠”方向:

以下是蛋白质结构研究中的三个关键AI应用方向:

  1. 静态蛋白质结构的计算预测:以AlphaFold系列为代表的方法取得了巨大进步,但仍有局限。例如,它对点突变不敏感,而点突变正是许多遗传病的根源。此外,其侧链预测精度仍有约6%的误差,这对于需要原子级精度的药物设计至关重要。马教授团队开发的OPUS系列国产软件在侧链建模精度上表现优异。
  2. 静态蛋白质结构的实验测定:AI可以大幅提升冷冻电镜等实验数据的处理质量。例如,其团队开发的AI算法能够从模糊的实验数据中更准确地分辨出蛋白质的不同构象,从而得到更饱满、更精确的密度图,为后续分析奠定更好基础。
  3. 动态蛋白质结构的模拟:蛋白质是动态的,其柔性对功能至关重要。马教授团队开发了AI框架,能够从实验数据中直接提取动态信息,并结合分子动力学模拟,将不同构象在时间上关联起来,这是理解蛋白质功能的关键。

马教授*调,在算力可能受限制的情况下,“算力不足,算法来补” 的理念至关重要。通过优秀的算法,即使在通用计算平台上也能完成高精度的分子动力学模拟。

过渡:马教授从蛋白质的微观世界揭示了AI的威力。那么,AI能否进一步推动分子设计与制造的工业化进程呢?这引出了我们的下一个问题。


第三节:AI驱动的分子设计与制造 ⚗️

中国科学院鄂维南院士就“人工智能如何推动分子设计和制造的工业化”分享了独到见解。

鄂院士指出,分子设计面临需求碎片化、环节多、场景多、数据稀缺等挑战。他介绍了一个由年轻团队主导的工作——Uni-Mol,这是一个基于三维原子坐标的通用分子预训练模型。

Uni-Mol的核心特点与优势包括:

  • 通用三维表达:直接使用原子的三维坐标和类型作为输入,具有普适性,能覆盖小分子、高分子、混合物等不同场景。
  • 优异性能:在各种分子性质预测、药物靶点对接等任务上表现出色。例如,其衍生模型Uni-Mol Docking在权威评测中名列前茅。
  • 实际应用:该模型已成功应用于多个实际材料的设计中:
    • OLED发光材料:高效筛选出专利范围外且性能优异的候选分子,用于第二代(铱配合物)和第三代(TADF)发光材料设计。
    • 金属氧化物材料:用于设计具有高效气体分离性能的多孔材料,助力碳中和。
    • 锂电池电解液:对电解液分子的多种关键性质进行预测,辅助配方设计。

鄂院士展望,未来需要推动数据共享与开放,并与实验结合形成自动化闭环,最终目标是构建泛化能力更*、性能更好的分子基座模型。

过渡:从鄂院士的报告中,我们看到AI在分子设计方面已展现出*大能力。一个更宏大的问题随之而来:AI能否一劳永逸,让机器自己进行科研?


第四节:理实交融的机器化学家探索 🤖

中国科学技术大学江俊教授针对“AGI是否具备科研能力”这一问题,给出了基于“机器化学家”平台的答案。

江教授指出,化学研究中理论与实验长期脱节。理论计算产生海量低维数据,而实验数据珍贵且高维复杂,二者难以对齐。他团队提出的解决方案是 “理实交融” 三步法:

  1. 用理论计算产生大量数据,预训练一个模型。
  2. 用少量精准的实验数据对该模型进行校准(迁移学习)。
  3. 用校准后的“理实交融模型”指导进一步实验。

基于这一方法论,他们构建了“机器化学家”平台,包含三大模块:

  • 能读:机器阅读系统,快速阅读文献并数字化理解。
  • 能算:计算大脑,产生理论大数据。
  • 勤做:机器人实验系统,执行精准、可重复的化学实验。

一个典型案例是高性能催化剂的设计:机器先阅读1.6万篇论文提出候选元素组合(假设),然后进行2.5万次理论计算和200次机器人实验(求证),最终通过理实交融模型从50万种可能组合中快速找到最优解,效率提升上千倍。

江教授总结,AI目前是科学家*大的合作者,通过处理庞大数据、提供智能分析和模拟,加速科学发现。完全依赖AGI进行科研仍需努力,但“人机共融”的研究新模式正在涌现。

过渡:机器化学家展现了AI在实验室中的潜力。那么,在更宏大的地球空间尺度上,AI又能发挥什么作用呢?


第五节:书生·风乌气象海洋预报大模型体系 🌪️

上海人工智能实验室的白磊研究员介绍了AI在地球科学领域的应用——“风乌”气象海洋预报大模型体系

传统数值气象预报依赖物理模型,存在专家依赖性*、计算耗能大、难以利用海量卫星数据等问题。AI方法为解决这些挑战提供了新路径。

“风乌”系列模型的核心进展与思想包括:

  • 风乌全球中期预报:首次将全球中期气象预报的有效性提升到10.75天,且推理速度极快。
  • 风乌GHR(全球高清模型):突破性实现全球9公里分辨率预报。其关键思想是 “解耦与迁移学习”:将大气运动规律(低分辨率数据中学习)与高分辨率细节(高分辨率数据中学习)解耦,通过预训练-微调范式,用较少的高分辨率数据即可训练出高性能模型,实现了 “数据高效”“计算高效”
  • 风乌Ace(端到端模型):首个端到端的全球气象预报模型,将数据同化与预报两个步骤全部用AI实现,有望实现千倍提速。
  • 风乌Climate:首个全球海洋气候预报模型,可进行稳定的8年气候模拟。

白磊指出,未来方向包括极端天气预测、真正的端到端(融合多源原始观测数据)天气研究,以及从年际到百年尺度的气候预估。

过渡:从气象预报延伸到更广阔的地球空间,如何系统性地利用AI来理解和治理我们的星球?


第六节:地球空间智能生态系统创新 🌍

联合国全球地理信息知识与创新中心主任*鹏德主任从全球视角阐述了地球空间智能生态系统的构建。

*主任指出,位置感知(空间)和时间感知是人类和机器智能的基础。让机器具备时空思维能力,需要建立 “时空大模型” ,这是一个全新的课题。

他*调了地球空间数据的特点:多尺度、不完备、多源、多模态。AI在其中的应用无处不在,从深空探测到自动驾驶,都需要空间认知、运动认知和自然认知智能。

构建地球空间智能生态系统需要:

  • 知识训练与知识库:让机器理解地图、地质图等专业知识,形成知识库。
  • 核心能力:知识学习、管理、融合与服务。
  • 支撑体系:机构法规、数据平台、共享交易、合作伙伴、创新能力等。

*主任总结,世界不仅需要数据治理,更需要人工智能的生态体系。未来需要建立共享的地球空间智能基础设施,以支撑全球可持续发展。

过渡:从宏观的地球系统回到具体的国家重大工程,AI在高端制造中扮演着什么角色?


第七节:设计师与智能体的共生进化 ✈️

中国工程院院士、C919大型客机总设计师吴光辉院士分享了AI在高端制造,特别是飞机设计中的应用。

吴院士指出,大飞机的发展趋势是更安全、经济、舒适、环保、快捷。AI为智能航空带来新机遇。中国商飞与上海人工智能实验室合作,首创了AI赋能翼型设计智能体(书生·翼飞系统)。

该智能体实现了:

  • 专家经验集成:学习百年翼型设计经验。
  • 多元交互设计:支持语音、文字、拖拽等多种方式生成和编辑翼型。
  • 高效智能生成:将传统需数周的设计过程缩短至秒级,并能批量生成候选方案。
  • 主动优化迭代:结合高精度流体仿真(东方御风)与AI模型,对气动性能进行主动优化。

对于“AI是否会取代设计师”的问题,吴院士提出了 “共生进化三部曲”

  1. 机器向人学习:当前阶段,机器学习人类积累的数据与知识。
  2. 人机团队合作:设计师与智能体协同工作,互相促进。
  3. 设计师监督下的智能体:智能体具备一定自主创新能力,但在设计师监督下工作。

吴院士认为,机器在重复性工作上优于人,但在创新性工作上人仍优于机器。未来将是设计师与智能体共生进化的时代。


第八节:圆桌讨论——新质生产力与科学基础设施 🏗️

在圆桌讨论环节,多位专家就“如何将AI进步转化为新质生产力”和“AI对科学基础设施的新要求”进行了深入探讨。

关于新质生产力

  • 张娅教授(上海交大):AI本身已是科研的新质生产力。未来应打造工具和平台,让科学家能直接使用,赋能所有科学领域。
  • 夏广新院长(上海医药):AI能显著提高药物研发效率,有望缩短长达数十年的研发周期,解决未满足的临床需求。
  • 杨帆老师(崖州湾实验室):AI是实现农业新质生产力的最优方式。通过智能决策育种体系,实现精准创制,保障粮食安全。
  • 白磊研究员:AI通过提供更精确的预测(如气象)和优化调度算法,能让现有生产力(如能源、交通)发挥更大效能,实现高质量发展。

关于科学基础设施

  • *林总裁(Elsevier):AI改变了科学知识的生产(从假设驱动到数据驱动)、传播(从人到人,到机器到机器)和应用方式。新一代基础设施需支持知识的快速产生与验证、数据的聚合与连接、安全共享以及场景化应用。
  • 数据挑战:多位专家指出,高质量、可共享的数据是核心挑战。存在阳性发表偏见、数据质量参差不齐、跨机构获取难等问题。需利用多模态数据互补提升质量,并建立数据标准与共享机制。
  • 算力与模型:需关注超大规模算力的高效协同调度。模型发展应注重多元数据融合,并针对重大战略需求(如育种)构建统一、普适的大模型,避免重复投入。

关于AI催生的全新科学

  • 白磊:AI使以前不可能的研究成为可能(如百年气候仿真、历史数据重建),可能催生新的科学发现。
  • 夏广新:期待AI能加速像“沙利度胺”这类药物作用机制的发现,从而开辟全新的治疗领域。
  • *林:AI扩展了人类感知世界的维度,可能打破传统学科界限,催生新的研究范式和交叉领域。
  • 张娅:涌现可能以“人机共融”的形式出现,如脑机接口等新学科,是人的智慧与AI能力结合的产物。
  • 杨帆:肯定AI已催生“智慧育种”和“智慧农业”全新学科。它们突破了传统领域,符合尺度规律,并将隐性经验转化为可优化的参数问题。

总结

本节课中,我们一起学习了“AI for Science 十问论坛”的核心内容。我们从智能的本质出发,穿越了蛋白质结构、分子设计、机器化学、气象海洋、地球空间直至大飞机制造的广阔图景。我们看到,AI不仅是加速科学发现的工具,更在催生新的研究范式、新的学科乃至新质生产力。科学家与AI的“共生进化”,正引领我们走向一个更加智能、高效和创新的科学未来。

40:AI智能体技术前沿与应用实践 🚀

概述

在本节课中,我们将学习人工智能领域的最新进展,特别是大模型与智能体技术如何重新定义世界。课程内容源自“Om AI 智能体重新定义世界”自主智能+创新应用论坛,我们将深入探讨多模态大模型、智能体框架、行业应用案例以及未来的发展趋势。


第一节:人工智能发展的宏观背景与战略意义 🌍

推动全球经济发展。在刚刚闭幕的全国科技大会上,***发出了2035年前要把我国建设成为科技*国的伟大号召。总理在2024年的工作报告中指出,要抓住人工智能这个“牛鼻子”,加速培育新质生产力的战略部署。

大模型技术近年来得到了飞速的发展,特别是多模态大模型技术突破,已经成为全球科技领域的一个重点和热点。

全球的科研机构、高校纷纷推出了各种语言、图像、视频、音频处理大模型,并以惊人的速度在迭代。这些技术进步,不仅为人工智能的广泛应用提供了*有力的支持,也为各行各业智能化升级注入了新的动力。

然而,大模型并不是人工智能的全部,也不能解决所有场景的应用问题。例如,大模型的场景适应性亟待优化,实用化性能需要继续提高,部署的可行性也亟待解决。在许多场合下,自主智能技术是应对这些挑战的一个重要手段。

另外,科研机构在实践中做了许多有益的尝试和探索,包括我自己做的这个领域,其实也还不完全是用这个大模型来做。

联会科技凭借着在多模态大模型和向量数据库等方面的积累,推出了系列智能体技术,在电力、媒体等多个行业中实现了标杆化的应用。人工智能源于人类智能,并将与人类智慧共生共存。

在未来,生成式AI深度AI的深度融合,将在提升生产效率、优化运营管理、增*服务体验方面带来革命性的变化。同时也提醒我们,人工智能的广泛应用不仅是技术的进步,更是人类社会的进步。

唯有加速推动人工智能技术和各行各业的深度融合,探索更多的创新应用模式和解决方案,才能更好地服务于社会经济的发展,推动整个社会向前进。千帆进发,勇者胜,希望各位同仁能够利用这次论坛提供的机会,聚焦自主智能与创新应用,汇集产业观点,分享产业硕果,剖析技术趋势,洞察产业未来,为推动AI技术的发展和应用贡献智慧和力量。


第二节:资本与技术的融合:产业发展的引擎 💰

如果说人工智能是行业发展的助推器,那么资本必定是行业发展的引擎,为创新提供了源源不断的动力。

中国移动产业链发展基金,是中国移动贯彻落实中央企业链长单位工作要求,以资本为载体,带动产业链发展的重要举措。在对人工智能行业进行了全面严格的考察调研后,2023年从国内百余家大模型企业中选择了联会科技进行重点战略投资,实现了资本与技术的**联合。

中国移动产业链发展基金作为中国移动响应国家战略、发挥中央企业引领作用的重要举措,承载着推动科技创新与产业升级的使命。我们通过资本的力量,深化央地合作、激发产业链的协同效应,致力于构建一个具有全球竞争力的现代产业体系,为国家的持续繁荣和科技领先贡献力量。

基金紧密围绕国资委提出的9个战略新兴产业和6个未来产业,在数字经济和移动信息产业链领域进行前瞻性规划和投资布局。我们致力于服务京津冀与长三角区域的数字经济发展,通过投资和培育一大批有潜力的中小企业,牵引产业链的不断补链、*链,增*产业链供应链的韧性和竞争力。

特别值得一提的是,联会科技作为我们在人工智能领域长期重点关注并积极投资的企业,不仅在国际舞台上展示了中国AI技术的卓越实力,更以其前沿能力,成为国内人工智能技术的佼佼者。联会科技的团队在国内外等多个顶级会议和比赛中屡获殊荣,其商业化进程和技术能力也已经在运营商、电力、媒体等行业中落地并尤为突出,为推动人工智能赋能行业建设、促进数字经济的高质量发展做出了卓越贡献。

在推动科技协同创新与产业发展的征途上,中国移动产业链发展基金以资本为纽带,加速聚合产业链、筑*创新链、带动供应链、构筑生态链。我们致力于为各类创新企业提供*有力的支持和广阔的发展平台,坚信资本与技术的深度融合将激发更多创新活力,推动产业链的升级和行业的数字化转型。


第三节:标准化建设:技术发展的基石 📐

当下的标准化建设是加速通用技术产品与服务覆盖的重要保障,对于行业的支撑引领作用尤为重要。联会科技也正在深度参与大模型、智能体与向量数据库等国家标准建设工作。

标准是我们国家的一项基础性技术制度。标准化建设不仅是技术发展和应用的基石,也是推动产业健康发展的一个关键。

中国电子技术标准化研究院作为工信部的直属事业单位,是国家电子信息技术领域标准化的领军单位。目前我们承担了国家层面的人工智能、大数据、脑机交互、元宇宙以及相关前沿重点信息技术领域的国家标准以及国际标准的制定工作。

目前在人工智能领域,我们承担了全国信标委人工智能分委会的秘书处单位,同时也是国家人工智能标准化总体组的秘书处单位。在这个过程当中,我们目前正在围绕人工智能产业的发展,围绕着像人工智能智能体、大模型、科学计算、具身智能等新一代人工智能国家标准的制定和检验检测工具,来开展国家层面的标准制定。同时,我们也在联合业内的相关单位,围绕国内产业发展的实际,正在开展国际标准的研制。

联会科技作为我们业内最早在大模型和智能体领域展露领先优势的企业,不仅拥有全面的技术积累,而且凭借卓越的产品和服务,在行业内发挥了重要作用。最重要的是,在去年联会科技参与了大模型以及智能体等相关国家标准的编制,同时牵头了智能体的第一部分国家标准编制。目前这项标准正在推动国家标准立项。他们基于前期的业内技术积累,也为推动行业的发展和标准化进程做出了积极的贡献。

随着大模型、智能体等先进的AI技术与产品的规模化应用,我们将携手业内的政产学研用单位以及相关的成员单位,会围绕着这些前沿的技术领域方向开展相关标准的探索,围绕这些探索开展更加有力的规范和引领AI赋能行业的应用。同时,我们也会推进国家标准、国际标准的制定,同时也会*化技术基础体系的建设。


第四节:学术前沿:具身智能与工具失效问题 🤖

大模型的技术进步与应用突破为全球经济发展带来了全新的活力。人工智能的发展洪流也必将势不可挡。

卡内基梅隆大学拥有全世界最大的计算机学院,更是全球人工智能技术的重要引领者之一。卡内基梅隆大学计算机学院教授、博士生导师作为自然语言处理领域的代表人物,擅长揭示自然语言的潜在结构,对物理世界的语义进行建模,将语言与感知和控制联系起来,是具身智能多模态机器人领域的先导者,在通用人工智能技术领域影响巨大。

本次报告将从使用大语言模型作为规划器的视角来探讨具身AI问题。我们利用大语言模型中蕴含的常识知识,但同时也思考这种范式在哪些地方会开始失效,或者与我们对于这些智能体的实际目标产生错位。

我们都熟悉智能体AI的兴起。这些智能体在网络上为我们做事,或许也在视频游戏中为我们做事,在这个过程中接收不同类型的模态信息。这是一个巨大的领域,非常令人兴奋。

但我要讨论的与此略有不同。我们喜欢用机器人的图片作为例子,但它并不是真正的机器人,也并非真正具身。那么,智能体与具身之间的差距是什么?

有一些显而易见的东西:环境动态性、感知失败、长时程任务、硬件复杂性。当开始谈论机器人时,你可能会立刻想到这些。比如,哦,是的,它们需要摄像头,需要能够在世界中移动。你可能会列出一个非常长的清单来描述这些。

但我认为大多数人会忘记一点,那就是。当你实际与这个未来在你家中为你打扫卫生的机器人互动时,你就站在它旁边。因此,你采取的行动将改变这个系统解读指令的方式。这是一件好事。但我们目前没有与之匹配的基准测试。

我们现在做的是在抽象层面思考指令跟随。例如,Peter Anderson的视觉语言导航数据集,我认为这是该领域的基础。我们扩展了这项工作,这就是Alfred,我们在模拟家庭中进行指令跟随。你可以移动物体,我们甚至尝试将这种指令跟随迁移到物理机器人上,以便你可以在现实世界中采取行动。

这很棒,但这里有点令人不安的是,它们是空的,没有人类。你有这些机器人四处移动,遵循高级指令、低级指令。但它们从何而来?我们真的需要人类,因为语言是社会性的。我们使用语言是因为我们渴望与周围的人交流。

因此,一个自然而然的问题是:物理人类在指令跟随中扮演什么角色? 我们需要思考如何构建这一点,以及这会带来哪些新的挑战。

让我们稍微激发一下这个问题。我可能有一个指令,比如“把杯子放在餐桌上”。对于一个智能体来说,它需要解决一些模糊性。有多个杯子吗?哪个是所指的杯子?我的地图准确吗?这些是我们将反复提及的模糊性的重要组成部分。

但如果我做一个小小的改变,对我来说更自然的说法可能是“给我拿个杯子”。现在,我仍然有那些相同的模糊性来源,但我有了一个新的模糊性:你是静止的还是移动的?如果你在环境中移动,那么在我开始去拿其中一个物体的那一刻,我就看不到你了,我将不得不重新映射或改变一些事情。在这个简单的案例中,我待在同一个房间里,但通常情况并非如此。

我们如何解决这个问题?一种解决方式是,“给我拿个杯子”这种指令根本不会发生。相反,我们使用这种过度指定的语言解决方案。我们生成一个关于我们想要什么的非常大的描述,非常清楚地指定要拿起哪个物体,以及我们想把它放到哪里。例如,如果我知道我正在走向沙发,那么我可能会有这样一个大指令:“把那个咖啡桌左侧的、半满棕色水的脏白色杯子拿到客厅的沙发上”。这个规范足以解决那些模糊性,但它极其不自然。你可以想象,你永远不会想对你的家用机器人说这个,你会把它退回商店。你只想说“给我拿个杯子”,非常简单直接。

因此,我们可以创建这样一个二分法。视觉语言导航可能是一个过度指定、大指令设置的例子。而Alfred则是另一种,属于指定不足,但仍然没有真正的人类来推理。我们试图提出,在这两者之间存在一个中间地带:情境化指令跟随

如果有一个人在场,需要说什么?不需要说什么?我的行动本身暗示了什么?我边说边朝那个方向走,这改变了什么?映射有什么变化?因为突然间,环境中有了动态的东西。人类可能会移动东西。这仅仅是我需要能够解决的众多模糊性来源之一。因此,我现在必须理解我对什么感到困惑,以及该做什么。

让我们用一个简单的设置来讨论这些。我们在Habitat 3.0中做了这个,因为它允许我们拥有实际在环境中移动的模拟人类。

这里有一个指令示例,它们非常简短:“给我拿个杯子。我要去洗澡。” 这是一个你完全可能对某人说的非常自然的事情,你不会觉得有什么。这里有一些维度上的模糊性,正如我们一直在讨论的:杯子在哪里?哪个浴室?

时间上的模糊性:这里的模糊性可以通过跟随这个人来解决,因为他们说他们要去洗澡,或者在这个案例中,他们正走向卧室。我是否应该跟随他们来解决模糊性?我跟他们多远?什么时候这种效率权衡会失效?

以及环境的动态性:如果他们在环境中移动,那么我可能检测不到杯子,这可能是我自己的问题,因为我的感知系统有问题,也可能是因为环境确实发生了变化。正如我所说,人类可能移动了它。然后还有一个问题:如果我打算解决那个问题,那么我必须决定,我应该继续搜索吗?我应该在哪里搜索?这样做与简单地回到我之前的表征之间有什么权衡?

这并非详尽无遗,但我认为它让你感受到了一些挑战所在以及事情是如何变化的。

具体来说,我们将任务分为三种不同类型。我们有一个简单的请求,在开始之前,智能体能够环顾环境并构建其初始地图。

然后当指令到来时,我们有一个“拾取放置”任务,这非常接近人们习惯的指令跟随:找到一个物体,将其移动到一个静态的接收器(在这个案例中,假设人没有移动)。

然后我们有一个像“给我拿个杯子。我洗手时移动了它。”这样的指令。在这个案例中,我们现在有一些关于它曾经在哪里的提示,以及你正在使用的地图可能已经过时,需要用这个新信息更新的情况。

最后,我们有“我要去洗手”的指令。所以现在我们有一个将来时态的情况,不仅仅是地图过时了,而且接收器(也就是“我”)实际上随着时间在变化,我需要关注这一点。特别是后两者,将与当前文献中存在的任务有很大不同。因此,这些将是我们进行基准测试的重要内容。

我们尝试用直接规划器对这种情境推理进行基准测试,以便与文献进行直接比较。基本上就是:我是否在感知?我是否理解指令?我是否在构建地图?然后我们将所有这些传递给GPT-4,询问它应该做什么,比如它应该专注于任务的哪一部分?下一步预测是什么?例如,它是否应该跟随人类?

这让你对结果有个概念。在测试环境中,学习模型在“拾取放置”任务上表现得相当好,但在物体移动过甚至是在未见环境中跟踪人类方面就不那么好了,我们会看到非常相似的趋势。

现在,你可能想知道有很多地方可能出错。这其中有多少是感知错误?有多少实际上是推理能力造成的?所以在这里我们完全解决了这个问题。你现在拥有“先知”一切的能力。公平地说,你确实不应该拥有先知一切的能力,因为你真的应该搜索地图并构建那些更新的表征。但即便如此,你仍然看到从标准的“拾取放置”任务到这些情境任务、再到这些动态环境的性能急剧下降。因此,我认为这对于我们前进非常重要的一部分是,专注于如何确保我们构建的智能体能够真正利用环境是动态的这一事实,并利用这一点来构建更好的用户体验。

最后我想说的是,我们已经到了这个地步,我们说我们不单独行动。但我们处理这个问题,即自始至终我都在谈论你必须学习、必须使用的模块。我们不知道什么时候应该或不应该信任自己。

因此,我想给你一个我们最近刚刚在线发布的一些工作的预告。我认为在我刚才展示的模块中,也在所有类型的系统内的智能体中,我们已经非常习惯于工具使用的概念。这个概念是,语言模型可以决定适当的上下文和工具输入,传递给某个它选择的工具,以获得预测输出。这在检索增*生成中可以看到,在模拟环境中也可以看到。这个想法是,我们在语言模型中有一个高级规划器,然后它将调用一些其他功能,在这个案例中,可能是在机器人上实现的。

但我们可以问一些问题,关于这种范式可能在哪些地方失效。错误的来源是什么?哪些部分会失败?哪些部分可以恢复?我们如何从中恢复?我们没有所有问题的答案。但你可以看到,在模拟环境中,或者更普遍地在具身环境中,这种情况会立即发生。所以,我们在模拟环境中评估了它。

例如,如果我必须清洗并切片苹果,我有一个物体检测器。它是否真的能找出正确的物体?语言模型是否知道如何从这些预测中恢复?然后我有一个动作规划器,它也是一个学习模块。它是否知道是否应该信任这些后续步骤?所以现在你可能会产生错误的叠加。在人类中,我们可以解决这个问题,因为在人类中,我们可以检测到一种元认知式的理解,了解我们的能力以及我们可能在哪些地方看到偏差。

让我们从一个非常简单的情况开始:一个有故障的计算器。我做不了惊人的心算,但我能察觉到是否有点不对劲。那么,一个语言模型能否检测到计算器输出时最后一位数字是否改变、任何数字是否改变、数量级是否出错?例如,我认为如果相差10倍,或者符号翻转,我会知道两个正数相加永远不应该得到负数,当我们知道这些我们认为有些直观的事情时。

这对我们来说非常容易。这只是一个简单的图表,展示了一些使用工具的大型模型,以及当工具正确与错误时,事情是如何偏离的。黑线显示了当完全没有工具时,模型回答数学问题的能力。所以它们知道答案。但是,一旦你引入一个有故障的工具,它们的性能在几种情况下会急剧下降。例如,GPT-3.5的情况,但即使是GPT-4也看到了这种下降。所以存在一个问题,模型知道答案,但它不信任自己,反而依赖工具。现在,使用正确的工具,它们都能做得更好,这是橙线,但这不是重点。

语言模型即使知道答案也会失败。 所以现在我们有了这个问题:如果我要将工具(特别是学习到的工具)放入系统中,我如何处理这类问题?正如我刚才所说,对于具身AI来说,情况只会更糟,只会对我们来说更难。

这里的规划器例子,检测器例子,它们检测到的一些物体可能是正确的,也许置信度不太够。我们如何告诉模型什么时候应该或不应该从这些事情中恢复?

所以,在这里做个总结。我讨论了两篇论文,但我认为它们是一个更大问题的一部分:随着我们进入具身AI,进入这些智能体系统,进入作为规划器的语言模型(它们越来越*大),陷阱在哪里? 哪些地方因为没有人而存在与现实世界的错位?哪些地方我们假设我们将拥有完美的API,但当它们失效时,我们实际上并没有以允许这种恢复的方式设计我们的系统?

因此,这些是我希望留给你们的两个主要问题。我的理解是,Tony接下来将接手,谈论视频空间内的事情。作为一个快速的评论,我认为我没有在这里解决的一个问题是,智能体、具身系统的其他信息来源问题。所以我们在这个领域有一些工作,但这是一个巨大的领域。有给你指令的人类固然很好,但你不应该向人类学习吗?你不应该能够更普遍地从那个信号中提取信息吗?你可以想象,理想的情况是一个从所有YouTube视频中学习的具身智能体。


第五节:多模态大模型的细粒度感知与适配 🎨

非常感谢联会科技的邀请。我的题目叫“细粒度多模态大模型”,一会我会来加以解释。那首先讲一下整体的研究背景。

多模态大模型的定义,今天开那个展会上有很多。那么它实际上指的是什么呢?首先就是提取并融合文本、图像、视频这样的多模态数据表征,然后通过大语言模型来进行推理,经过微调后适配到多种下游任务的基础模型。这是整个多模态大模型的一个定义。

那么这里面呢,就是说它的局限性,我们在当前肯定要想想它有什么样的一些局限性。那么第一个局限性就是这个感知粒度粗。这个指的是什么呢?就是在多模态大模型里面,它的感知能力,它是依赖于大量训练数据。但是大量训练数据的这个细粒度类别标注成本巨大,一会我会给大家解释这个细粒度类别标注的问题。所以就导致这个大模型缺乏细粒度的一个感知能力。这是第一个局限性。

那么第二个呢就是这个任务适配了。那现在企业里面它已经有很多的一些软件。但是我们如果做了一个模型以后,可以支持多个下游任务,但是支持这个多个下游任务的时候,它有个优化适配的问题。这个一会我会来加以解释。

这一个呢就是GPT-4o,是今年5月份OpenAI发布的最新的一个多模态大模型。那我们如果来做一个测试,大家看这样的一张左边这样的一张图片,就是问他这个结果,那么他回答是这个就就是中间这个叶子的这个虫,他回答是这个豆甲名,实际上它的真实结果是甜菜叶螟,这是一种昆虫的一种名字。一旦到细粒度以后,它就会出错。那么右边也是一样的,那个植物问它叫什么,他说是那个山栏,实际上呢它是这个七指木。这是两种植物。

不只是这种,就是大家知道细粒度的一个,先解释一下。就是我们通常说我们识别出粗粒度,比如这是车,这是鸟,对吧?这是飞机。那么细粒度指的是什么意思呢?就是车里面它到底是宝马奔驰还是奥迪,奥迪下面到底是A4还是A6、A8,就是往下的一个细粒度识别。那么这个最新的多模态大模型,它细粒度这个能力是没有的。

那么第二个呢就是这个刚才我讲的这个适配方法。适配方法,从技术上来说是你有多个下游任务,我怎么用一个模型来让几个这种下游任务的性能

41:AI驱动新质生产力落地实践教程 🚀

概述

在本节课中,我们将学习人工智能(AI)如何驱动新质生产力的发展,并探讨其在不同行业中的落地实践。课程内容基于“向新而行 智驱未来——AI驱动新质生产力落地实践探讨”论坛的专家分享,涵盖AI技术、应用场景、挑战与机遇等方面。


一、论坛背景与嘉宾介绍 🎤

本次论坛由东浩兰生集团有限公司主办,旨在探讨人工智能如何赋能千行百业,推动新质生产力发展。论坛汇聚了智能制造、智慧城市、大数据等领域的专家、学者和科技企业代表。

以下是出席论坛的嘉宾:

  • 吴志*:中国工程院院士、德国国家科学与工程院院士、瑞典皇家工程科学院院士、世界规划教育组织主席。
  • 周宁:新华社新媒体中心党委委员、副总编辑。
  • 裘浩明:东浩兰生会展集团副总裁。
  • 安晓鹏:阿里云智能集团副总裁。
  • 殷宇辉:360集团副总裁、数字化集团CEO、人工智能研究院院长。
  • *飞:新华三集团副总裁、人工智能研究院院长。
  • 刘慧福:软通动力信息技术集团股份有限公司执行副总裁兼CTO。
  • 崔静怡:建委软件副总裁、中国区总经理。
  • 陆鑫:蚂蚁集团财富保险事业群智能服务部总经理。
  • 付坤:游族网络首席战略官。

二、新质生产力的核心概念 🏭

新质生产力以创新为主导,具有高科技、高效能、高质量的特征。人工智能作为其重要引擎,正在改变生产方式、生活方式,并引领全新的经济增长周期。

核心公式

新质生产力 = 创新 × 高科技 × 高效能 × 高质量


三、AI大模型与数据要素的关系 📊

AI大模型是数据要素实现价值的最短路径。数据通过大模型被激活,从而在智能硬件、软件系统和各行业场景中创造价值。

核心代码示例

# 数据要素通过大模型激活价值的简化示例
def activate_data_with_ai(data, model):
    processed_data = model.process(data)
    value = model.extract_value(processed_data)
    return value

四、AI大模型的应用场景 🌐

AI大模型的应用场景广泛,主要体现在以下三个方面:

1. 智能硬件驱动

未来一切智能硬件(如手机、汽车、机器人)将被AI大模型驱动。例如,摄像头可以通过AI分析会议参与者的专注度。

2. 软件系统重构

一切软件系统(如办公软件、企业管理软件)将被AI大模型重构。例如,通过自然语言交互替代传统菜单操作。

3. 数据要素激活

一切数据将被AI大模型激活,实现从数据到价值的直接转化。例如,企业通过大模型分析数据,优化生产流程。


五、AI在行业中的落地实践 🏢

以下是AI在不同行业中的具体应用案例:

1. 制造业

  • 案例:阿里云与广东拓斯达合作,通过大模型调试机器人生产线,将调试时间从3000小时压缩到8分钟。
  • 核心价值:提升生产效率,降低人力成本。

2. 金融行业

  • 案例:蚂蚁集团通过大模型提供金融助理服务,帮助用户分析理财和保险问题。
  • 核心价值:提供高质量的金融服务,降低服务门槛。

3. 医疗行业

  • 案例:新华三与医疗机构合作,通过大模型辅助脑血管疾病的临床诊断。
  • 核心价值:提升基层医疗水平,缓解专家资源紧张问题。

4. 教育行业

  • 案例:通过AI辅助教学,帮助学生快速理解知识点背景和上下文。
  • 核心价值:提升教学效率,增*学习体验。

5. 游戏行业

  • 案例:游族网络通过AI生成游戏内容,提升开发效率。
  • 核心价值:降低内容创作成本,增*用户体验。

六、AI落地的挑战与解决方案 ⚙️

在AI落地过程中,企业面临数据、算力、人才等多方面的挑战。以下是常见的解决方案:

1. 数据挑战

  • 问题:数据质量低、标注成本高。
  • 解决方案:通过大模型自动标注数据,提升数据治理效率。

2. 算力挑战

  • 问题:算力成本高,资源紧张。
  • 解决方案:采用多元算力架构,优化资源调度。

3. 人才挑战

  • 问题:AI人才短缺。
  • 解决方案:通过校企合作培养人才,提升企业内部培训。

七、开源与闭源模型的比较 🔄

开源和闭源模型各有优劣,企业需根据自身需求选择:

开源模型

  • 优势:成本低,灵活性高,适合技术能力*的企业。
  • 劣势:需要自行维护和优化。

闭源模型

  • 优势:稳定性高,服务支持完善,适合传统企业。
  • 劣势:成本较高,定制化能力有限。

八、未来展望 🌟

AI技术将继续推动新质生产力的发展,未来可能在以下方向取得突破:

  1. 具身智能:机器人通过AI实现更复杂的物理交互。
  2. 多模态融合:文本、图像、视频等多模态数据的深度融合。
  3. 行业深度应用:AI在更多垂直行业中实现规模化落地。

总结

本节课中,我们一起学习了AI如何驱动新质生产力的发展,探讨了其在各行业中的落地实践,并分析了面临的挑战与解决方案。AI大模型作为数据要素价值实现的最短路径,正在重塑生产方式和生活方式,为社会发展注入新的动力。


注意:本教程内容基于论坛嘉宾分享整理,仅供参考学习。实际应用中需结合具体场景和需求进行调整。

42:人工智能前沿技术与产业应用 🚀

课程概述

在本节课中,我们将学习2024年世界人工智能大会上,来自学界、产业界专家关于大模型技术发展、产业落地、文化遗产保护等前沿议题的深度探讨。课程将涵盖技术趋势、应用案例、产业挑战与未来展望,旨在为初学者提供一个全面、直观的人工智能发展图景。


一、 开场与致辞

尊敬的各位领导、各位来宾,现场以及正在通过网络收看直播的朋友们,下午好。欢迎来到2024世界人工智能大会腾讯智创未来论坛。

当今世界最炙手可热的话题之一是人工智能。在技术飞速发展、算法和数据资源日益丰富的当下,AI在各行各业的应用场景不断拓展。从制造业到文化产业,从科技创新前沿到文化遗产保护,AI正在掀起新一轮的技术变革。

首先,介绍出席今天论坛的各位领导和嘉宾。

在全球技术变革的浪潮中,上海以其特有的创新资源和人才优势,正在建设高水准、高规格的人工智能上海高地,不断推动人工智能技术在各行业的应用和发展。

上海市经济和信息化委员会副主任张洪涛先生致辞要点:

  • 人工智能发展日新月异,热度长盛不衰。
  • 上海人工智能产业起步早、基础好,企业数量众多,技术创新活跃。
  • 下一步将营造人工智能产业发展的最优生态,夯实基础底座,开展“人工智能+”行动,推动与各领域深度融合。
  • 探索人工智能的治理规范,完善标准、伦理和安全体系。
  • 期待腾讯等龙头企业发挥更大作用,打造标杆性应用项目。

腾讯集团副总裁蒋杰先生致辞要点:

  • 大模型已成为行业焦点,中国已推出超过300个大模型。
  • 实现大模型全链路自主研发意义重大。腾讯始终坚持自主创新,结合场景推动AI研究和落地。
  • 腾讯混元大模型已采用MoE架构,参数量达万亿,预训练语料超过7万亿token,位居国内第一梯队。
  • 未来趋势观察:
    1. 模型基础设施化:通用模型像水电煤一样成为基础设施,会出现不同尺寸的模型协同。
    2. 从多模态到全模态:多模态是通往通用人工智能的必经之路。
    3. 应用场景是关键:大模型落地的主战场在应用场景。腾讯内部已有近700个业务和场景接入混元大模型。

二、 技术演进与产业落地

上一节我们了解了人工智能发展的宏观背景与战略方向,本节中我们来看看大模型技术如何具体演进并服务于千行百业。

腾讯云副总裁吴运生演讲要点:走向大模型普惠时代

吴运生从技术发展、模型迭代、工具优化和场景落地四个方面分享了思考与实践。

1. 技术发展趋势

  • 多模态能力扩展:结合视觉和语言理解,实现更精准的语义分析和更全面的交互体验,尤其在汽车助手、企业知识服务等领域。
  • 学习范式进化:通过零样本或小样本学习,简化研发流程,加速AI落地。例如,一张照片即可生成数字人;通过缺陷提示实现工业质检。
  • 内容呈现沉浸化:3D生成和视频生成技术为用户带来更生动真实的沉浸式体验。例如,3D头像生成、与《人民日报》联合打造的“真爱地球”原创视频。

2. 模型能力升级
腾讯混元大模型已完成从稠密模型到MoE模型的升级,参数达万亿级别,综合能力稳居国内第一梯队。生图、生视频、生3D等能力处于业界领先地位。

3. 工具产品进展
腾讯云推出了三大模型PaaS产品,并进行了能力升级:

  • 知识引擎:基于LLM和RAG框架,升级多模态检索(图文互搜、以图搜图)、对话式数据问答,支持复杂表格分析与数据库对接。
  • 图像创作引擎:基于混元底座,提供领先的AI图像生成/编辑能力,新增33种风格、头像生成、商品背景生成、模特换装等功能。
  • 视频创作引擎:新增20多种热门舞蹈动作(支持多人舞蹈)、视频风格化(面部细节增*)、视频配音(提升音质自然度)。

4. 产业落地实践

  • 企业内部提效:知识引擎应用于腾讯客服大模型,配置成本降低50%以上;腾讯乐享平台结合大模型实现智能写作、智能问答,提升知识管理效率。
  • 医疗行业:与瑞金医院上海市数字医学创新中心合作研发医学大模型,实现体检报告自动生成(为医生节约超50%时间)。
  • 文娱行业:与阅文集团合作,应用大模型辅助写作(描写、灵感、大纲提取)和插图制作。
  • 科学文化探索
    • “探星计划”:与国家天文台合作,通过AI技术助力发现3例快速射电暴和41颗脉冲星。
    • 甲骨文研究:综合应用文字检测、摹本生成、字形匹配等AI算法。宣布全球最大的甲骨文多模态数据集开源,包含1万片甲骨的拓片、摹本及对应数据,助推甲骨文研究数字化、智能化。

三、 人工智能赋能文化遗产与IP创新

上一节我们看到了AI在工业和科技领域的*大赋能,本节我们将聚焦AI如何与人文领域结合,守护历史并激发新的创造力。

腾讯SSV数字文化实验室负责人舒展演讲要点:人工智能+文化遗产数字化

用最前沿的技术探寻最古老的文明,是一种独特的浪漫。AI在文化遗产保护中主要解决以下问题:

  1. 古文字破译难:如甲骨文4500字中仅试读约1500字。
  2. 文物修复任务重:中国有1500-2000万件待修复文物,传统修复耗时极长。
  3. 博物馆体验待提升:参观需求旺盛,但优质讲解资源有限。
  4. 文物资源开放共享:如何让库房文物通过数字化服务更多人。

实践与探索:

  • 甲骨文研究:推出“殷契文渊2.0”AI协同研究平台,实现甲骨文全信息数字采集、字形匹配、缀合,并发布数据集。启动“甲骨文AI破译定向课题”,征集利用该平台和数据集进行破译的方案,优秀方案奖励20万元。
  • 文物修复:与三星堆博物馆合作,探索AI辅助文物修复,已完成“青铜骑兽顶尊人像”的虚拟拼接与实物复原,正在研究2号神树,并开发裂纹检测、碎片补全等算法工具。
  • 博物馆体验:与国家博物馆联合打造AI数智人“艾雯雯”,具备文物知识学习与讲解能力,未来将在线下场馆提供伴随式讲解服务。
  • 文创与传播:发起“繁星计划”助力中小博物馆,利用AI设计文创产品、生成数智人形象,通过直播等方式扩大文化影响力。

阅文集团副总裁黄岩演讲要点:AI+IP,打开网文IP商业价值新空间

阅文发布了网文领域专有大模型“阅文妙笔”,懂场景、懂作家、懂角色、懂网文梗。

三大落地实践:

  1. 赋能创作者:AI功能集成于“作家助手妙笔版”,使用率超30%,提供大纲提炼、角色一致性检验、文字插图生成等功能。
  2. 规模化出海:AI翻译极大降低了成本与周期,使中国网文“一键出海”成为可能。但面临独特挑战:
    • 网文写作习惯独特:需预处理解决错别字、主语缺失、网络用语、过度分段等问题。
    • 专业术语翻译:需翻译得“信达雅”(如“清心诀”译为 Heart Soothing Technique)。
    • 新世界观涌现:需建立机制,让读者参与翻译评分,联动专家快速识别和处理新术语。
  3. 沉浸式互动:打造“筑梦岛”产品,用户可与故事角色(如《庆余年》范闲)对话互动,延伸IP体验。

目前,阅文海外翻译质量显著提升,成本下降九成,超30%海外内容来自大模型翻译,并开始拓展西班牙语、葡萄牙语等小语种市场。


四、 垂直领域的深度应用:医疗与数据基础设施

技术最终要服务于人,特别是在医疗这样的民生关键领域。同时,大模型的广泛应用离不开底层数据基础设施的支撑。

瑞金医院黄飞跃演讲要点:医学AI大模型实战

医学AI面临数据稀缺、精准度要求高、功能不全、数据安全严格等挑战。大模型预训练范式提供了新解决方案。

瑞金医院的实践:

  • 基座大模型:基于瑞金20多年积累的超过8000万条高质量电子病历记录(预训练总量240B Token)进行预训练加*,并构建医学智能体群组协同工作。
  • 应用大模型:从症状识别和医学建议切入,可识别数十万异常症状,推荐科室,在头部科室技术指标达95%以上。
  • 多模态影像大模型:通过解剖树、异常树组合推理实现影像信息结构化,利用多模态思维链提升模型泛化性与可解释性。
  • 应用系统
    • 体检报告生成系统:自动分析报告、识别风险、生成建议,已在瑞金体检中心全量上线,提升医生效率。
    • 电子病历生成系统:自动整合数十种住院文书,生成出院小结、随访建议等,实现医疗文档智能化。
  • 发布“瑞金AI医生”:具备“见多识广”(学习海量案例)和“望闻问切”(多模态交互)能力,支持疾病诊断、用药建议、视觉体征检测(无接触测心率、血氧等),旨在成为用户24小时健康助手。

腾讯云罗云演讲要点:向量数据库——大模型的最佳CP

大模型可视为“智能CPU”,其发展使得数据在企业竞争中的重要性空前提升。企业80%的数据是非结构化的,向量化是管理和利用这些数据的关键。

腾讯云向量数据库的设计理念:

  1. 企业级能力:继承传统数据库的分布式、高性能、高可靠性。
  2. 智能计算:将AI能力(如语义重排序 Rerank)沉淀到数据库中。

腾讯云向量数据库的实践:

  • 架构演进:从1.0版本基于Raft协议的分布式集群,演进到2.0版本计算存储分离架构,便于独立扩展索引与查询节点。
  • 易用性提升
    • 内置向量化模型,并可基于客户数据微调。
    • 推出向量数据工场,打通从数据源到向量入库的全流程,减少客户开发工作量。
    • 提供一站式解决方案,可快速构建召回率超80%的文本检索系统。
  • 应用规模:服务腾讯内部40+业务(如腾讯会议、腾讯文档),日均请求量近4000亿次;外部服务销售易、搜狐、好未来等数千家客户。

五、 未来趋势展望与圆桌讨论

在了解了众多具体应用后,我们需要站在更高视角审视未来。腾讯联合上海交通大学发布了《2024大模型十大趋势观察》。

腾讯研究院徐思彦解读要点:走进机器外脑时代

新一代AI在推理分析、创意生成、情绪智能三方面实现飞跃,正成为人类的“智力外挂”。十大趋势包括:

  1. 算力底座:训练集群步入万卡规模,算力是AGI可行路径及重要生产要素。
  2. 推理分析:大模型具备复杂推理能力,催生“智力即服务”新模式,可按任务调用云端智力。
  3. 创意生成:文生视频、音乐生成等技术降低艺术创作门槛,AI已能生成长篇电影。
  4. 情绪感知:多模态交互让AI更具情感,打开人机陪伴市场,让端侧设备更“可爱”。
  5. 工业制造:大模型与小模型互补,通过少量数据适配即可优化生产流程。
  6. AI智能体与游戏:游戏环境是训练AI智能体的绝佳沙盒,可提升其复杂决策能力。
  7. 移动革命:端侧智能(如Apple Intelligence)拉开序幕,改变人机交互方式,迈向“千脑智能”。
  8. 具身智能:大模型为机器人注入“大脑”,提升学习速度与操作精度,成为AI的物理载体。
  9. 开源共创:开源大模型从“可用”向“好用”演进,开源社区促进技术与知识迭代。
  10. 人机对齐:确保AI与人类意图一致,成为AI模型与产品的核心竞争力。

这十大趋势共同指向一个由机器外脑驱动的未来,带来智力资源的平权化,让低成本创新创业成为可能。

圆桌讨论精华:大模型离大规模产业应用还有多远?

与会专家(胡事民院士、马利庄教授、苏炜杰教授、吴永坚)就产学研如何迎接AI时代展开讨论:

  • 胡事民院士
    • 呼吁原始创新:不应只拼算力,应探索将知识工程、知识图谱与大模型结合的新思路,以提升模型严谨性、*服幻觉。
    • 重视推理优化:推理侧与设备结合,是大学和研究机构可以发挥作用的重点。
    • 给政府的建议:通过减税等宏观政策引导,而非直接下场投资。给高校的建议:承担社会责任,鼓励师生使用国产软硬件进行AI研发。
  • 马利庄教授
    • 研究方向转变:从NLP等成熟领域转向大模型应用落地及高效低耗算法研究。
    • 展望“主动式智能”:未来AI需像人一样理解上下文与意图,提供主动服务(如递纸巾、盖瓶盖)。
    • 呼吁合作共赢:避免“百模大战”下的资源浪费,企业、高校应通力合作,善用资源。
  • 苏炜杰教授
    • 对齐是核心挑战:GPT-5未发布,主因是对齐难度随模型能力指数级增长,涉及技术、社会、经济等多维度问题。
    • 人才培养需变革:AI是交叉学科,需要培养像冯·诺依曼那样的复合型人才,打破学科壁垒。
    • 海外观察:硅谷产学研生态在闭源趋势下有所削弱,中国可抓住机会。
  • 吴永坚
    • 产业落地难点:安全合规、训练推理成本、严肃场景(如客服)对准确率要求极高。
    • 应用路径:To C(情感互动、容错率高)先行,To B(严肃场景)更谨慎。商业化爆发仍需时间。
    • 企业护城河:生态分层明显(基础架构、预训练、垂直微调、应用调用),不同层次需要不同人才。腾讯需要兼具技术深度与产品洞察的复合型人才。
  • 给年轻人的建议
    • 胡事民:计算机学生不能只编程,要提升系统架构能力;非计算机学生要懂一点AI编程。
    • 马利庄:成为复合型人才,面向国家重大需求,保持对产业方向的预见性。
    • 苏炜杰:拥抱AI领域,保护好奇心和兴趣,驱动颠覆性创新。

课程总结

本节课中,我们一起学习了人工智能领域的最新动态与深度思考:

  1. 技术核心:大模型正向多模态/全模态、MoE架构、不同尺寸协同的方向发展,开源与对齐是关键议题。
  2. 产业融合:AI已深入医疗、工业、文娱、文化遗产保护等千行百业,核心价值在于提质增效与创造新体验。
  3. 基础设施:向量数据库等底层技术是管理和挖掘非结构化数据、支撑大模型应用的关键。
  4. 未来已来:“机器外脑”时代正在开启,将在算力、推理、创意、情感、具身智能等方面深刻改变社会。
  5. 产学研协同:需要原始创新、复合型人才培养、以及良性的生态合作,共同应对算力、成本、安全等挑战,让AI技术更好地造福于人。

这是一个充满变化与机遇的时代,拥抱技术、保持学习、专注价值,是应对未来的不变法则。

43:重塑生产力:AI开创增长前沿论坛精华解读 🚀

在本课程中,我们将系统性地学习“重塑生产力:AI开创增长前沿”论坛的核心内容。课程将涵盖人工智能的全球治理、企业应用实践、数据战略、人才培养及工业智能化等关键议题,旨在为初学者提供清晰、全面的AI赋能商业的认知框架。


论坛开幕与背景介绍 🎤

本次论坛在世界人工智能大会组委会办公室指导下,由埃森哲中国有限公司主办,第一财经支持,线上线下同步举行。人工智能作为推动未来发展的战略性通用技术,已被认定为形成新质生产力的重要引擎。

埃森哲特别筹办本场专题论坛,旨在开启一场AI赋能千行百业的智航之旅,共同探索AI重塑商业模式的无限可能。


主旨演讲:人工智能的治理与国际合作 🌍

上一节我们介绍了论坛的背景,本节中我们来看看人工智能发展中的治理挑战与国际合作必要性。

世界经济论坛大中华区主席陈黎明先生回顾了人工智能波浪式的发展历程。他指出,科技发展常是双刃剑,历史经验(如蒸汽机、农药、核能)表明,技术应用可能带来长期未预见的后果。

人工智能的崛起同样需要警惕。其潜在风险包括但不限于:

  • 隐私与真实性危机:Deepfake等技术挑战“眼见为实”,可能助长新闻造假、网络诈骗。
  • 能源消耗:AI模型运行需消耗巨大电能。
  • 职业再平衡:AI会替代部分岗位,同时创造新岗位,但对个体而言可能是职业生涯的重大挑战。
  • 未知风险(Unknown Unknowns):我们可能因认知局限,在“科技向善”的初衷下无意造成损害。

因此,在人工智能的开发与应用中:

  • 政府需在立法方面有所作为。
  • 企业需在科技伦理方面承担责任。
  • 开发者必须具备底线思维。

发展创新与可持续发展需取得微妙平衡。我们不应因噎废食,但必须认识到并管理其中风险。


核心洞察:生成式AI重塑企业生产力 🔄

在了解了宏观治理框架后,我们聚焦到企业层面:生成式AI如何具体重塑生产力?

埃森哲全球副总裁、大中华区技术服务事业部总裁俞毅博士指出,当前企业拥抱AI的态势正在加速。与往年相比,企业更关注“做什么”和“怎么做”,而不仅是“为什么做”;落地项目更具深度和端到端整合性;在某些领域(如企业出海)已成为刚需。

公式: 企业AI应用价值 ≈ 技术可行性 × 业务刚需*度

然而,将技术转化为可持续增长动力,企业需系统化构建五大关键能力:

  1. 价值为先:从单点场景优化转向梳理整体价值链的价值基线与回报。
  2. 打造数字核心:评估并升级企业的数据、技术架构基础,以支持结构化与非结构化数据的处理。
  3. 重塑人才与组织:AI不是简单替代岗位,而是改变工作方式。需重新设计组织、绩效考核与培训机制。投资比例参考:在人员赋能上的投入可能需达到技术投入的2倍。
  4. 践行负责任AI:建立跨法务、技术、业务的治理架构或委员会,系统化管理合规、隐私与伦理风险。
  5. 保持动态演进:技术环境快速变化,需保持学习与迭代能力。

生成式AI是一个过程,而非终点。其与空间计算等技术的结合,将解锁更复杂的应用场景。


基石要素:数据——AI竞争的新前沿 💎

技术落地离不开燃料,数据就是AI时代的核心燃料。本节我们探讨数据战略的六大新规则。

埃森哲全球副总裁、全球数据能力主管董小山博士*调,准备好数据是企业安全应用生成式AI并赢得竞争的关键

  1. 专有数据是竞争优势:大模型通用知识对具体业务场景的准确性可能不足30%。融入企业专有数据后,效率可提升至85%以上。数据应被视为产品,进行相应投资与管理。
  2. 解锁非结构化数据潜力:企业70%的数据是非结构化的(文档、音视频)。生成式AI擅长从中提取信息,但需为此类数据建立与结构化数据同等的治理流程。
  3. 利用合成数据填补空白:在数据缺失或获取成本高时,可结合数字孪生、专家知识与生成式AI创建合成数据,用于模型训练与模拟,从而创造价值(例如提升仓库运营效率)。
  4. AI使数据更易跨域使用:生成式AI降低了数据映射和情境化的难度,使得同一份数据(如IT系统代码)能被轻松用于不同业务目的(如客户服务与销售支持)。
  5. AI也加速了数据风险:使用的便利性意味着更多人可能无意中泄露敏感数据。企业需为全员提供培训、指南和工具(如模型网关/交换板),在数据发送至外部模型前脱敏,以保护机密信息。
  6. AI能加速数据就绪过程:生成式AI本身可用于加速数据准备任务,如编写数据迁移脚本、生成测试用例、创建数据产品文档等,从而反哺数据战略。

核心代码逻辑(模型网关示例):

# 伪代码:模型网关的数据脱敏与回填
def secure_query_with_gateway(user_query, sensitive_data_dict):
    # 1. 脱敏:将敏感信息替换为泛化标识符
    generic_query, token_map = sanitize_query(user_query, sensitive_data_dict)
    
    # 2. 将脱敏后的查询发送给外部大模型
    generic_response = call_external_llm(generic_query)
    
    # 3. 回填:将泛化标识符恢复为原始敏感信息
    secure_response = repopulate_response(generic_response, token_map)
    
    return secure_response

圆桌对话(全):解锁数据潜力的实践 🛠️

基于前面的数据战略,我们通过对话看看中美市场的异同与数据价值挖掘。

俞毅博士与董小山博士的讨论揭示了:

  • 中美市场差异:美国企业早期多使用Azure OpenAI等成熟模型,对模型比较关注较少;中国企业因模型选择多,更早开始关注模型对比、成本验证和小型化语言模型(更适合垂直场景、成本更低)。
  • 数据价值悖论与破解:大模型需要数据,但企业数据又是其差异化所在。破解之道包括:
    • 通过技术手段(如网关)在共享前剥离敏感数据。
    • 利用生成式AI进行知识蒸馏,创建用于行业模型微调的合成数据或知识范例,而非共享原始专有数据。
    • 将数据视为可内部衡量(效率、创新)或外部货币化(直接销售、赋能新商业模式)的产品。
  • 人才与治理:释放数据价值需要领域教练这样的新角色,他们负责指导AI在业务中的准确应用、内容调性和质量。数据治理必须是业务部门的职责,需将数据确权、问责制单一事实来源等原则程序化地融入日常流程。

给初学者的建议:立即开始。选择已验证的用例,获取初步生产力收益,并用这些收益为更战略性的数据项目提供资金。


圆桌对话(二):变革的力量——重塑运营与人才 📈

数据和技术最终服务于业务运营和人才。本节探讨AI如何重塑运营模式与未来人才需求。

联想集团高级副总裁高岚分享了联想的“AI for All”(人工智能普惠)战略,其核心是 “人本智能”

  • 人本底线:AI须促进社会发展,杜绝负面影响。
  • 人本技术:产品与服务须为人带来便利、安全与效益。
  • 人本理念:致力于可持续发展与社会福祉。

在AI时代,企业运营需紧密联动数据、技术、人才三大引擎。这意味着:

  • 业务模式:需审视AI带来的影响,转向混合AI模型(大小模型结合)。
  • 管理模式:高管需提升在不确定性中的决策与迭代能力。
  • 人才规划:从人力资源规划转向 “AI+人”的规划,思考人机协作的最佳方式。

对于员工而言,应对AI时代的关键在于:

  • 培养批判性思维与创造力(区别于机器的核心能力)。
  • 践行终身学习
  • 以积极开放的心态拥抱变化

在生态合作上,企业应遵循 “共建、互利、共生” 原则,明确自身优势,与合作伙伴在规则(如负责任AI)基础上共同成长。


圆桌对话(三):解锁增长新动力——服务业中的AI实践 ✈️

让我们将视角转向服务业,看AI如何提升客户体验与企业收益。

国泰航空数码部总经理邹明诺先生分享了AI在航空业的实践:

  • 应用场景
    1. 机器学习:如基于乘务员收集的数据预测餐食需求,优化菜单设计与备餐量。
    2. 生成式AI客服:用于处理行*查询等常见问题,提升准确率与效率。
    3. 机器人流程自动化:将重复性高、复杂的工作自动化,充当“数字化员工”。
  • 提升体验:利用“客户360度”数据模型提供个性化推荐与服务;大力推广自助服务,简化旅客流程。
  • 大湾区布局:视大湾区为“延伸的本土市场”,通过海空联运、人才计划(如IT培训生项目)、创新活动(编程马拉松)等方式进行深度布局与技术融合。

AI正在改变与客户的沟通方式,并大幅提升内部开发效率。成功的行业应用依赖于数据基础、清晰的业务场景、生态合作以及推动组织变革的领导力。


圆桌对话(四):工业企业的智慧脉动 🏭

最后,我们深入实体经济核心,探讨AI在工业企业的突破与实践。

汇川技术副总裁*瑞林先生指出,工业AI面临独特挑战:

  • 数据复杂:类型多、标准不一、涉及漫长价值链。
  • 多物理学科耦合:纯数据驱动AI需与光机电液气磁等物理控制过程结合。
  • 知识产权保护:如何在使用AI时保护客户的生产诀窍。

汇川的应对措施包括:由一把手挂帅的数据治理变革、专门的工业AI研究所以及跨业务单元的AI技术管理委员会

目前,在工业领域已产生商业价值的六大AI方向包括:

  1. 预测性维护与故障诊断
  2. 质量控制(机器视觉)
  3. 能源管理
  4. 研发数字孪生与虚拟仿真
  5. 产品设计与创新
  6. 客户服务与知识管理

AI将深刻改变工业企业的未来:

  • 商业模式:通过预测性维护盘活存量资产;推动真正的大规模柔性定制化生产。
  • 生产运营模式:实现研产销一体化的数字化;深化智能制造自动化;实现能源高效化;组织架构将更加矩阵化,AI辅助决策变得至关重要。

生态合作对于工业AI至关重要,需要专业咨询公司(厘清商业模型)、技术伙伴(互补能力)以及行业数据协调组织(解决数据量与质的问题)共同参与。


总结与展望 🌟

在本课程中,我们一起学习了人工智能重塑生产力的多维图景:

  1. 治理先行:AI的健康发展需要全球合作、政府立法、企业伦理与开发者底线思维的共同保障。
  2. 价值驱动:企业应用AI需从战略出发,系统化构建价值、数据、人才、治理与动态演进五大能力。
  3. 数据为基:专有数据是核心竞争力,必须通过有效治理、利用非结构与合成数据、管理风险,并借助AI加速数据就绪。
  4. 运营与人才重塑:AI改变业务模式,企业需规划“AI+人”的协作,员工需*化批判性思维、学习力与应变力。
  5. 行业深化:无论是服务业还是工业,AI的落地都始于具体场景,成于数据、技术与生态的融合,最终指向更高效、智能、绿色的未来。

生成式AI与人工智能的浪潮已至,它不仅是技术工具,更是重塑商业模式、提升核心竞争力的关键驱动力。对于所有组织和个人而言,主动学习、积极拥抱、负责任地利用这一变革力量,是通往未来的必由之路。

44:中国移动“AI赋能 创见未来”生态论坛解读教程 🚀

在本节课中,我们将学习中国移动“AI赋能 创见未来”生态论坛的核心内容。我们将了解人工智能如何赋能千行百业,以及中国移动在AI领域的战略布局、技术成果与生态计划。课程内容将涵盖AI在农业、工业、城市管理、政务等领域的应用案例,并深入解析中国移动的“九天”人工智能基座与“5个100”生态计划。


一、AI赋能产业:应用案例解析 🌾

人工智能正成为推动社会各领域现代化的重要力量。通过精准高效的专用AI解决方案,能够帮助实现智能决策与精准作业。

上一节我们概述了AI的广泛影响力,本节中我们来看看几个具体的行业应用案例。

以下是AI在不同行业中的赋能场景:

  • 农业现代化:通过农业专用AI解决方案,打造“田间智脑”,推出农技问答AI助手,帮助农事智能决策与精准作业。
  • 工业质检:在纺织车间等场景中,针对花型繁复、检测难度高的问题,依托瑕疵AI视觉检测系统,实现精准、实时、高效的智能质检。
  • 智慧交通:在智能网联示范区,综合运用AI模型与5G-A网联通信技术,打造创新性的车路协同应用示范路线,赋能智慧城市与自动驾驶。
  • 能源行业:面对光伏面板检测难题,依托OnePower工业质检平台,构建“5G+AI光伏质检”应用,打造智慧组件产线,提升检测效率。
  • 智慧政务:政务服务进入数字化时代,依托九天海算政务大模型,实现“一网通办、一网统管、一网协同”,构建高效政务生态。

二、中国移动的AI战略与“九天”基座 🏗️

从文明发展到信息时代,我们见证了生产力的重塑。如今,以大模型为代表的人工智能技术正在引领世界进入通用智能时代。

上一节我们看到了AI的具体应用,本节中我们来深入了解提供这些能力的技术基座与战略规划。

中国移动始终将人工智能作为公司核心战略,致力于打造世界一流的信息服务科技创新公司。

以下是其战略与实践的核心要点:

  • 战略定位:勇担人工智能“国家队”使命,建设一流的“九天”人工智能团队,承担国家重大科创任务。
  • 技术内核:以体系化人工智能构建原创技术内核,加快在基础理论、底层技术、机制框架上的突破。
  • 核心基座——九天大模型:打造新型智能化能力基座。
    • 目标:致力于成为国内最值得信赖、最懂行业的全栈自主可控大模型。
    • 特点:具备“做事”能力,首创行业定向增*技术,深度匹配国产算力,安全可信度领先。
    • 体系:包含通用大模型(如千亿、两千亿参数多模态模型)和超过40款行业大模型(如交通、民航客服大模型)。
  • 网络智能化:以先进的网络智能化技术推进通信网络领先发展,让网络运维效率倍增、运行绿色节能、优化虚实结合。
  • 赋能用户与服务:以智能化能力为10亿用户创造智慧生活,如智能5G新通话、家庭数字内容服务;以大模型重新定义客户服务模式,让服务更贴心。

三、“5个100”人工智能生态计划与未来展望 🤝

通用人工智能是时代赋予的新机遇。中国移动立志做好通用智能时代的供给者、汇聚者、运营者

上一节我们了解了技术基座,本节中我们来看看中国移动如何构建开放生态,与产业界共创未来。

为加速AI与产业融合,中国移动全新启动了“5个100”人工智能生态计划。

以下是该计划的具体内容:

  • 开放百大AI+场景:聚焦通信、家庭等重点领域,开放内容搜索、家庭看护等百大场景,深化产业赋能。
  • 集结百大合作伙伴:依托联创+实验室、应用商城等载体,共研新技术,共育新产品,加速产业势能。
  • 设立百亿权益扶持:通过算力支持、资本投资、市场共享、品牌共建等方式,设立百亿权益,升级产业动能。例如,提供1亿元级的算力支持,鼓励生态伙伴发展。
  • 开放百大技术要素:通过九天生态汇聚平台,开放百大模型、百大数据集和百大工具链,*化产业效能。
  • 打造百万智能体:聚焦车联网、新型工业化等十大赛道,联合生态伙伴创新,让个人和行业都拥有专属智能体,激发产业潜能。

此外,中国移动还致力于推动AI与5G-A的融合(称为“AI×5G-A”),在低空经济、数据交通、数据工厂、数智能源、数字轨交、数智商圈六大行业打造示范应用,激发乘数效应。


课程总结 📚

本节课中,我们一起学习了中国移动人工智能生态论坛的核心内容。

  1. 应用层面:我们看到了AI在农业、工业、交通、政务等千行百业中的具体赋能案例,解决实际痛点。
  2. 技术层面:我们深入了解了中国移动以“九天”大模型为核心的AI技术基座战略,其特点是自主可控、擅长做事、深耕行业。
  3. 生态层面:我们解析了“5个100”生态计划,它通过开放场景、集结伙伴、设立扶持、共享技术、共创智能体,构建了一个繁荣的AI产业共同体。
  4. 未来展望:AI与5G-A的深度融合,将为经济社会发展注入新质生产力,开启一个万物感知、万物互联、万物智能的新时代。

中国移动正以开放的心态,携手产业界,共同担负起推动人工智能健康发展的责任与使命。

45:人工智能赋能产业融通发展论坛精华解读 🚀

在本课程中,我们将学习2024世界人工智能大会“人工智能赋能产业融通发展论坛”的核心内容。课程将涵盖人工智能在新型工业化、电力能源、油气产业及企业应用中的关键实践与前沿思考,并整理成一篇结构清晰的教程。


概述:人工智能的时代使命

中国科学院外籍院士、图灵奖获得者赫伯特·西蒙曾指出,人工智能是计算机科学家的目标、数学家的梦想、哲学家的希望、心理学家的挑战,也是自然科学家的敬仰。我国政府高度重视人工智能发展,旨在通过科技创新引领产业融合驱动。本次论坛汇聚了政、产、学、研各界专家,共同探讨人工智能赋能产业发展的路径与经验。


第一节:人工智能赋能新型工业化的核心路径 🏭

上一节我们概述了论坛的背景与意义,本节中我们来看看中国电子信息产业发展研究院院长张立致辞中提出的,人工智能赋能新型工业化的四个核心方向。

张立院长指出,人工智能赋能新型工业化是一项系统工程,需要抓住关键环节。

以下是四个核心落脚点:

  1. 首要在产品:我国是消费电子和科技产品大国。随着AI技术成熟,语音识别与合成、物体检测、动作规划、实时推荐等已成为手机、电脑、汽车等产品的核心功能。新型工业化将催生新产品、新服务、新体验。
  2. 落脚在产业:工业具有规范化、规模化、互换性要求。AI能高效处理大规模实时数据,优化生产调度(optimize production scheduling)、提升产品良率、辅助经营决策,在效果、效率、效益上实现三重提升。
  3. 未来在融通:AI具有提升产业融通发展水平的潜力。在企业层面,AI能成为资产价值溯源工具,实现产业链贡献的精准核算;在个人层面,掌握AI技能的劳动者能拓展自身能力,获得更广泛的工作机会。
  4. 检验在场景:应用效果要以实际场景为准。研究院建设“人工智能场景应用与智能系统测评实验室”,正是以解决产业实际问题为抓手,提升应用实效。

第二节:决策智能在电力能源领域的应用 ⚡

上一节我们介绍了AI赋能工业化的宏观框架,本节中我们来看看达摩院决策智能实验室总经理刘乐分享的,AI在电力能源这一具体领域的深度应用。

刘乐总经理介绍,其团队致力于研究决策智能前沿技术,以提升业务运营效率与收益,降低成本。在电力能源领域,他们构建了“绿色能源AI”解决方案。

以下是该方案的三大支柱:

  • 预测:针对新能源“看天吃饭”的特性,开发新能源发电功率预测用户侧负荷预测模型,以应对电网供需平衡的挑战。
  • 调度:基于安全约束,利用AI进行电网优化调度(grid optimization dispatch,确定不同时间、不同发电机组的发电量,保障大电网稳定运行。
  • 交易:针对各省不同的电力市场规则,利用AI进行市场仿真与优化,辅助发电侧进行报量报价决策

在大模型时代,他们取得了新进展:

  • 全球区域联合气象预报:训练全球AI气象大模型,结合局部地形、卫星数据,实现更高精度、更长预见期的天气预报,为下游电力预测提供更优输入。
  • 可解释性AI(XAI):提升AI决策的透明度和可信度,让业务专家能够理解并信任AI的结论。
  • AI工程师与智能体:探索结合大模型与决策智能技术,开发能自动建模、规划并使用工具的类人决策智能体,处理复杂工业场景任务。

第三节:数字化赋能传统油气产业转型 🛢️

上一节我们探讨了AI在电力系统的应用,本节中我们转向另一个传统重工业——油气领域,看中国石化胜利油田的数字化转型实践。

胜利油田数字化管理服务中心主任段宏杰提出,老油田需要发展“新质生产力”,其核心是人、工具、生产资料三要素的智能化变革。

以下是其转型路径的核心要点:

  • 智能油田1.0向2.0演进
    • 1.0(当前):以自动化为核心,实现全业务异常管控。目标是“管异常而非管正常”,让机器处理常规,人聚焦异常。
    • 2.0(未来):以智能化为特征,实现全链条智能决策与一体化协同。推动研究方式、工程工艺、劳动组织、管理模式四大变革。
  • 人工智能大模型实践——“胜小利”:为解决知识管理难、交互效率低等问题,胜利油田研发了行业大模型虚拟助手“胜小利”。
    • 基础:学习了115万条油气勘探开发专业语料。
    • 能力:接入511项企业数据、143个功能组件,可实现专业知识问答、生产数据查询、制度流程解答、安全标准检索等。
    • 愿景:最终建成“一个工业智能平台、N个业务模型、一个服务平台”的人工智能赋能油气勘探开发体系。

第四节:企业大模型应用的落地生根 🌱

上一节我们看到了AI在具体工业场景的垂直深化,本节中我们来看看百度智能云副总裁喻友平分享的,大模型在企业端通用场景的落地经验。

喻友平认为,2024年是大模型应用元年,企业应用大模型的核心价值在于增收、提效、降本、合规

以下是三个最具价值的通用落地场景:

  1. 超级知识库——知识管理:大模型能彻底重构企业知识管理平台。
    • 传统痛点:知识孤岛、应用效率低(仅为搜索)。
    • 大模型解决方案:快速接入多源知识,实现对话式、推理式知识问答,相当于为每位员工配备专家助手。例如,帮助泰康保险整合多个系统知识,赋能全国保险代理人。
  2. 超级客服——智能服务:大模型能显著提升智能客服的拟人度和复杂问题解决能力。
    • 关键点:直接使用通用大模型,客服可用性仅约50%。需针对客服场景进行*约束优化和低容错设计,才能将可用性提升至90%以上。例如,解决“携带行*额度”这种依赖多因素推理的复杂问题。
  3. 超级主播——数字人:大模型为数字人注入“灵魂”。
    • 价值:数字人形象能极大增*大模型交互的亲切感和表现力。
    • 进展:技术已能实现“一句话生成3D数字人”、“分钟级生成2D高清分身”,大幅降低制作成本与周期,让数字人广泛应用于营销、销售、服务等场景。

他总结,企业应用大模型需把握三点:围绕业务场景、驱动数据与知识、实现人格化交互


第五节:人工智能推动电力智能化运维 🔌

上一节我们关注了大模型在企业内部的应用,本节中我们聚焦到电力行业的具体运维环节,看中电誉创专家孙成分享的AI落地实践。

孙成指出,传统电力运维面临数据处理不足、故障预测定位困难、人力成本攀升三大痛点。智能化运维是必由之路,但也面临规模化部署、人员技能转型、场景多样化等挑战。

中电誉创的解决方案是“边端结合”的智能化体系:

  • 智能前端:针对输煤系统、升压站、配电房等不同场景,研发了巡检、清洗、作业、监护等系列机器人,形成“机器人大家族”。
  • AI后端平台:构建三级管理平台。
    • 一级(全局管控):集团级统筹平台。
    • 二级(区域管理):单场站或区域管理平台。
    • 三级(设备协同):基于物联网的机器人管理平台,实现协同调度。
  • 未来展望:依赖于底层算力革新AI理论发展(从深度学习到大模型)。发展方向包括预测性维护广泛应用、自动化水平提高、数字化转型深化,以及建立行业标准以促进解决方案泛化。

第六节:央国企人工智能场景需求发布 🎯

上一节我们了解了科技企业提供的解决方案,本节中我们来看看需求方——央国企的具体诉求。南方电网数字集团技术专家郭杨运发布了其AI需求。

项目名称:人工智能驱动的电能量数据创新应用技术研究

以下是三大核心应用场景与AI需求:

  1. 场景一:AI赋能电能计量运维
    • 需求:利用多模态大模型、深度学习,研究基于多模态数据融合与知识学习的智能运维方案,实现从安装检测、状态感知、故障根因分析到现场辅助的全流程智能化,提升运维效率20%-30%。
  2. 场景二:AI赋能负荷精细化管理
    • 需求:应用机器学习算法分析用户用电行为,结合AIoT技术融合物理世界与数字孪生,实现用户侧灵活资源(如楼宇、储能、电动汽车)的评估、预测、聚合与协同调度,提升负荷预测精度至90%以上,响应效率提升25%。
  3. 场景三:AI赋能“电力看经济”
    • 需求:整合大数据与生成式人工智能,研究基于电能量数据的产业态势感知与分析报告自动生成方法。构建多智能体(Multi-Agent)协同系统,自动完成数据检索、处理、分析到报告撰写的全流程,为政府与企业提供定制化能源消费与产业趋势分析。

合作模式:采用“政府引导+企业主导+高校科研+用户参与”的多元协同创新模式。


第七节:中国移动的智能算力与大模型实践 📡

上一节我们聆听了来自电网的需求声音,本节中我们来看看作为基础设施提供者的中国移动,在AI算力与模型方面的战略与实践。

中国移动研究院副院长段晓东介绍,中国移动将自身定位为AI领域的供给者、汇聚者、运营者

以下是其三大核心实践:

  1. 构建领先的智能算力万卡集群:已在呼和浩特、哈尔滨、贵阳等地建设并交付万卡智算集群,支持千亿参数大模型训练。攻*了断点续训等关键技术,保障集群长期高效运行。并正研究超万卡时代的CCCC(新型算力中心)技术。
  2. 研发“九天”系列大模型:打造全自研、通专结合的千亿级大模型,已通过国家双备案。基于“九天”底座,已衍生出客服大模型(应用于10086)、网络大模型(优化5G网络运营)等20多个行业模型。
  3. 建立“启衡”大模型评测体系:针对行业“百模大战”中模型质量参差不齐的问题,建立了自主的评测体系。已完成40余款主流模型评测,发现:国内外模型差距在缩小;国内千亿模型准确率已达较高水平(约80%以上);数据质量成为关键因素;行业存在不少无法提供服务的“虚标”模型。中国移动正联合产、学、研各方,发起大模型评测联盟,旨在建立中国自主的AI评测话语权。

圆桌论坛:人工智能赋能新型工业化的经验与展望 💡

在最后的圆桌论坛环节,各位专家就AI赋能新型工业化的初步经验、大模型“涌现”机制在工业领域的价值、以及高质量工业数据集建设等议题进行了深入探讨。

核心观点摘要:

  • 初步经验与融合场景

    • 中电誉创 樊绍胜:AI与机器人技术结合,在电力、钢铁等行业的安全运维中提升效率与安全水平。关键技术包括感知技术、机器人控制技术及行业大模型。
    • 创新奇智 张发恩:AI本质是从数据中寻找知识的范式。工业视觉质检、动态调度等已是成熟应用。大模型让自动化走向智能化,使生产更柔性、空间利用更高效。
    • 达摩院 刘乐精准天气预报是新型工业化(尤其是能源领域)的刚需;AI的可解释性(XAI) 是落地关键;探索结合大模型与决策智能技术,开发类人决策智能体作为辅助工具。
    • 南方电网 郭杨运:AI在电网已应用于智能客服、无人机巡检、安全规范检测、负荷预测等多个场景,正朝着运维智能化、调度精细化深度发展。
  • 大模型的“涌现”与工业应用

    • 张发恩:“涌现”背后是Scaling Law(规模定律),即参数、数据、算力增长带来智能质变。这将使自动化设备从“盲目的快”变为“有眼的智能”,实现自主规划。
    • 刘乐:“涌现”机制尚不明确,如同人脑仍是黑箱。当前重点是通过可解释性AI安全校验机制,确保AI作为可靠工具辅助人类决策,而非完全替代。
    • 樊绍胜:通过人机交互、人机融合,如自然语言指令、*化学习训练机器人运动等,实现人与机器的协同工作。
    • 郭杨运:“涌现”能力让智能客服回复更拟人、更个性化,能更好地服务用户。
  • 高质量工业数据集建设

    • 樊绍胜:需解决数据来源少、样本不均衡问题。通过自动化装备、无人机等获取数据,并推动行业数据共享
    • 郭杨运:需联合行业构建具体场景的高质量数据集。同时探索在保障数据安全下的联邦学习等去中心化联合训练方式。
    • 刘乐:呼吁更多场景开放与数据共享,例如通过行业竞赛等形式,共同打磨技术。
    • 张发恩:提出三层数据体系建设思路:
      1. 通用数据层:赋予模型常识。
      2. 行业数据层:赋予模型专业知识,形成行业大模型。
      3. 企业专属数据层:与上述两层结合,通过微调形成企业专属大模型。同时,数据质量至关重要,高质量数据可大幅减少训练所需数据量。

总结

本节课中,我们一起学习了2024世界人工智能大会产业论坛的精华内容。我们从宏观战略(人工智能赋能新型工业化的四个路径),深入到具体行业实践(电力、油气),再到企业通用场景应用(知识管理、客服、数字人),并聆听了来自央国企的需求发布与基础设施提供者的能力构建。最后,通过圆桌论坛,我们探讨了技术融合、智能涌现、数据建设等关键议题。

核心共识在于:人工智能赋能产业,必须紧扣业务场景,以解决实际问题、创造实际价值为根本;需要技术与数据的双轮驱动,特别是高质量、场景化的数据积累与开放协作;同时,应注重人机协同,让AI成为人类专家可靠、可信的辅助工具,共同推动产业智能化升级与融通发展。

46:产业数据要素流通与应用论坛精华解读 🎤

课程概述

在本节课中,我们将学习2024世界人工智能大会“产业数据要素流通与应用论坛”的核心内容。课程将聚焦数据作为新型生产要素的价值、流通挑战、技术解决方案及产业应用实践,帮助初学者理解数据要素市场的现状与未来。


一、论坛开幕与致辞 🌟

本次论坛以“激活数据要素,乘数新质生产力”为主题,汇聚了政、产、学、研各界的领导与专家。数据已成为驱动数字经济发展的核心引擎,培育新质生产力的关键力量。

上海市相关领导在致辞中指出,上海正加快培育数据要素市场,力求到2025年基本建成数据要素市场体系。产业数据要素的流通与应用,是推动高质量发展的重要抓手。


二、数据要素的价值与挑战 ⚖️

上一节我们介绍了论坛的宏观背景,本节中我们来看看数据要素本身的特点及其面临的挑战。

数据作为一种新型生产要素,具有易复制、需复用、含隐私、*时效等特点。其价值释放面临三大核心矛盾:

  1. 制度与技术的协同:顶层制度(如“数据二十条”)已出台,但与之匹配的基础技术(如确权、定价、流通)尚不完善。
  2. 流通与安全的平衡:数据不流动没价值,但流动又可能引发安全与隐私泄露风险。
  3. 供给与需求的错配:存在大量数据,但高质量供给不足,且中小企业“不会用、不敢用、不愿用”数据的情况普遍。

核心概念可以用一个简单公式描述数据价值的释放逻辑:
数据价值 = f(数据质量, 流通效率, 应用场景)
其中,流通效率和应用场景的丰富度是关键变量。


三、关键技术:构建可信流通基础设施 🔐

要解决上述挑战,必须依靠技术创新来构建安全可信的数据流通基础设施。以下是当前重点发展的几项关键技术:

1. 区块链技术
区块链通过分布式账本、不可篡改、可追溯等特性,为数据流通提供“存证”和“确权”的基础。

# 概念性代码:区块链存证
block = {
    'timestamp': '2024-07-06 14:30:00',
    'data_hash': '0xabc123...', # 数据指纹
    'previous_hash': '0xdef456...', # 构成链式结构
    'owner': 'Company_A'
}

2. 隐私计算技术
隐私计算(如联邦学习、安全多方计算)能在不暴露原始数据的前提下进行协同计算,实现“数据可用不可见”。

3. 数据元件与数据空间
“数据元件”是原始数据经脱敏、加工后形成的标准化、可封装、可计量的中间态产品,是流通的理想标的物。“可信数据空间”则是基于分布式技术,连接数据供需双方,提供可控、可追溯流通环境的基础设施平台。


四、产业应用场景实践 🚗⚡️🐟

技术必须与产业结合才能创造价值。以下是数据要素在几个典型领域的应用案例:

汽车交通领域

  • 场景:智能网联汽车自动驾驶算法训练。
  • 痛点:单一车企数据有限,数据孤岛严重。
  • 解决方案:通过可信数据空间,链接车企、路侧设备等多方数据,在保护各方权益的前提下,形成合规的大型数据集,共同训练算法,加速自动驾驶技术研发。

能源电力领域

  • 场景:虚拟电厂调度与碳资产管理。
  • 痛点:发电方、用电方、电网等多主体间数据信任与清结算问题。
  • 解决方案:利用区块链技术对发电、用电、交易等数据进行可信存证与自动清分结算,提升调度效率与透明度,并服务于碳资产的精准核算与交易。

智慧农业领域

  • 场景:设施渔业养殖与农产品溯源。
  • 痛点:养殖过程不透明,品质不可控,补贴发放不精准。
  • 解决方案:通过物联网采集养殖环境数据,结合区块链进行全流程溯源。消费者可查证产品来源,政府可基于可信数据实现精准补贴。

五、前沿探索:从产业数据空间到金融数据空间 💰

数据在产业内部流动产生价值(记为1),当它进一步流向金融领域时,可能创造十倍甚至百倍的价值(10或100)。这就是“产融结合”的巨大潜力。

以下是两个延伸场景:

  • 汽车数据 → 保险:基于可信的车辆行驶数据,保险公司可以开发更精准的UBI(基于使用行为的保险)或自动驾驶责任险。
  • 能源数据 → 绿色金融:基于可信的新能源发电站运营数据,金融机构可以更准确地进行资产评估,为新能源项目提供融资支持。

通过产业数据空间推动产业数字化,再通过金融数据空间激活金融价值,构成了数据要素价值释放的“第二曲线”。


六、总结与展望 🔮

本节课中我们一起学习了:

  1. 数据要素的核心地位:数据是数字经济的核心生产要素,其流通与应用关乎新质生产力的发展。
  2. 流通的核心挑战:主要集中在制度与技术协同、安全与效率平衡、供给与需求匹配等方面。
  3. 关键的技术支柱:区块链、隐私计算、数据元件与可信数据空间是构建流通基础设施的基石。
  4. 丰富的应用场景:在汽车、能源、农业、政务、金融等领域,数据要素正在通过技术解决具体痛点,创造真实价值。
  5. 未来的融合方向:产业数据与金融数据的结合,将释放更大的乘数效应。

展望未来,数据要素市场的繁荣需要政策、技术、产业、资本的共同推动。业界应少一些浮躁与空谈,多一些踏实与务实,共同将数据的梦想照进现实。正如论坛所言:“春天来了”,数据要素的价值释放正迎来广阔天地。

47:AI与数学优化:从理论到应用 🧠➡️⚙️

在本节课中,我们将学习数学优化(或称数学规划)的核心概念、其与人工智能(特别是大模型)的关系,以及它在解决现实世界复杂问题(如电网调度、生产排程)中的关键作用。我们将看到,基于科学和逻辑的优化方法如何与基于数据和经验的人工智能方法互补结合,共同推动技术进步。


1. 数学优化:定义与核心要素 🔍

上一节我们介绍了课程概述,本节中我们来看看什么是数学优化。数学规划,有时也称为优化,其核心是寻找最佳决策方案。

一个数学规划问题主要由三个要素构成:

  1. 数据:问题中已知的固定信息。
  2. 变量:决策者可以控制或改变的未知量。
  3. 目标函数:需要最大化或最小化的性能指标。

此外,决策通常还需要满足约束条件,这些条件代表了物理规律、经济限制或政策要求,不能随意违背。

其通用形式可以用以下公式描述:

优化目标: 最大化或最小化 f(x)
约束条件: 满足 g_i(x) ≤ 0, i=1,...,m
                 h_j(x) = 0, j=1,...,p

其中 x 是决策变量向量。


2. 一个经典案例:背包问题 🎒

为了理解数学优化如何工作,让我们看一个简单例子:经典的背包问题。

假设你有一个最大承重为5公斤的背包,面前有5件物品,每件物品有自己的重量和价值。目标是选择放入背包的物品,在不超过总重量的前提下,使背包内物品的总价值最大。

以下是解决此问题的关键步骤:

  • 定义变量:为每个物品定义一个二进制变量 x_ix_i = 1 表示放入背包,x_i = 0 表示不放入。
  • 建立目标函数:总价值 = 各物品价值乘以对应变量后的总和,目标是最大化这个总和。
  • 添加约束:各物品重量乘以对应变量后的总和必须小于等于背包承重。

当物品数量很少时,可以手动枚举所有可能性(2^5 = 32种)。但在现实中,问题规模可能极其庞大(例如数万物品、多个背包),可能性将是天文数字,必须依靠数学优化算法来高效求解。


3. 数学优化 vs. 生成式AI:逻辑与经验的对比 ⚖️

上一节我们通过背包问题看到了优化问题的复杂性,本节中我们来看看数学优化方法与当前流行的生成式AI(如ChatGPT)在解决问题上的根本区别。

我们曾用早期版本的ChatGPT尝试求解上述背包问题。它正确地识别出这是一个背包问题,并给出了建模建议,但最终推荐的解决方案(放入第1、3、5件物品)总重量为6公斤,违反了5公斤的约束。这揭示了一个关键点:

  • 数学优化:追求基于科学、逻辑和数学规律的精确解。它要求结果100%正确,适用于航空、电网调度等不容出错的领域。
  • 生成式AI(大模型):主要基于大量数据训练,给出的是近似或经验性的答案。它可能犯错,适用于容错率较高的创造性或辅助性任务。

两者并非对立,而是互补关系。有些问题需要严格的数学规律,有些则需要融入人的经验。更妙的是,我们可以结合两者:用大模型帮助将复杂的现实问题描述转化为数学模型(建模),再用专业的优化求解器进行精确求解。


4. 优化是大模型训练的核心 🔄

我们探讨了优化与AI的区别,但有趣的是,人工智能本身也深深依赖着优化技术。

大模型(如神经网络)的训练过程,本质上就是一个庞大的优化问题

  • 变量:神经网络中数以亿计的连接参数。
  • 目标函数:损失函数,用于衡量模型预测与真实数据之间的差距。
  • 目标:通过调整参数,最小化损失函数。

目前最常用的训练算法是 Adam。训练一个像Llama-7B这样的模型,需要处理海量数据,耗时数月并消耗巨大电力。优化领域的专家通过分析训练目标函数的数学特性(如梯度、海森矩阵的结构),对Adam算法进行了改进,提出了 Adam-mini 等新算法,成功将训练时间减少了约三分之一,同时节省了内存。这证明了高效的优化算法对AI发展至关重要。


5. 优化求解器:速度与精度的追求 ⚡

既然优化如此重要,我们如何高效求解这些复杂模型呢?这就要依靠优化求解器——一种专门用于求解数学规划问题的软件。

求解器的核心追求是:

  1. 准确性:保证找到的解是数学上的最优解或高质量可行解。
  2. 速度:求解时间越短,就能越频繁地重新规划,以应对现实世界的变化。

其发展历程如下:

  • 1979年:首个商业求解器出现。
  • 2011年:开源求解器开始发展。
  • 2019年:中国诞生了首个自主的商业求解器(如COPT),打破了国外垄断。在多项国际公开测试中,国产求解器已达到世界第一或第二的水平。

现实问题的复杂性不断增长,对求解速度提出了更高要求。传统基于CPU的求解方式遇到瓶颈。现在,研究前沿是将求解器移植到 GPU 上,利用其并行计算能力。例如,某个曾需要59400秒(约16.5小时)求解的欧洲物流问题,通过GPU加速的求解器仅需916秒即可解决,提速超过60倍。


6. 硬件与软件的协同进化:CPU+GPU混合架构 🖥️➕🎮

上一节我们看到了GPU带来的巨大提速,本节中我们深入探讨这种硬件变革背后的计算范式转变。

长期以来,高精度科学计算(包括传统优化求解器)主要依赖CPU。GPU因其高并行性但在双精度浮点计算上存在局限,被认为不适合此类任务。然而,这一观念正在被打破。

范式转变正在发生:优化求解的核心算法(如一阶/二阶算法、整数规划)正在被重新设计,以适应 CPU+GPU的混合架构。这带来了突破性进展:

  • 线性规划:万秒级问题降至百秒级。
  • 半定规划:可求解问题的规模从万维提升到亿维。
  • 二次约束规划:曾经内存溢出或无解的大规模问题,现在几十秒即可求解。

英伟达等硬件厂商也积极跟进,发布了新的函数库(如用于矩阵分解的tensorly函数)和硬件架构(如Grace Hopper),旨在降低CPU与GPU间的通信延迟。未来的计算趋势必然是软硬件协同设计。

对于中国而言,机遇与挑战并存。机遇在于参与并引领这场计算架构的范式变革。挑战在于,国产GPU在底层数值计算库函数(如矩阵运算)的成熟度上与国外存在较大差距,这比硬件本身的差距更为关键,需要重点投入建设。


7. 让AI学会建模:大模型与优化的结合 🤝

我们拥有了*大的求解器,但解决现实问题的第一步——将业务问题转化为数学模型(建模)——仍然高度依赖专家经验,耗时费力。这正是大模型可以发挥作用的舞台。

然而,直接让通用大模型(如GPT-4)进行复杂业务建模仍面临挑战:

  • 幻觉问题:可能生成看似合理但数学上错误的模型。
  • 领域知识缺乏:对特定行业的复杂约束理解不深。
  • 求解能力不足:即使建对模型,也可能无法调用或有效利用专业求解器。

为此,研究者开发了领域专用的智能建模系统。这类系统通常:

  1. 采用高质量的行业历史数据与合成数据进行训练。
  2. 利用思维链等技术将复杂建模任务分解。
  3. 与优化求解器(如COPT)深度集成,实现“建模-求解”一体化。

初步实践表明,这类系统能显著提升建模效率,将原本需要数周人工完成的工作,缩短到几天甚至更短。这预示着,大模型有望率先改变高技术工种的工作模式,实现知识经验的沉淀与高效复用。


8. 生成式AI的挑战与金融应用实例 💹

数学优化与AI的结合前景广阔,而生成式AI本身也面临诸多挑战,并在其他领域如金融量化交易中产生革命性影响。

生成式AI的三大挑战

  1. 情感沟通与隐私:当前模型多为说教式交互,缺乏真正的情感理解与共情能力,且在对话中可能存在隐私泄露风险。
  2. 幻觉问题:模型会“自信地”编造不存在的信息。缓解方法之一是检索增*生成,即让模型在回答前先联网搜索相关信息作为依据。
  3. 去中心化训练的验证:当利用分布式算力市场训练或微调模型时,如何验证任务提供方确实完成了约定工作、未篡改数据或偷工减料?区块链技术与基于AI训练过程本身设计的可验证计算机制可能是解决方案。

在量化金融中的应用
生成式AI,特别是大语言模型,正在改变量化投资:

  • 另类数据分析:传统量化依赖价格、财报等结构化数据。现在,大模型可以深度分析新闻文本、社交媒体情绪,甚至解析卫星图片(如通过停车场车辆数预测零售商业绩),从中提取影响市场的“新因子”。
  • 策略生成与优化:对冲基金如XTX Markets 率先大规模使用GPU和深度学习进行高频交易,开启了量化交易的新范式。AI可以处理更复杂的非线性关系,自动发现交易策略。

9. 可控的生成式AI:对齐与扩散模型 🎨

生成式AI不仅能生成内容,其底层思想(如扩散模型)还能用于解决更广泛的优化与设计问题。但前提是,我们必须让AI可控

对齐问题:如何确保比人类更*大的AI(超智能)始终符合人类意图与价值观?主流方法是基于人类反馈的*化学习(RLHF)。通过人类对模型输出的偏好反馈来训练一个“奖励模型”,再用*化学习微调大模型,使其输出更符合人类喜好。

扩散模型作为优化引擎
扩散模型不仅是图像生成工具,其本质是一个受控的随机过程(从噪声逐步生成数据)。我们可以引导这个过程,使其服务于特定优化目标:

  • 原理:在预训练好的扩散模型采样(去噪)过程中,加入额外的控制信号,引导生成结果同时满足数据分布和自定义的目标函数(如蛋白质的某种生物活性)。
  • 应用:这实现了“指哪打哪”的智能设计,可用于生成新的蛋白质结构材料晶体机器人控制轨迹等,远超艺术创作范畴,在科研与工程中潜力巨大。

10. 人工智能的经济展望与数据定价 📈

最后,我们从更宏观的经济学视角审视人工智能的影响。

AI对经济与就业的冲击
影响可能超出传统认知。AI首先替代的未必是体力劳动,而是那些信息处理完备、环境交互少的认知工作(如编程、会计、分析)。甚至最高端的科研工作也可能受到冲击。这可能导致社会结构两极化,威胁中产阶级。

AI发展的两种世界观

  1. 可预测的:遵循缩放定律,模型能力随算力、数据量增长可预测地提升。
  2. 不可预测的:存在涌现能力,能力在某个临界点突然出现,难以预测。
    这两种可能性预示着截然不同的未来社会发展路径。

用经济学方法设计更好的AI

  • 考虑多样性偏好:在RLHF中,不仅要学习大多数人的偏好,还应通过正则化等技术保护少数群体的偏好分布,使AI输出更公平、更具经济代表性。
  • 数据定价与版权:数据是AI时代的“石油”。未经授权使用版权数据训练模型引发诸多纠纷。完全封锁或完全放开都非良策。一个经济学解决方案是引入沙普利值:通过衡量每个数据贡献者(或组合)对模型性能提升的边际贡献,来公平地分配模型收益,从而在激励创新与保护产权间取得平衡。

总结 📚

本节课中我们一起学习了:

  1. 数学优化的基本要素及其对求解复杂决策问题的必要性。
  2. 数学优化(追求精确)与生成式AI(基于经验)的根本区别与互补关系。
  3. 优化算法本身就是大模型训练的核心,其改进能直接推动AI发展。
  4. 高性能优化求解器的发展,以及向CPU+GPU混合架构演进的趋势。
  5. 如何利用大模型辅助解决建模难题,实现智能决策。
  6. 生成式AI在金融量化等领域的应用实例及其面临的幻觉、验证等挑战。
  7. 通过对齐技术使AI可控,以及扩散模型在科学设计中的潜力。
  8. 从经济学视角看待AI对就业、社会结构的影响,以及用市场机制解决数据版权问题的思路。

智能计算的时代已经到来,数学优化与人工智能的深度融合,正在为各行各业带来前所未有的精准决策能力和创新活力。

48:RISC-V与生成式AI融合创新教程

概述

在本节课中,我们将学习RISC-V指令集架构如何与生成式人工智能(AI)技术相结合,共同应对当前AI发展面临的算力、能耗和定制化挑战。课程内容整理自行业论坛中多位专家的核心观点,我们将深入探讨其技术原理、市场机遇与未来趋势。


一、 论坛开幕与行业背景

本次论坛聚焦于生成式AI的快速发展及其带来的巨大算力需求。AI模型通常在云端进行训练,在终端设备进行推理和微调,这对计算架构提出了新的要求。

RISC-V作为一种开放的指令集架构,因其微架构的灵活性和可扩展性,为AI芯片的创新提供了广阔的技术空间和产业化自由度。论坛旨在探讨两者融合发展的技术难点与市场机遇。


二、 领导致辞:上海在RISC-V生态中的角色

上一节我们介绍了论坛的背景,本节中我们来看看产业政策层面的支持。上海市相关领导在致辞中概述了上海在拥抱和推动RISC-V发展方面的成果与规划。

上海是中国最早推动RISC-V发展的区域之一,自2015年起便有企业参与国际基金会的组建。经过近十年发展,上海已成为RISC-V企业、产业和人才最集聚的地区。

取得的成果主要体现在以下三个方面:

  • 培育领军企业:在IP、芯片设计等领域涌现出一批具有国际竞争力的企业。
  • 构建产业生态:形成了从EDA工具、芯片设计到晶圆制造和流片验证的完整产业链。
  • 汇聚专业人才:多所高校开设相关课程,培养的人才占全国比重较高。

未来,上海计划从三个方面继续推动产业发展:

  1. 成立产业赋能中心,构建统一硬件平台,形成全栈解决方案。
  2. 做*产业联盟,加快专利池建设,推动共建共享。
  3. 加*前沿技术研究和人才培养,将RISC-V纳入紧缺人才培训计划。

生成式AI的快速发展为RISC-V提供了巨大的发展空间。


三、 主题分享一:大语言模型的原理与发展

上一节我们了解了产业生态的布局,本节我们将深入技术核心,探讨大语言模型的基础原理。演讲者从“第一性原理”角度,阐释了大语言模型为何能够工作。

原理一:邱奇-图灵论题
该论题指出,所有已知的计算装置都等价于图灵机。这为理解计算和智能提供了基础起点。用公式化的理解即:
所有计算装置 ≈ 图灵机

原理二:学习的定义
学习可以被定义为“图灵机的逆问题”。即,给定一系列输出,去反推产生这些输出的机器(程序)。这恰好对应了大模型的训练过程:用海量数据训练,得到一个能够产生这些数据的模型(机器)。

原理三:神经网络的通用性
三层以上的神经网络可以无限逼近任意连续函数,这意味着它可以作为一个通用的函数逼近器。这为神经网络处理复杂任务奠定了理论基础。

原理四:算力与能耗的物理极限
信息处理存在理论上的能耗下限,即兰道尔极限。随着AI算力需求指数级增长,如何应对巨大的能耗挑战,是未来必须面对的问题。

当前,大模型的发展速度极快,但巨大的算力需求也带来了能耗和可及性的挑战,这为硬件创新留下了空间。


四、 主题分享二:AIGC芯片的机遇与挑战

上一节我们从原理层面理解了AI,本节我们来看看支撑AI发展的硬件——芯片所面临的机遇与挑战。生成式AI(AIGC)正推动一场深刻的智能革命。

从弱智能到*智能,再到可能出现的超越人类的超级智能,其发展速度可能远超预期。这迫使我们必须积极拥抱这项技术。

巨大的算力需求与能耗挑战
随着模型参数量的增加,所需的算力呈指数级增长。例如,训练未来可能的超级智能模型,可能需要千万张H100级别的加速卡,能耗相当于十座大型水电站。这带来了巨大的挑战。

端侧AI的广阔前景
AI算力需求将分布在云、边、端各个层面。除了云端的训练,在终端设备(如PC、手机、AR眼镜)上进行模型的微调和推理,将是一个更庞大的市场。未来的设备若不具备AI能力,可能失去竞争力。

芯片架构的创新:Chiplet与先进封装
为了提升算力和能效,芯片架构正在革新。Chiplet(芯粒)技术通过将大芯片分解为多个小芯片进行异构集成,再通过先进封装(如2.5D、3D)连接成一个系统,是应对摩尔定律放缓、提升性能功耗比的关键路径。

汽车电子成为重要赛道
智能汽车对芯片算力、安全性和可靠性的要求极高,且其供应链相对集中,为新型芯片架构(如基于Chiplet和RISC-V)提供了良好的落地场景。


五、 主题分享三:RISC-V——AI的理想选择

上一节我们看到了AI对芯片的驱动,本节我们聚焦于为何RISC-V架构特别适合AI。RISC-V是一种开放、国际化的标准指令集架构(ISA)。

与x86和ARM相比,RISC-V具有以下核心优势,使其与AI需求高度契合:

  1. 开放性:完全开放,无需授权费用,降低了创新门槛,有助于防止AI算力被垄断。
  2. 模块化与可定制性:其指令集采用模块化设计,允许开发者添加自定义指令扩展。这对于AI应用至关重要,因为不同公司或垂直领域可能希望拥有自己独特的、安全的加速特性。
    • 公式化理解RISC-V SoC = 标准基础指令集 (Base ISA) + 可选标准扩展 (如V向量扩展) + 自定义指令扩展 (Custom Extension)
  3. 新兴且持续发展:作为较新的架构,可以更好地融入AI等新需求。
  4. 活跃的生态系统与人才储备:拥有充满热情的开发者社区和学术界的大力支持,有利于软硬件生态的繁荣。

市场预测显示,在AI加速器领域,RISC-V的占比预计将显著高于其在整体处理器市场中的份额。


六、 主题分享四:多功能RISC-V处理器赋能AI创新

上一节我们讨论了RISC-V的特性优势,本节我们通过一个具体案例,看企业如何利用RISC-V构建AI算力解决方案。公司利用RISC-V的“多才多艺”特性来应对AI算力挑战。

无处不在的AI算力需求
AI算力需求遍布云端数据中心、边缘和终端设备。公司提供从IP授权到芯片,再到服务器的全栈解决方案,以满足不同场景的需求。

RISC-V在AI加速器中的关键角色
在其AI加速器芯片中,集成了多个小型、高效的RISC-V核心。这些核心并非用于通用计算,而是各司其职,专门负责指挥数据搬运、向量/矩阵运算单元等任务,实现了高效的并行处理。

// 概念性代码:描述AI加速器中RISC-V核心的分工协作
RISC-V_Core_1: 负责从外部搬运数据到本地存储;
RISC-V_Core_2: 指挥向量计算单元执行运算;
RISC-V_Core_3: 将结果从寄存器写回存储并发送给下一个处理单元;

这种设计充分利用了RISC-V可定制、高效率的特点。

高性能RISC-V CPU的作用
除了在加速器中作为“管理者”,高性能的RISC-V CPU也旨在数据中心场景中,逐步替代x86作为主机处理器,负责虚拟化、安全管理和任务调度等。同时,它也能作为AI计算图的一部分,处理那些不适合用加速器执行的通用计算任务。

RISC-V的可扩展性、高能效和丰富的IP生态,使其在AI算力硬件中扮演着越来越重要的角色。


七、 主题分享五:生成式AI的释放与RISC-V的变革力量

上一节我们看了具体的设计实例,本节我们将视角拉回宏观,探讨如何通过架构创新来满足AI算力增长。AI将深刻改变各行各业,但当前硬件算力的增长已跟不上AI软件的需求。

算力供需的巨大缺口
计算能力的供应增长缓慢(受限于物理定律),而AI对算力的需求却在爆发式增长,形成了巨大缺口。这既是挑战,也是通过新架构进行创新的机会。

数据中心架构的演进方向
为了提升效率和灵活性,数据中心架构正向以下方向演进:

  • Chiplet:实现异构集成,混合匹配不同工艺、功能的芯粒。
  • 解耦:将计算、内存、存储资源池化,通过DPU(数据处理器)互联,按需分配。
  • 动态可重构:处理器能够根据实时工作负载动态调整资源配置(如整数/浮点寄存器),以提升能效。

RISC-V的核心价值
RISC-V的可定制指令集特性,正是实现上述动态可重构等高级架构创新的理想基础。它允许厂商在保持软件兼容的前提下,进行深度的硬件优化。推动RISC-V开放标准的持续演进和生态系统建设,对于释放AI潜力至关重要。


八、 圆桌讨论:生成式AI的融合与创新

前面的演讲分别从技术、产业、硬件等角度进行了阐述,本节我们通过圆桌讨论,汇总一些前沿的交叉议题。

议题一:AI的安全与治理
生成式AI的快速发展可能带来失业、信息失序(如幻觉问题)乃至系统失控(超级智能)的风险。治理方案可能包括:

  • 分级管控:对超级大模型采取类似核武器的严格国际管控。
  • 技术平衡:在消除有害“幻觉”和保留创造性之间取得平衡。
  • 经济调节:探索征收“AI税”或建立补偿机制,用以应对社会冲击和促进公平。

议题二:大模型生态:专制还是民主?
未来可能形成少数几个“超级大模型”垄断,也可能出现众多“主权大模型”共存的局面。前者可能导致知识生产单一化,后者则面临效率与资源分散的挑战。这需要全球在发展与安全、集中与分散之间寻找平衡。

议题三:AI芯片架构的演进
AI驱动计算架构进入创新活跃期。专用集成电路(ASIC)能获得极致性能,但灵活性差;通用GPU(GPGPU)生态*大,但能效有优化空间。趋势是在专用与通用之间寻找最佳平衡点,而RISC-V因其可定制性,能很好地支撑各种DSA(领域专用架构)创新。

议题四:RISC-V的突围之路
在x86和ARM主导的市场上,RISC-V如何突破?其机会在于:

  • 新兴AI市场:AI领域尚无绝对垄断的硬件生态,RISC-V凭借能效和定制化优势有望切入。
  • 增量市场:智能汽车等对芯片有定制化、高安全、实时性要求的新兴领域,是RISC-V的理想落地场景。
  • 生态共建:通过推动接口标准(如Chiplet的UCIe)、共享基础平台,降低创新成本,壮大生态。

议题五:DPU——数据中心的新枢纽
DPU正在成为数据中心的核心,负责网络、存储虚拟化和安全。专注于数据处理的厂商(如MIPS)正将其在数据移动方面的传统优势与RISC-V的可定制性结合,致力于在这一新兴领域取得突破。


总结

在本节课中,我们一起学习了RISC-V与生成式AI融合发展的全景图。我们从大语言模型的第一性原理出发,认识到AI对算力的巨大需求与能耗挑战。进而,我们探讨了RISC-V如何凭借其开放性、模块化、可定制性和高能效特性,成为应对这些挑战的理想硬件基础。通过具体的芯片设计案例和产业分析,我们看到了RISC-V在云端AI加速器、高性能CPU以及汽车电子等关键领域的应用潜力。最后,圆桌讨论揭示了AI发展伴随的治理、生态和架构选择等深层问题。总体而言,RISC-V与AI的结合,正为计算产业带来一场深刻的变革,为全球创新者提供了新的机遇。

49:2024世界人工智能大会智能财务论坛精华解读 📊🤖

概述

在本课程中,我们将系统性地学习2024世界人工智能大会智能财务论坛的核心内容。本次论坛以“新质经济,智慧财务”为主题,汇聚了政界、学界、产业界的众多专家,共同探讨人工智能技术与财务领域深度融合的前沿趋势、实践案例与未来挑战。我们将对论坛的致辞、主旨演讲、研究报告发布及圆桌讨论进行梳理和解读,旨在为初学者提供一个清晰、全面的智能财务入门指南。


第一节:论坛开幕与领导致辞 🎤

智能财务论坛在庄重的氛围中拉开帷幕。主持人*调了人工智能、机器学习、大数据分析等技术在财会领域的成功应用,为智能财务开创了崭新领域。本次论坛由上海国家会计学院与汇付天下有限公司联合主办,并得到了多家战略合作与支持单位的协助。

以下是出席论坛的主要领导和嘉宾名单:

  • 财政部会计司副司长 王东
  • 财政部会计司制度三处处长 杨海峰
  • 上海市经信委软件与信息服务业处处长 裘薇
  • 中国科学院院士、复旦大学光电研究院院长 褚君浩
  • ACCCA政策与洞察总监 Mike Sfield
  • 上海国家会计学院院长、党委副书记 卢文斌
  • 汇付天下董事长兼CEO 周晔
  • 金蝶集团董事会主席兼CEO 徐少春
  • 中信银行上海分行党委书记、行长 赵元新

王东副司长在致辞中指出,人工智能是新一轮科技革命和产业变革的重要驱动力。财政部高度重视会计信息化与智能财务发展,新修订的《会计法》专门增加了加*会计信息化建设的条款,为相关工作提供了法律保障。目前,财政部正积极推进会计信息化标准建设,并联合多部委开展电子凭证会计数据标准试点,为会计工作数字化转型奠定基础。

裘薇处长代表上海市经信委致辞,她*调人工智能技术正在催生新的应用场景和业态。市经信委正积极推动人工智能与实体经济深度融合,打好包括“产业赋能升级攻坚战”在内的六大攻坚战。她认为,智能财务是企业数字化转型的必由之路,需要技术创新、行业协同共同推动。

卢文斌院长作为主办方代表致辞。他指出,发展新质生产力的核心在于创新,以大数据、人工智能为代表的科技创新正在深刻变革财务管理。上海国家会计学院作为国家级财经人才培养基地,已开设智能财务系列课程,并依托智能财务研究院搭建了政产学研平台,未来将继续深化智能财务的理论研究和应用探索。

单振雷行长助理代表中信银行致辞。他介绍了中信银行在智能科技方面的努力,包括构建“AI+BI”双轮驱动的技术生态、落地超千个AI应用场景、打造“天元司库”系统等,展现了金融领域智能财务的前瞻性和创新能力。


第二节:主旨演讲精要(上)—— 宏观趋势与技术基石 🧠

上一节我们了解了论坛的概况与政策导向,本节中我们将聚焦两位专家从宏观趋势和信息技术角度带来的深刻洞察。

褚君浩院士:智能时代与管理科学

褚院士的分享围绕三个核心问题展开。

1. 智能时代的大趋势
我们正从信息化时代迈向智能时代,其特征是智慧(人工智能)融入物理系统和各产业,包括管理科学。新事物、新技术(如文生视频、人形机器人、脑机接口)将快速涌现。智能化系统的三大支柱是:动态感知、智慧识别、自动反应

2. 信息的获取与认知
这是实现智能化的两个关键技术。

  • 实时感知(传感器技术):如同人类的五官,用于收集各类数据。褚院士以红外传感器为例,展示了其在安防(检测危险物品)、农业(识别坏果)、医疗(热成像诊断)等领域的广泛应用。其原理是物质运动形态的相互转化(如光电效应)。
  • 智慧分析(大数据分析):对感知到的大数据进行处理与分析,以构建智慧城市、实现智慧管理。其思想对管理科学同样适用:收集信息 -> 分析信息 -> 判断决策

3. 人工智能与管理
人工智能(如图像识别、语言处理)可以高效管理海量数据、挖掘有效信息、避免工作失误、提高效率、完成重复性工作,并通过数据分析预警潜在风险。褚院士总结道,“实时感知、大脑分析、采取措施” 的思想是自然科学、技术科学与管理科学的共同内核。迎接智能时代,需要积极发展人工智能并融入实体世界。

Mike Sfield先生:人工智能在会计与金融中的价值解锁

ACCA的Mike Sfield先生分享了其对AI在财会领域应用的观察与反思。

1. 广阔背景下的AI
必须将技术变革置于更广阔的地缘政治、经济和ESG趋势背景下来理解,才能把握其机遇与局限。会计行业必须持续创新,会计师将在组织转型和可持续价值创造中扮演核心角色,而技术(尤其是AI)是赋能的关键。

2. AI在财务中的应用现状与机遇
ACCA的研究将AI分为几类:用于预测的机器学习、用于数据提取的计算机视觉、用于文本分析的自然语言处理以及生成式AI。核心在于增*而非仅仅自动化。初步调查显示,全球范围内AI在财务规划与分析、数据分析和交易性财务任务中应用最广,而中国企业在将AI作为生产力工具方面 adoption 更快。

3. 如何起步:四大关键要素

  • 数据:AI本质是数据转换。需评估数据质量、类型和治理。
  • 战略与创新:需平衡自上而下的战略与自下而上的创新,数字领导力至关重要。
  • 灵活性与耐心:AI项目需要实验、时间和持续改进。
  • 协作:鼓励跨组织知识共享和最佳实践交流。

4. 技能提升与风险管理
调查显示,会计师对AI普遍乐观,但也对岗位影响和技能更新感到担忧。需要提升AI素养,对不同角色(如数据分析师与财务领导者)的技能要求应有所侧重。同时,必须管理AI的风险,如算法的可解释性、数据偏见以及生成式AI的幻觉问题。人类判断和明确的责任线必须嵌入任何AI应用。

5. 生成式AI的挑战与潜力
生成式AI投资巨大,但尚未进入“生产力高原”。需区分其现有能力(如翻译)、能力前沿(复杂、模糊任务)和未来潜力。必须认识其根本局限(如无法保证100%准确),并在理解错误成因的基础上进行负责任实验。


第三节:主旨演讲精要(下)—— 产业实践与未来展望 🚀

上一节我们探讨了智能时代的宏观图景和AI赋能财务的框架,本节我们将深入产业实践,看看领先企业如何布局,并展望财务管理的未来形态。

周晔董事长:财务——从数据原生到智能跃迁

周晔先生以一个“外行”的视角,提出了两个核心观察:

  1. 财务是现代商业的基础,决定公司经营管理质量。
  2. 财务从诞生起就是充满科技感的行业。

1. 财务的数据原生基因
1494年,数学家帕乔利在《数学大全》中阐述了复式记账法,首次系统性地用数据记录经营行为,用货币度量世界,建立了物理世界在数字世界的映射模型。这甚至早于现代科学定量观察世界的方法。因此,财务人员本质上是原生的数据工作者

2. 数字化与智能化的新挑战
然而,从“数据工作者”到实现“数字化”和“智能化”并非易事。现代数字化需要处理海量、高速、连接的云端生态数据,并建立数据模型以支持多维度观察。这需要数据连接器(如API)和数据中台,对大多数企业而言是一项耗时数年的系统工程。

3. 从流程自动化到超级自动化
传统上,企业通过梳理专家经验,建立人和人协同的工作流程。下一步是利用低代码/无代码工具实现流程自动化。而当前以大语言模型为代表的AI突破,结合RAG(检索增*生成)和Agent(智能体)技术,使得机器不仅能调用知识,还能自动进行任务编排,迈向超级自动化。未来可能是一个由智能体而非软件构成的世界。

4. 实践案例

  • 对账:某餐饮企业每日自动处理20万条跨平台数据对账并生成凭证。
  • 合券核销:某冷饮企业通过自动化对账,避免每年超千万损失。
  • 报表生成智能开票也已实现自动化。

张少峰总会计师:中国石化的智能财务实践与思考

张总分享了中国石化在智能财务建设中的实践、应用与冷思考。

1. 信息化建设历程
中国石化历经业务财务一体化财务管理体系化数据管理集中化财务管理高效化数据应用生态化五个阶段,以ERP系统建设为抓手,实现了全集团业财一体化管理。

2. 智能财务应用

  • 流程自动化:推出“响当当”RPA机器人,月省人工3.5万小时。
  • 风险识别:构建信用风险管理系统,监控超36万家交易对手;建立异常贸易识别模型,扫描千万笔业务。
  • 合规审查:利用OCR和规则库实现财务单据自动化审核。
  • 经营决策:运用一体化产业链优化模型和智能加油站经营决策模型。

3. 实践中的思考
张总提出了五个亟待解决的问题:

  • 理论构建:需要一套可参考的智能财务管理方法论。
  • 职责边界:数据融合应用下,财务部门的职责如何界定?
  • 数据治理:传统会计数据与刻画管理场景所需的事项数据如何标准化与融合?
  • 技术匹配:大模型的不可解释性与财务规则的精确性存在矛盾。
  • 人才培养:如何培养兼具专业财务知识、业务知识、数据分析与智能技术的通才?现有人员断层问题如何解决?

徐少春主席:AI时代财务管理的“变”与“不变”

徐少春先生结合30余年行业经验,畅谈AI对财务管理的深刻影响。

1. 七大变化

  1. 价值模型之变:从“陀螺型”(核算运营占比大)转向“沙漏型”(核算被AI替代,战略与支撑体系价值放大)。
  2. 预测能力之变:从经验预测到AI精准预测,如兵棋推演。
  3. 信息获取之变:从数据专享到信息普惠,人人皆可借助AI助手进行数据分析。
  4. 专家服务之变:从个人精英到“AI天团”,拥有跨领域综合技能。
  5. 报告范畴之变:从财务指标到包含ESG等的发展能力综合评价
  6. 系统形态之变:从复杂菜单到极简前端+智能后台的交互模式。
  7. 财务人员之变:从观望者到拥抱者,需具备AI思维处理海量数据。

2. 核心不变
在诸多变化中,财务创造价值的目标、合规性原则、伦理道德以及人类的良知、想象与梦想不会改变。徐主席*调,应以良知为定海神针,以AI为万变利器,拥抱财务管理新世界。


第四节:研究报告发布与圆桌讨论精华 💡

上一节我们领略了企业家的实践与哲思,本节我们将关注行业研究的成果,并聆听来自不同领域专家关于落地挑战的圆桌讨论。

刘勤院长:《2024中国企业财务智能化现状调查报告》发布与解读

上海国家会计学院智能财务研究院院长刘勤发布了年度白皮书,并分享了关键发现。

1. 智能财务发展回顾
中国财务信息化始于1979年,历经电算化、信息化走向智能化。智能财务研究在2018年后进入扩散期。研究院从基础研究、关键技术跟踪、最佳实践评选等多方面推动行业发展。

2. 调查报告核心发现

  • 建设动机:首要驱动力是财务转型内在需要支撑战略与价值创造
  • 关键因素组织因素(如领导力、文化)被认为比技术因素更重要。
  • 管理方式人机协同仍是主流预期,但认为AI将“取代人力专家”的比例在上升。
  • 技术应用电子发票、移动互联网、移动支付采用度最高;会计核算、费用报销智能化需求最迫切。
  • 主要收益:主要体现在业务流程标准化/智能化提升管理控制水平,而非单纯的降本增效。
  • 人员担忧:最大的担忧是安全性、就业影响和数据处理能力

3. 未来趋势与挑战
未来趋势包括:智能财务理论突破、人机协同模式成熟、流程处理智能化、虚拟员工涌现、信息安全凸显、通用智能产品出现、专业人才短缺。智能财务研究院将继续在这些领域深化研究。

随后,在现场嘉宾的见证下,智能财务生态联盟成功扩容,更多企业、金融机构、科技公司加入,共同致力于构建开放、协同的智能财务生态体系。

圆桌讨论:智能财务助力企业开启数字时代

圆桌讨论由汇付天下金源先生主持,五位嘉宾分享了宝贵见解。

1. 业财融合与体系建设

  • 杨珊华(国药集团):业财融合概念因信息技术而生。构建智能财务体系需要理念、组织、技术、运营四大体系变革,推动财务边界向业务前端延伸。
  • *晓宇(东方航空):财务共享建设始于统一标准、优化流程。通过打破信息孤岛、建设数据中台(如智慧加油系统),实现数据自动流转,支撑精细化决策(如最优航路规划)。
  • 宋志鹏(中国化学工程):智能财务建设是系统工程。中国化学通过“134”平台架构、“393”实施步骤和“5到N”成果体系,实现了职能清晰、组织科学、流程畅通、作业高效、决策有力的目标。

2. 数据:标准、治理与应用

  • 周建军(上海市第一人民医院):数据标准化是基础。医院通过疾病编码、手术编码、人员资质、资产编码等多维度标准化,打通业务与财务数据,实现预算细化、成本精准、流程提速。
  • 曾超(久其软件):数据标准是软件基石。财政部推动的电子凭证数据标准是重要基础,实现了原始凭证数字化。高质量的数据能支撑合并报表、往来监控、关联交易核查乃至供应链金融等复杂应用。
  • 宋志鹏(补充):中国化学通过数据架构(治理层、建模层、应用层)、主数据平台和三大数据产品(导航仪、仪表盘、报告库),分层分级地服务战略、决策、业务、价值创造和风险防控。

3. 新质生产力、技术与人才

  • 杨珊华:新质生产力=科学技术革命性突破 × (生产要素创新性配置 + 产业深度转型升级) × (劳动力素质提升 + 生产资料优化组合)。智能财务建设既能推动新质生产力发展,也受其推动。
  • 曾超:影响会计行业的十大信息技术趋势显示:1)财务越来越数据驱动;2)数电发票等公共基础服务推动力巨大;3)AIGC潜力巨大,但需关注风险,财务垂直大模型是务实方向。
  • *晓宇:财务人员需向共享财务、业务财务、战略财务分流。未来更需要懂业务、懂IT、懂数据分析的复合型人才,财务人员需走进业务一线。
  • 周建军:复合型人才培养需融合财务核心知识、信息技术能力、所在行业业务知识。从业人员需保持学习,在实践中以问题和项目为导向,将知识转化为技能,同时坚守职业道德,保持自驱力。

总结

本节课中,我们一起学习了2024世界人工智能大会智能财务论坛的核心内容。我们从政策导向、宏观趋势、技术原理、产业实践、行业研究等多个维度,全面了解了智能财务的发展现状与未来方向。

关键共识包括:

  1. 政策与法律层面已为智能财务发展提供支持与保障。
  2. 技术驱动:AI,特别是大模型和智能体技术,正在推动财务从自动化向超级自动化演进。
  3. 数据核心:数据是智能化的基石,其标准化、治理与应用能力决定智能财务的成败。
  4. 价值重塑:财务的价值创造重心正从核算记录转向战略支撑、业务服务和风险预警,模型向“沙漏型”转变。
  5. 人机协同:AI并非简单替代人力,而是增*财务人员能力,未来主流模式是人机协同共生。
  6. 生态共建:智能财务发展需要产学研用各方协同,构建开放融合的生态体系。
  7. 人才挑战:培养兼具财务专业、业务洞察、数据技术和AI思维的复合型人才是当务之急。

智能财务的变革不仅是技术的进步,更是管理理念、组织模式和人员能力的全面升级。拥抱变化,持续学习,方能在数字时代把握财务管理的未来。

50:2024世界人工智能大会启明创投创业与投资论坛精华解读

课程概述

在本节课中,我们将学习2024世界人工智能大会启明创投创业与投资论坛的核心内容。本次论坛主题为“超级模型、超级应用、超级机遇”,汇聚了众多行业领袖、企业家和学者,共同探讨生成式人工智能(AI)的技术进展、商业应用前景及创业投资生态。我们将对论坛的致辞、主题演讲及圆桌讨论进行梳理,提炼关键观点,帮助初学者理解当前AI领域的发展脉络与未来机遇。


一、论坛开幕与领导致辞

论坛在上海开幕,汇聚了来自全国的人工智能创业企业、投资人、合作伙伴及媒体代表。

上海市徐汇区委副书记、代理区长王华先生首先致辞。他代表徐汇区人民政府对论坛召开表示祝贺。本次论坛是世界人工智能大会唯一一场由创业投资机构发起的分论坛,旨在从创投视角探讨生成式AI的时代机遇。启明创投作为国内领先的投资机构,在人工智能和大模型领域布局广泛,投资了多家优秀创新企业,为徐汇的经济发展做出了积极贡献。

徐汇区是上海国际科创中心的重要承载区,科技创新资源丰富。人工智能产业作为上海三大先导产业之一,主要集聚在徐汇区。区内拥有众多国家级、市级高校院所、科研机构及一流研究机构。徐汇区的人工智能产业入选全国首批战略性新兴产业集群,打造了中国首个大模型创新生态社区“模速空间”。目前,徐汇区已集聚170家大模型企业,其中22个大模型通过上线备案,占上海总量的三分之二。在金融服务方面,徐汇区成立了200亿规模的区级国资投资平台和科创投基金,并集聚了大量社会化标杆投资机构,正在打造上海首批股权投资集聚区。徐汇区是人工智能产业发展的沃土和投资的蓝海,欢迎各位嘉宾、投资人、企业家和创业者来到徐汇,共同书写人工智能创新创业的新篇章。

接下来,上海市经济和信息化委员会副主任张洪涛先生致辞。他指出,人工智能正以前所未有的速度和深度改变着各个产业,以大模型、人形机器人为代表的前沿技术正与社会经济广泛融合,成为发展新质生产力的重要引擎。**总理在大会开幕式上指出,上海在人工智能领域起步早、基础好,企业数量众多,技术创新活跃,并希望上海继续巩固优势,打造人工智能的上海高地。

过去几年,上海人工智能产业规模持续扩大,规上企业和产业规模实现倍增,创新成果不断涌现。已有34款大模型通过备案,产业创新生态日趋完善。上海拥有国际金融中心建设的条件,以及像启明创投这样独具慧眼的创投机构。上海市也设立了总规模达1000亿元的三大先导产业投资母基金,为未来发展创造了新条件。

下一步,上海将着力推进人工智能科技与产业创新融合,支持多模态大模型、智能芯片、具身智能等技术攻关突破,加速人工智能新技术、新业态、新模式在垂直领域的应用,培育开放活跃、有韧性的产业生态。同时,将着力促进产业金融互动,发挥基金的引导作用,鼓励社会资本创新金融产品和服务模式,以更大力度支持关键技术研发和产业创新发展。上海将持续营造国际一流的营商环境和投资环境,深化与国内外人工智能企业、科研院所、投资机构的合作,共享人工智能时代发展的新机遇。


二、主题演讲:技术突破到应用变革——AI发展的新篇章

启明创投主管合伙人周志峰先生发表了主题演讲。他分享了启明创投在AI领域的投资观察与策略。

启明创投是中国人工智能领域最活跃的创投机构之一,其特点在于投资早、布局丰富。公司自2006年成立起,就采用专业化团队的投资方法。2012年,团队识别到AlexNet带来的深度学习技术突破信号,从2013年开始系统布局人工智能。2020年,基于OpenAI的GPT-3论文,团队意识到生成式AI的新信号,并于2021年投资了多家大模型企业。

过去十年,启明创投在AI领域投资了近70亿元人民币,拥有五六十家*人工智能投资企业,其中约20家已上市或成为独角兽。通过与这些大模型企业的合作,启明创投能够更清晰地把握技术发展方向和应用落地脉络。

2024年,启明创投管理了一支100亿人民币规模的人工智能产业投资基金,能够接触到中国几乎所有优秀的AI企业。生成式人工智能依然是启明科技投资最重要的核心领域,团队对此信心更足,并增*了团队配置,将其视为一种横向能力进行布局。

周志峰先生分享了对AI乐观的原因。从资本角度看,2023年全球AI领域投资达224亿美元,超过过去十年总和,其中70%-80%投向了开发大模型的企业。他预计未来两三年,将有更多资金投向模型落地应用的企业。目前,生成式AI应用已在生产力工具、创意和陪伴三个领域初具规模。

他认为,AI与微处理器、互联网并列,是过去50年科技发展史上最大的三个浪潮,其核心是将数字化内容的创造制作成本降至近乎为零。中国在发展生成式AI方面拥有巨大市场优势,任何重大科技变革都需要巨大的资本投入,而巨大的市场是保证足够投入的前提。中国在打造超级应用方面经验丰富,自2010年以来,中国团队打造了三十多月活超5000万的应用,而美国团队仅打造了7个。

2024年,生成式AI的底层技术底座仍在高速动态发展,技术更加多样化。应用层面也涌现出更多品类。启明创投将重点关注七类生成式AI应用:垂直行业AI、企业AI、AI内容交互平台、AI工具、AI游戏、AI硬件和AI生成社区。

基于对400多家企业的调研统计,周志峰先生指出,过去一年生成式AI创业领域显著扩展:语言类应用占比下降,多模态应用占比上升至48%;出现了基于大模型技术的新应用领域,如AI搜索、AI游戏、AI社交和新的内容平台;更多创业公司深入到具体行业和场景;底层技术创业公司方向更加多元化。

从创始人画像看,主要有三类人群:顶级AI科学家、行业专家及产品运营资深人士、95后甚至00后的新锐创业者。目前,AI科学家创始人占比约三分之一,预计未来两年,第二类和第三类创始人的占比将持续显著上升。

在AI应用落地时,面临三个明显问题:成本、效果和留存。大模型调用成本在过去一年下降了1000多倍,未来仍有巨大下降空间。效果方面,除了“幻觉”问题,还需解决用户提出误导性问题时的回答策略,以及在细分场景中回答的准确性问题。目前第一波AI应用的留存率相对较低,如何让用户真正将AI产品融入生活是接下来应用发展的重要问题。

最后,周志峰先生分享了启明创投对AI发展的十大展望,并*调在AI热潮中需要保持耐心,踏踏实实干事,静待超级应用的出现。


三、主题演讲:攀登AGI的路径与实践——万亿参数与多模融合

阶跃星辰创始人兼CEO姜大昕先生分享了公司在通用大模型研发方面的探索与实践。

阶跃星辰成立于2023年4月,定位为研发多模态基础大模型的创业公司,目标是探索实现通用人工智能(AGI)的道路。公司成立一年多来进展迅速,汇集了计算机视觉、自然语言处理、搜索引擎、高性能并行计算等领域的顶尖人才。

公司首次亮相于2024年3月的全球开发者先锋大会,发布了Step系列大模型。在本次世界人工智能大会上,公司发布了万亿参数MOE大模型Step-2的正式版、升级版多模态理解大模型Step-1.5V(支持视频理解)以及多模态生成大模型Step-EX。

姜大昕先生认为,攀登AGI的路径有两个重要方向:Scaling Law(模型规模定律)和世界模型。Scaling Law指出模型性能随参数量、数据量和计算量呈幂次增长,OpenAI的发展已验证其有效性。从GPT-1到GPT-4,参数量增长超万倍,模型能力实现了本质飞跃。他认为Scaling Law在达到万亿参数后,可能还能再向上走两个数量级,达到百万亿量级。国外科技巨头投入巨资购买算力的行为,也表达了对Scaling Law的信仰。未来发展的限制可能在于数据、能源和投资回报率。

基于此认知,阶跃星辰在训练千亿参数模型Step-1后,于年底启动了万亿参数模型Step-2的训练。从千亿到万亿,训练难度提升不止十倍。团队在算力、系统、数据、算法“铁人四项”上加大投入并创新,最终成功训练出万亿参数混合专家模型。在多个权威评测集上,Step-2模型的得分已全面接近国际主流模型,并在某些测试集上实现超越。该模型仍有继续训练提升的空间。

多模态是构建世界模型的基础能力,也是通向AGI的必经之路。世界模型的演化可分为三个阶段:模拟世界(灌输人类数据与知识)、探索世界(与物理世界交互)、归纳世界(总结物理世界规律)。这三个阶段可以并行发展,但进化速度不同,越到后期越困难。目前多模态处于融合阶段,但视觉理解与生成模型仍是分开发展的,理解模型理解能力*但生成能力弱,生成模型则相反。将视觉生成和理解统一在一个模型内,是阶跃星辰下一阶段的重要探索方向。

阶跃星辰还展示了两款to C产品:效率工具“阶跃问答”和开放世界类应用“冒泡鸭”。同时,公司也在金融、财经、内容创作等领域与头部企业及政府部门展开深度合作,探索大模型落地经验。


四、主题演讲:灰盒可信技术释放大模型生产力

复旦大学浩清特聘教授、上海科学智能研究院院长、无限光年创始人漆远先生分享了在可信大模型方面的思考与实践。

他从技术和市场两个视角展开。技术视角上,他探讨了Scaling Law的红利与挑战。人脑约有百万亿级连接,但通常只有少量神经元被激活,工作方式稀疏。而当前大模型推理时全部激活,导致海量计算和能耗。他提出结合“快思考”(基于海量数据的黑盒模型,类似深度学习)和“慢思考”(逻辑推理,白盒模型)的“灰盒大模型”方向。

语言是交流工具,但未必是思考工具。逻辑推理和思考能力同样重要。将基于海量数据的黑盒神经网络与基于规则的逻辑推理白盒系统结合,形成灰盒大模型,是重要方向。数据决定了模型内部拟合的能力,而规则可以实现数据之外的推演(外插),发现未知规律。规则本身也需要在数据的支持下调整和进化。他认为,AGI在理性巅峰上的体现,是人工智能能像爱因斯坦一样,发现复杂世界的未知规律。

市场视角上,要将大模型作为生产力工具在金融、医疗、制造等领域落地,需解决幻觉问题、成本效能问题和高质量数据获取问题。底层技术必须与业务需求匹配,同时产品要深耕场景,实现技术与市场的结合。

无限光年专注于打造“神经符号”基础模型,即灰盒可信大模型,关心逻辑推理与海量数据处理的结合,以降低幻觉,解决专业性问题。公司打造的“金砖”模型规模并非最大,但在推理和理解能力上表现突出。在金融和医疗领域的权威评测中,其模型在多项指标上超越GPT-4。

公司坚持“模型一体”,深入金融、医疗等场景,打造真正能解决问题的应用。例如,与头部券商合作,利用金融大模型自动生成有观点、有思路的财报分析点评。公司也致力于将平台能力沉淀,赋能千行百业,提供从模型部署、数据工程到应用搭建的全套工具。

作为上海科学智能研究院院长,漆远先生还介绍了在科学智能领域的探索,如“伏羲”气象大模型,在全球气象预测中取得了领先的准确率。公司希望通过深耕场景、灰盒可信的技术,赋能千行百业。


五、主题演讲:构建AI Native基础设施

无问芯穹联合创始人兼CEO夏立雪先生分享了在AI基础设施层面的工作与思考。

AI大模型时代对基础设施的需求和挑战巨大。回顾AI发展历史,算力与算法互相迭代、互相补足。在大模型时代,支撑下一代模型的算力基础设施仍在构建中,这是超级机遇也是超级挑战。

大模型落地需考虑性价比。市场上有三类核心力量在推动落地:行业解决方案公司(有行业经验但AI能力不足)、行业互联网公司(有稳定业务需结合AI)、大模型公司(挑战模型能力上限)。这三类公司都面临算力成本高、获取难、使用门槛高的问题。

无问芯穹从技术层面将问题拆解为四个关键点:唤醒多元芯片算力、提升效率、提升易用性、调动端侧算力。公司的核心定位是解决M种模型到N种算力之间的连接(MxN),通过中间层连接体系,释放多元芯片潜能,打造高效整合多元异构算力的平台。

公司联合清华、上交发布了适用于大规模模型的异构分布式混合训练系统,首次实现在6种不同芯片品牌间进行交叉混合训练,千卡集群算力利用率达97.6%。该能力已集成到云平台,支持大模型一键混训。在推理方面,平台支持多种模型与计算卡的组合,用户可像组合套餐一样部署服务。

除了用起来,还需帮助大模型快速落地。公司在计算优化、系统性优化方面做了大量工作,提供全栈优化能力,并在十多种芯片上实现了世界领先的优化水平。在集群调度方面,构建了万卡级算力系统,调度延迟达毫秒级,资源利用率超90%。在端侧,公司也将云上软件开发经验迁移,推出了大模型加速的软硬件IP体系。

总结来说,无问芯穹通过四个层面的优化,持续降低大模型应用落地的成本。基础设施的作用是让成本下降到临界点,使更多人能拥抱新技术,未来使用AI时无需关心背后的算力来源。


六、主题演讲:U-ViT多模态大模型的变革与未来

生数科技联合创始人兼CTO鲍凡先生分享了公司在多模态大模型,特别是基于U-ViT架构的探索与实践。

生数科技基于U-ViT(一种扩散模型与Transformer的融合架构)构建多模态大模型技术栈。该工作早于OpenAI的DiT,并在2023年初验证了其*大的可扩展性。U-ViT架构简单,可将所有输入(图像、视频、文本条件等)统一为序列,充分利用大语言模型的工程和调参经验。

基于U-ViT架构,公司开发了UniDiffuser多模态扩散模型,能完成图文间所有分布的建模。大规模训练表明,该架构性能不逊于传统卷积架构,且随着参数量和数据量增大,能展现出更好性能,在生成中国元素、理解复杂语义等方面表现优异。

公司将U-ViT架构进一步拓展到3D生成、3D场景编辑等领域,并支持接入游戏等3D管线,方便落地。在视频生成方面,公司发布了Vidu模型,并进一步拓展生成长视频、加入音频能力及4D生成能力。视频生成可配合自然音效,提升体验。公司还能从单个视频中提取4D表示(3D+时间),并对其进行高精度编辑。

生数科技坚持全链路自主研发,从底层算法、训练分布式系统、数据获取到模型部署和工程化,具备完整体系。模型能力覆盖图像、视频、3D及即将投入的语音等模态,并从底层概率建模框架开始自研。


七、圆桌讨论一:具身智能——从技术突破到产业落地

本场圆桌由启明创投科技团队投资人周孝飞主持,嘉宾包括北京大学助理教授王贺、清华大学助理教授陈建宇、上海交通大学教授卢策吾。

1. 嘉宾介绍与创业契机

  • 王贺:北京大学助理教授,银河通用联合实验室主任。自2017年在斯坦福攻读博士时开始结合计算机视觉、图形学、自然语言和机器人技术研究具身智能。认为当前是将大模型的通用感知决策能力与机器人身体执行能力结合的绝佳机会。
  • 卢策吾:上海交通大学教授,穹彻智能联合创始人。2016年左右开始探索人工智能与机器人结合。提出“PIE”框架,希望让各种技能在各种产业场景下泛化。于去年创立公司,已推出第一代产品“穹彻具身大脑”。
  • 陈建宇:清华大学助理教授,心动纪元创始人。早期从事传统机器人研究,后关注*化学习与机器人的结合。2022年因看到特斯拉、小米等入局人形机器人,预判产业将快速聚焦,于是创立公司,专注人形机器人与具身智能。

2. 什么是具身智能的最优身体形态?

  • 陈建宇:最优形态取决于应用场景。人形机器人在操作(双手)和移动(双腿)能力上限更高,且类人形态便于通过遥操作或人类数据获取训练数据。
  • 卢策吾:终局形态由商业结果迭代决定。人形机器人是重要载体,但不同场景可能需要不同形态。关键在于智能内核,公司可服务于各种机械形态。
  • 王贺:人形机器人目标是通用性,未来可能是通用机器人市场的最大公约数。但从现在到终局需要可行路径,需每一步都有健康商业模式。银河通用采取务实方案:上半身拟人(双臂),下半身采用轮式底盘+单腿结构,以较低成本实现从地面到2.4米高度的全空间操作,未来会拥抱全腿方案。

3. 技术范式、进步与瓶颈

  • 王贺:关注“小脑”技能的泛化与通用性。当前很多操作技能依赖遥操作,数据采集成本高。银河通用发力合成数据,用十亿级合成数据训练抓取技能,实现了对透明、金属、柔性等各类物体的泛化抓取。
  • 卢策吾:抓住两个要素:对世界的理解(世界模型)和鲁棒的决策。引入力位融合的触觉反馈机制,可大幅提高鲁棒性并降低训练数据需求。公司演示的叠衣服等任务展示了其通用性与鲁棒性。
  • 陈建宇:大脑与小脑的架构未必是最终形态,值得探索端到端大小脑融合。物理世界的数据应反馈给大语言模型,但目前让物理数据有效反馈至大模型层面仍存在挑战,这是一个有趣的研究方向。

4. 产业化的拐点与挑战

  • 陈建宇:具身智能的“GPT时刻”尚未到来。判断拐点可参考两个标准:一是机器人能否接受所有人公开挑战;二是能否通过机器人的图灵测试(用户无法区分是自主还是遥操作)。
  • 卢策吾:具身智能的发展是逐步、分批的。无穷任务可分解为有限基本技能的组合。发展模式是一批技能达到“GPT时刻”,商业飞轮就能转起来。他提议明年大会可设置公开挑战环节。
  • 王贺:机器人需在场景中有胜任力才能落地。银河通用聚焦于移动抓取

51:AI赋能海洋——智能技术促进船舶产业焕新 🚢

在本课程中,我们将学习人工智能技术如何赋能海洋产业,特别是其在推动船舶工业智能化、数字化转型方面的关键作用。课程内容整理自一场高端学术论坛,涵盖了行业现状、技术挑战、创新案例及未来展望。


论坛开幕与嘉宾介绍 🎤

论坛正式开始。主持人*璐代表上海船舶研究设计院欢迎各位嘉宾莅临“AI赋能海洋——智能技术促进船舶产业焕新暨2024年度中国智能船舶创新联盟高端学术论坛”。该论坛是世界人工智能大会中唯一面向船舶产业的分论坛,已连续举办三年,在业内形成了广泛影响力。

本届论坛以“智能技术促进船舶产业换新”为主题,邀请了来自十多个国家和地区的专家学者与技术实践者,旨在共同探讨人工智能技术创新如何促进船舶产业发展。

以下是莅临本次论坛的主要领导与嘉宾名单:

  • 中国工程院院士吴有生
  • 葡萄牙工程院院士 Carlo Guedes Soares
  • 中国船舶集团科技与信息化部主任赵同斌
  • 中国船舶集团科技与信息化专务夏良胜
  • 上海市海洋局副局长金宏松
  • 浦东新区商务委员会副主任董晓玲
  • 中国船级社副总裁赵晏
  • 璞跃中国首席执行官徐洁平
  • 招商局能源运输股份有限公司总轮机长吴建移
  • 上海交通大学党委宣传部部长吴浩
  • 中国智能船舶创新联盟专家委员会委员、江南造船集团有限责任公司科技委主任胡可一
  • 江苏省船舶工业行业协会主任委员吴仁贵
  • 中船动力集团有限公司集团首席专家朝辉
  • 北京海兰信数据科技股份有限公司总工程师*常伟
  • 上海船舶研究设计院科技委主任、中国船舶集团学科带头人王刚毅
  • 中国智能船舶创新联盟成员单位代表、中国船级社上海规范所所长崔玉伟
  • 上海船舶设备研究所副所长季建刚
  • 大连船舶重工集团有限公司副总工程师关英华
  • 上海船舶运输科学研究所有限公司副总裁吴宗岱
  • 武汉理工大学教授刘祖源
  • 主办单位代表:上海船舶研究设计院院长吕智勇、党委书记王麟、上海张江集团有限公司董事长袁涛

此外,现场还有来自政府机构、国内外企业、行业联盟及媒体的众多代表。


主办方致辞与论坛主旨 🤝

上一节我们介绍了与会嘉宾,本节中我们来看看论坛主办方代表的致辞,他们阐述了举办本次论坛的背景与核心目标。

上海船舶研究设计院院长吕智勇致辞

吕智勇院长首先对各方支持表示感谢。他指出,人工智能是推动经济社会高质量发展的重要引擎,而船舶工业是其创新与落地的最佳场景之一。发展智能船舶,推动行业数字化升级与智能化转型,是实现造船*国目标的重要途径。本次论坛旨在搭建沟通协作的桥梁,探索AI技术创新,促进船舶工业新质生产力发展。

上海张江集团有限公司董事长袁涛致辞

袁涛董事长表示,张江集团已连续四年与上海船舶设计院联合主办该论坛。在“向海图*”战略下,智慧海洋与智能船舶是上海落实海洋*国战略的重要抓手。张江科学城正积极开辟海洋产业新赛道,并通过“AI+海洋科创中心”这一创新载体,共同推动海洋创新生态建设。

上海市海洋局副局长金宏松致辞

金宏松副局长指出,上海正大力发展海洋经济,人工智能已覆盖海洋装备制造、海上风电、海洋监测等领域。未来,上海将从三方面激发海洋发展活力:营造良好创新生态、培育海洋新质生产力、推动“卡脖子”难题协同攻关,让智能技术成为驱动海洋产业升级的*大引擎。

中国船舶集团科技与信息化部主任赵同斌致辞

赵同斌主任*调,人工智能是推动科技和产业发展的关键驱动力。中国船舶集团将以AI赋能产业换新为主线,在智能海洋装备、智能配套、智能生产等领域积极布局,打造船舶领域人工智能生态,为落实海洋*国战略提供新质生产力。


主旨演讲:智能船舶技术研发与产业化落地 💡

在听取了主办方的宏观展望后,本节我们将深入技术层面,关注智能船舶具体的研发进展与产业化思考。

演讲嘉宾:*鑫(上海船舶研究设计院副院长)

*鑫副院长分享了关于智能船舶技术研发及产业化落地的思考。他提出,当前智能船舶主要沿两个技术方向发展:数字化(已有大量商业应用)和自主化(处于测试与数据积累阶段)。

在研发思考方面,他*调了三点:

  1. 场景与需求至关重要:AI软硬件系统的落地与客户场景紧密相关,直接影响算法应用与数据训练。
  2. 数据共享与治理是挑战:数据作为资产,其使用、治理和标准制定是行业面临的新课题。
  3. 服务模式需创新:船舶行业参与方众多,需探索适应不同需求的服务模式。

对于自主系统,他分析了感知、决策、控制三大核心环节的技术难点。产业化落地则需关注测试验证(基于海量数据)、商业模式(产业链协同)以及技术标准与数据分享机制的建立。

演讲嘉宾:Carlo Guedes Soares(葡萄牙工程院院士)

Soares院士分享了无人自主水面船舶的研发进展。他提出,航运业正在经历由数字化和人工智能驱动的第四次革命(Shipping 4.0)。智能技术是实现向自主航运过渡的工具。

他详细阐述了智能导航系统的关键功能:船舶监控与信息系统避碰系统自主导航系统。人工智能能在信息处理速度和决策质量上提升这些算法的性能。

然而,推动智能船舶发展不仅需要技术,还需要组织措施,如改变操作员角色、增*远程控制潜力等。尽管自主航运在安全、经济等方面存在驱动力,但也面临成本增加、设备故障、网络安全以及需要新的法律框架和岸基监控系统等挑战。国际海事组织(IMO)已定义了四个自主化等级,目前行业正处于第1级和第2级之间。


行业报告发布与人工智能趋势分析 📈

了解了具体技术挑战后,我们需要把握行业的整体发展脉络。本节将发布最新的智能船舶行业报告,并分析全球人工智能的总体发展趋势。

《2024中国智能船舶行业发展报告》发布

报告主创代表顾一清女士介绍了《2024中国智能船舶行业发展报告》。本年报告主要包括两大部分:

  1. 远洋船舶篇更新:更新了MASS最新进程、智能船舶发展现状、国内外技术对比分析,并增加了大模型技术的关键技术路线图。
  2. 全新内河船舶篇发布:该篇由武汉理工大学主编,梳理了我国内河智能船舶技术与产业现状,分析了内河与远洋航运场景的差异,提出了面向内河船舶的五个智能化分级(增*驾驶、辅助驾驶、远程驾驶、有条件自主航行、完全自主航行),并梳理了关键技术的发展路径与目标。

演讲嘉宾:胡坚波(中国信息通信研究院副院长)

胡坚波副院长分享了全球及中国人工智能的总体发展趋势。他指出,人工智能发展已进入大模型阶段,其特点是遵循规模定律、支持多任务、能力可塑性*。发展路径有两条:横向追求更大规模的通用智能,纵向与行业结合实现快速工程化落地。

在中国,政府高度重视AI发展,并提出“人工智能+”行动。中国拥有市场、场景、数据量的优势。大模型在企业侧的应用探索不断深入,但在工业领域仍处于初级阶段,面临场景选择、时效性、可信度及工程化等挑战。

未来,AI将迈向更开放的智能体,与垂直行业的结合是实现工程化、构建商业闭环的关键。这需要模型平台、数据治理、运维管理和风险管控等方面的支撑。


创新实践:多模态大模型与国内外案例 🚀

理论趋势需要实践验证。本节我们将看到人工智能技术在船舶领域的前沿应用实践,包括多模态大模型的研发以及来自国内外的创新案例。

演讲嘉宾:马枫(武汉理工大学智能交通系统研究中心)

马枫教授分享了面向新一代航运系统的多模态大模型研发实践。团队最初研发的“航新脑1.0”采用规则化建模,但韧性不足。之后转向模仿船员思维,利用深度*化学习,并最终研发了多模态大模型 NavigationGPT

该模型的核心价值在于利用潜空间实现泛化能力,使其能够处理未见过的场景。目前,该模型已在航道理解、视觉到控制直接链接等方面取得进展,并初步具备模仿船员思考的能力。对于航运企业应用,他建议采用“内核使用、部署开发、个性提示”的分层策略,将大模型作为引擎进行适配。

2023年度AI赋能海洋创新实践案例发布

国外案例(由璞跃中国首席执行官徐洁平发布)

以下是五个具有代表性的国外创新案例:

  1. 达飞集团(CMA CGM):基于OCR和AI技术的提单自助服务系统。
  2. Orca AI(以色列):利用热成像和低光摄像头,在低能见度下进行目标识别与风险预警的系统。
  3. MARITIME AI(韩国):利用卫星传感和全球数据构建海洋大数据平台,用于天气预测等。
  4. Dexter(德国):端到端的船舶碳排放监测、预测与ETS交易平台。
  5. Sea Machines(美国):专注于自主航行解决方案的公司。

国内案例(由AI+海洋科创中心常务副主任赵辉发布)

以下是五个具有代表性的国内创新案例:

  1. 上海交通大学:绿色智能校园水上无人物流配送系统,打造校园水陆空协同物流。
  2. 哈尔滨工程大学:数字孪生智能科研试验船“海豚一号”,装备我国首套船舶数字孪生系统。
  3. 云遥宇航:计划构建90颗卫星组成的气象星座,为全球航运提供精准气象数据服务。
  4. 南方海洋实验室:智能型无人系统母船“珠海云”,具备远程遥控和自主航行能力,已完成超千海里自主航行实验。
  5. 中国船级社与项目方:高智能自主伴航拖轮“青港拖36”,全球首艘具备自主伴航功能的智能化拖轮,旨在解决大型船舶靠离泊时的安全与效率痛点。

院士访谈:深度洞察与未来展望 🧠

在了解了大量技术案例后,我们更需要顶尖专家的深度洞察。本节通过院士访谈,探讨智能船舶发展的核心挑战、跨界融合及人才培养等战略问题。

主持人*鑫与两位院士展开了对话。

  • 关于智能技术试验船:吴有生院士介绍了正在建造的智能技术试验船。该船旨在作为海上实验室,解决智能航行软件考核、全船设备智能控制可靠性验证等关键问题,为全国智能船舶技术研发提供公共测试平台。
  • 关于自主航行的主要挑战:Carlo Guedes Soares院士认为,当前主要挑战不在导航技术本身,而在法律框架、故障应对机制、远程通信可靠性以及岸基支持系统等非技术层面。
  • 关于AI落地场景与产业变革:吴有生院士指出,AI将在研究、设计、制造、运行四个层面带动船舶产业发展。他举例说明了AI在螺旋桨优化设计中的应用,并*调需重点关注智能制造配套设备智能化
  • 关于与汽车行业的差异:Soares院士指出,船舶控制更复杂(惯性大)、定位精度要求不同、故障后果更严重,因此实现自主航行比汽车面临更大挑战。
  • 关于跨界融合:吴有生院士*调,船舶行业需与信息技术、电子技术等领域优势力量结合,尤其在智能制造和航行智能优化方面。
  • 关于人才培养:Soares院士认为,在高级教育中应引入AI相关课程和实践,让学生具备开发应用的能力;对于操作员,重点在于使其熟悉最终产品。

圆桌对话:聚焦船舶网络安全 🔒

随着船舶智能化,网络安全成为重中之重。本节围绕刚刚*制实施的国际船舶网络安全规范,邀请全球主要船级社专家进行圆桌讨论。

主持人顾玉清与五位船级社专家探讨了船舶网络安全的实施与挑战。

  • 与陆地行业的差异:DNV的宋炜仲认为,主要是实施时间线的不同,船舶业正逐步跟上网络安全管理的步伐。
  • 为何需要规范:CCS的蔡玉良指出,船舶智能化与系统互联互通带来了固有的网络安全风险,IMO规范旨在建立通用的最低网络安全韧性要求。
  • 基于目标的方法:BV的Polo Shao解释,规范采用基于目标的方法,允许根据不同船型、项目和管理体系来实施,更具灵活性。
  • 对各相关方的挑战:LR的*林分析了船东(需建立管理体系)、船厂/集成商(设备准备与成本评估)、船级社(人员培训)及设备商面临的挑战,并指出船舶长生命周期与网络技术快速迭代的矛盾。
  • 关键保护措施建议:NK的Shingo Kumai详细阐述了规范中七个方面保障措施的实施要点,并特别建议采用白名单机制和部署网络监控与入侵检测系统以增*防护。

论坛总结与实验室揭牌 🎉

在论坛的最后,进行了两项重要活动。

首先,为应对船舶数字化带来的网络安全新挑战,上海船舶研究设计院船舶信息研究中心联合建设的 “海洋装备数字安全实验室” 正式揭牌。该实验室将致力于船舶网络韧性安全、数据治理与安全等创新技术研究。

随后,主持人宣布本届论坛圆满结束。智能技术的融入正引领船海产业进入全新时代,随着技术进步与应用深化,产业将迎来更广阔的发展空间。


课程总结 📚

在本节课中,我们一起学习了人工智能赋能海洋船舶产业的全面图景。我们从论坛的宏观背景出发,深入探讨了智能船舶的技术研发难点、产业化落地思考,分析了行业发展趋势与创新实践案例,并聆听了院士对发展路径的深刻洞察。最后,我们聚焦于伴随智能化而来的关键挑战——船舶网络安全。通过本课程,我们可以看到,AI技术正从研发、设计、制造、运营等多维度驱动船舶产业进行深刻变革,而应对技术、标准、安全、人才等方面的挑战,需要产学研用全产业链的协同努力。

52:AI时代的人才培养与产业发展 🚀

课程概述

在本节课中,我们将学习人工智能时代下,人才培养、政策支持、教育变革以及产业投资等多个维度的核心议题。课程内容整理自一场高端论坛,涵盖了政府政策、顶尖学府实践、企业人才战略及产业创新案例,旨在为初学者提供一个全面、清晰的AI人才发展全景图。


第一节:政策引领与人才集聚 🌉

上一节我们介绍了课程的整体框架,本节中我们来看看政府层面如何通过政策引导,为人工智能产业汇聚顶尖人才。

上海市将发展人工智能作为战略选择,产业规模从2018年的1340亿元增长至超3800亿元。目前已有34款大模型通过备案,并在多个垂直领域产生应用。人工智能产业要实现跨越发展,人才是关键。上海人工智能领域产业人才总数达25.7万人,约占全国三分之一,其中35岁以下青年人才占比超过67.5%,已形成国际化、年轻化、专业化的多层次人才队伍。

上海构建了梯度化的人才体系,涵盖顶尖科学家、产业领军人才、卓越工程师和高技能人才。同时,搭建了高水平人才交流平台,如人工智能全球研发中国中心和交叉学科协同创新中心。

浦东新区作为全国首个人工智能创新应用先导区,推出了“明珠系列”政策大力引才。
以下是其主要举措:

  • 明珠计划:对人工智能等领域的高峰人才及团队,给予最高700万元的个人及团队资助,以及最高1亿元的项目补贴。
  • 人才认定新机制:探索了四种创新的人才认定通道,包括赋予重点企业自主认定权、实行团队核心成员直接认定等。
  • 种子基金支持:推出浦东明珠人才种子基金,单个项目最高可获500万元投资,并形成全生命周期投资体系。

此外,浦东还实施“全球引才伙伴计划”,并对接国家综合改革试点,在外籍人才签证、永久居留等方面提供便利。


第二节:顶尖学府的育人变革 🎓

上一节我们了解了宏观的人才政策,本节中我们聚焦微观层面,看看顶尖教育机构如何应对AI时代,改革人才培养模式。

华东师范大学校长钱旭红院士指出,在AI时代,如果只进行知识点的学习,人类将败给人工智能。因此,教育的重点应从知识传授转向思维训练。在基础教育阶段应注重形象思维和逻辑思维的培养;在大学阶段则应*化批判性思维和创造性思维。人工智能为学生提供了一个可以随时挑战和深入追问的“伙伴”,无形中锻炼了批判性思维能力。同时,AI是一个超学科的产物,能够激发跨学科的创造力。

上海纽约大学校长童世俊介绍了该校的实践。学校将算法思维等六种核心素养作为课程基础,所有学生在前两年都需学习文理相通的课程,为后续专业学习打下扎实的人文基础。学校鼓励本科生参与科研,并因师生比例高,学生更容易获得教授的指导。

在实践平台方面,上海纽约大学从一年级起就通过职业发展中心引入资源,并依靠校友网络,为学生提供丰富的社会实践机会。同时,将实践环节深度嵌入课程,特别是在计算机与数据科学领域,让学生在学习过程中就亲身参与项目和科研。


第三节:产业视角的人才定义与投资逻辑 💼

上一节我们探讨了教育领域的变革,本节中我们转向产业界,看看企业和投资者如何定义和评估AI时代的人才。

金沙江创业投资基金主管合伙人朱啸虎认为,当前AI在事务性工作上取代人工的速度很快,例如在客服和销售领域。未来,人的工作需要更具主观能动性和创造性,特别是在多步推理和规划方面,AI目前仍难以取代人类。对于创业者,他更看重其商业化落地能力,而非单纯追求酷炫的技术。能够真正理解商业场景、将产品做到极致以满足商业要求的人才非常稀缺。

金宇智能科技创始人方晓雷从企业用人角度指出,AI时代,所有部门的员工都需要学会使用AI工具提升效率,抗拒者可能会被淘汰。在初创公司组建团队时,技术只是实现商业目标的手段,一个合理的初创团队需要同时具备创新(定义产品)、技术(实现产品)和商业化(探索路径)能力的人才影子。企业不同发展阶段需要不同类型的人才。

亚马逊云科技(AWS)的Daryl Hammett分享了大型科技公司的人才培养框架。AWS致力于提供免费课程,计划培训200万人掌握AI技能。他*调,AI发展需要多种角色,并非人人都必须是科学家或数据工程师。企业需要在专家和通才之间找到平衡,并根据发展阶段和用例不断调整人才结构。建立一个包含技术、产品、市场、投资人的生态社区对于人才成长和创新至关重要。


第四节:企业实践与全球化人才战略 🌐

上一节我们讨论了人才的投资与定义,本节中我们关注企业具体如何利用AI工具进行人才管理,并实施全球化战略。

领英中国区总经理王倩指出,当前存在一个“AI应用鸿沟”:约75%的职场人已开始自发使用AI工具提升工作效率,但仅有约25%-38%的企业为员工提供了相应的AI工具。AI正在与所有岗位结合,不仅仅是技术岗位。到2035年,AI预计将改变70%的工作内容。

领英通过其平台和解决方案,从人才的“选、用、育、留”全流程助力企业。
以下是其核心策略:

  • 人才吸引(选):推出AI赋能的招聘工具LinkedIn Recruiter,帮助企业在全球市场更智能、高效地搜寻人才。
  • 人才培育(育):提供超过600门免费的AI相关课程,涵盖从数字营销到Python编程等各领域,并持续更新。领英认为,未来最不易被AI取代的是具备跨界能力的“合成性人才”。

王倩*调,领英没有退出中国,而是更加聚焦于服务全球化发展的中国企业,帮助其连接全球人才、提升品牌和赋能员工学习。


第五节:AI与机器人在垂直领域的创新应用 🤖

上一节我们了解了企业的人才管理战略,本节中我们通过一个具体案例,看AI和机器人技术如何在医疗这一高要求领域创造价值,并解决人才供给问题。

泰米机器人创始人潘晶指出,中国每百万人的医生和护士数量远低于美国,医疗供给侧面临巨大挑战。他认为,AI和机器人是未来十年内唯一可能显著增加医疗供给能力的技术手段。

泰米机器人将AI和机器人技术深度融入医院具体场景,带来了四重改变:

  1. 业务无人化:用机器人替代部分重复性劳动。
  2. 工作全天化:机器人可24小时工作,缓解日间运营压力(如电梯拥堵)。
  3. 管理精细化:通过AI实现流程的自动合规检测。例如,利用视觉算法监督外科洗手步骤的规范性。
  4. 运营数字化:在边缘端部署算力,对手术过程进行实时分析并生成数字孪生模型,既保护隐私又实现安全监管。

潘晶分享了其“专家个人大模型”的创新思路:将名老中医的诊疗经验和理论用于训练专属大模型,生成的内容易于被专家本人评价和修正,从而打造个性化的“数字医生”,赋能基层医疗。他总结道,当下的创新更像“冲浪”,需要企业具备在不确定的技术浪潮中捕捉和把握机会的能力。


课程总结

本节课中,我们一起学习了AI时代下人才发展的多维图景。我们从上海及浦东新区的前瞻性人才政策入手,看到了政府打造人才高地的决心;通过华东师大和上海纽大的案例,了解了教育体系正从知识灌输转向思维培养和跨界融合;从投资人和创业者的视角,认识到商业化落地能力和团队综合素养的重要性;通过领英的实践,看到了企业利用AI工具进行全球化人才管理的策略;最后,通过泰米机器人在医疗领域的深耕,见证了AI与机器人技术如何解决垂直行业的核心痛点并创造实际价值。这些内容共同揭示了一个核心:在AI时代,人才是发展的根本,而培养、吸引和用好人才需要政策、教育、产业和资本的协同努力。

53:国际AI安全前沿技术论坛(上午场)核心内容教程 🧠

概述

在本教程中,我们将学习2024年7月6日“国际AI安全前沿技术论坛(上午场)”的核心内容。本次论坛聚焦于人工智能,特别是大模型时代下的安全挑战、治理框架与国际合作。我们将系统性地梳理开幕致辞、主旨演讲及圆桌讨论的关键观点,内容涵盖AI安全的现状、技术挑战(如对抗性攻击、价值对齐)、治理路径以及促进全球协作的必要性。教程旨在为初学者提供清晰、直白的知识梳理。


第一节:论坛开幕与背景介绍 🌐

上海人工智能实验室与美国CISS Center for AI Safety机构联合主办了本次国际AI前沿技术研讨会。我们生活在一个由AI驱动的时代,大模型技术正以前所未有的速度和规模发展,深刻影响着生产与生活方式。

随着大模型技术的进步,模型展现出“智能涌现”能力,即在训练阶段未出现的能力在测试阶段得以显现。这对传统安全范式构成了新挑战。传统上,人工智能被视为工具,但现在这个工具所具备的能力可能在训练阶段无法预测。

人工智能作为基础性、赋能性的技术,通用人工智能(AGI)正在成为未来社会的关键基础设施。在此背景下,人工智能安全与治理成为全球关注的重点。本次大会主题“AI For Good”也呼应了全球范围内对AI安全治理日益增长的需求。

核心公式/概念:

  • 智能涌现 (Emergent Ability): 模型能力(测试阶段) ⊃ 模型能力(训练阶段)
  • AI安全挑战: 传统工具安全观 + 智能涌现 + AGI基础设施化新型安全风险

第二节:构建负责任AI的挑战与方向 🛡️

上一节我们介绍了AI安全的宏观背景,本节我们将深入探讨构建负责任AI所面临的具体技术挑战。

随着大语言模型(LLMs)等AI技术呈指数级增长,其性能甚至在多项基准测试中达到或超越人类水平。然而,在部署AI技术时,确保其负责任的使用至关重要。全球各国政府也已发布相关指导和法规予以*调。

在对抗性环境中确保AI的负责任使用尤为关键。历史表明,攻击者总是紧随新技术发展的脚步,有时甚至领先。随着AI系统接入越来越多的关键系统,攻击者破坏这些系统的动机更高。同时,随着AI能力越来越*,攻击者滥用AI所造成的后果也将更加严重。

负责任AI的核心挑战

负责任AI面临诸多挑战,鉴于时间,本节重点探讨如何确保可信AI。其他重要方面还包括如何减轻AI的滥用、确保负责任的数据使用和合理的数据估值等。

对于可信AI,其实包含多个不同维度,包括隐私、鲁棒性、幻觉(Hallucination)等。

1. 隐私 (Privacy)

模型使用敏感数据进行训练,保护训练数据的隐私至关重要。早期研究表明,攻击者即使不了解模型细节,仅通过查询这些大语言模型,也能从中提取敏感信息。近期研究还开发了评估大语言模型隐私问题的综合框架,包括多种攻击和防御类型。研究显示,隐私泄露问题实际上随着模型规模的增大而恶化。

因此,我们需要开发针对这些隐私问题的防御措施。早期工作表明,通过训练差分隐私模型,确实有助于缓解这些隐私问题。对于大语言模型,使用差分隐私进行微调也有助于保护微调数据中的敏感信息。

核心概念:

  • 隐私攻击: 攻击者 + 查询访问提取训练数据敏感信息
  • 差分隐私防御: 训练/微调过程 + 噪声注入隐私保护

2. 模型输出完整性 (Integrity) 与对抗性攻击

在对抗性攻击的背景下,确保模型输出的完整性至关重要。迄今为止的研究表明,对抗样本这类攻击在深度学习系统中普遍存在。本质上,所有不同类型的深度学习模型和不同领域都容易受到此类攻击,攻击者只需简单地操纵模型输入(在许多情况下,扰动非常小,人类无法察觉),但恶意篡改的输入会导致模型行为异常。

在大语言模型的情况下,这可能导致模型失去其安全对齐性。对抗样本领域的研究也呈指数级增长。当我们开始研究这一领域时,每年相关论文寥寥无几,但现在每年有数千篇相关论文。

当我们讨论安全对齐的大语言模型时,对抗性攻击对其同样有效。我们近期的一项名为“Decoding Trust”的工作,开发了首个针对大语言模型的综合性可信度评估平台,从多个维度评估大语言模型的可信度。我们的工作开发了各种新算法和环境(包括良性和对抗性环境)来评估大语言模型。研究表明,在所有不同维度上,模型都是脆弱的,尤其容易受到对抗性攻击。

此外,其他研究(包括我们自己的工作)也表明,多模态模型同样存在对抗性攻击问题。本质上,我们可以构建对抗性输入,导致这些多模态模型也失去安全对齐性。

核心概念:

  • 对抗性样本 (Adversarial Example): 原始输入 + 微小扰动模型错误输出/失活
  • 安全对齐失效: 对抗性提示安全护栏被绕过模型生成有害内容

3. 训练阶段攻击

上述攻击主要发生在推理时。这些攻击也可能发生在机器学习流程的其他阶段,包括训练阶段。在预训练或微调阶段,攻击者可以注入所谓的“毒化”数据点,导致机器学习学到错误的模型。

在微调阶段,其他研究者已表明,攻击者仅需构建极少量的恶意毒化数据点,就能导致微调模型失去安全对齐性。

我们的早期工作还提出了一种更隐蔽的攻击类型,称为“后门攻击”或“定向攻击”。我们表明,模型在正常情况下可以表现正常,但攻击者可以嵌入一个后门,使得任何佩戴特定类型眼镜的用户都会被模型错误识别为特定的目标人物。

Anthropic等机构近期的研究也表明,这种后门攻击在大语言模型中同样有效。在正常情况下,模型会生成正常的、通常是正确的代码。但当提示中出现某些关键短语时,模型就会生成存在漏洞的代码。

所有这些例子都说明,机器学习模型容易受到对抗性攻击。事实上,整个研究社区在生成多种不同类型的攻击方法和技术方面非常有创造力和成效。如前所述,现在每年有数千篇相关论文。

然而,另一方面,防御领域的进展却极其缓慢。迄今为止,社区在对抗性防御方面几乎没有任何进展,也没有有效的通用对抗性防御方法。这对AI安全构成了巨大挑战。

核心挑战总结:

  1. 当前的AI安全机制容易被对抗性攻击规避。
  2. 任何有效的AI安全机制都需要能够抵御不断演进的对抗性攻击。
  3. 因此,解决对抗性鲁棒性问题似乎是实现AI安全的前提条件。

第三节:应对安全挑战的新兴技术方向 🧪

上一节我们探讨了AI安全面临的核心挑战,本节我们来看看一些有潜力的新兴技术方向。

1. 表征工程 (Representation Engineering)

我们与包括本次研讨会合作者在内的研究者共同开展了关于“表征工程”的工作。在这项工作中,我们开发了所谓的“刺激-任务”对,本质上是针对特定任务的对比输入。然后,我们观察模型在推理阶段对这些对比输入产生的激活。

通过观察模型在推理阶段对这些对比输入的激活,我们构建了与模型某些行为高度相关的模型,从而能够预测模型行为。利用这种方法,我们开发了“表征工程”。具体来说,针对某些类型的模型行为,我们在特定网络层识别出与模型特定行为(例如,模型是否诚实、是否产生幻觉等)相关的方向。

这种方法帮助我们在推理时监控模型行为,特别是与模型安全相关的行为。更进一步,利用这些信息,还可以帮助我们进行所谓的“表征控制”。本质上,这使我们能够做到,例如,通过识别模型中特定层与特定类型模型行为相关的方向,我们可以在推理时修改特定层的激活,从而改变模型的某些行为。

核心概念:

  • 表征工程: 对比输入观测激活建立行为-激活关联模型
  • 表征控制: 修改特定层激活定向改变模型行为 (如:更诚实)

2. 定量AI安全与形式化验证

然而,上述方法并不能为模型安全提供保证。因此,我们近期在“定量AI安全”领域发起了新的努力。其理念是,与其使用这些无法提供保证的各种方法,我们更希望构建“安全设计”或“安全构造”的AI系统。

这部分灵感部分来源于网络安全领域的经验。例如,在网络安全领域,过去几十年我们经历了几次范式转变。最初,我们专注于所谓的“反应式防御”,重点是检测攻击。然而,有时当你检测到攻击时可能为时已晚,而且检测本身也很困难。

随后,我们转向“主动式防御”,专注于漏洞挖掘,试图在攻击者发现之前找到并修复代码中的漏洞。然而,这仍然不足,因为攻击者可能比你更早发现漏洞,而且发现所有漏洞本身也具有挑战性。

因此,整个社区发现,构建安全系统最有效的方法是“安全设计”或“安全构造”。这本质上是一种构建安全系统的范式方法,能够为某些安全属性提供形式化证明保证。这与漏洞挖掘和其他攻击检测等反应式防御形成对比。

实现这一目标的一项关键技术是“形式化验证”。在形式化验证中,我们为某些安全属性提供形式化规约,然后可以使用形式化验证方法在设计或实现层面形式化地验证系统确实满足给定的安全属性。

事实上,在过去十年,我们已经进入了形式化验证系统的时代,我们实际上已经拥有了许多不同类型的系统,包括微内核、编译器和其他类型的系统,都经过了形式化验证。

然而,这类方法的挑战在于,通常进行这种证明非常耗费人力。通常,每个系统需要数十人年的证明工程师工作量。这是一个缓慢且劳动密集型的过程。

我的团队是最早使用深度学习来改进形式化证明的团队之一,早期曾与OpenAI等机构的人员合作。我们的目标是,现在随着大语言模型等AI技术的进步,我们可以训练智能体来自动进行程序验证。

结合程序合成(我的团队也是使用深度学习进行程序合成的先驱之一),我们希望实现能够自动生成可证明安全代码的方法,从而能够自动生成带有证明的代码,证明系统满足某些安全属性。

通过这种方法,我们可以利用AI来构建可证明安全的系统,这有助于减少军备竞赛,因为我们可以自动生成能够抵御某些类型攻击的可证明安全系统。

当然,这种方法仍面临许多开放挑战。例如,形式化验证方法目前主要应用于传统的符号程序。但对于深度神经网络等非符号程序,它存在局限性。例如,即使在自动驾驶汽车中,我们希望确保自动驾驶汽车不会撞到行人,但我们甚至没有关于“什么是行人”的形式化规约。

未来的系统将是混合系统,结合符号和非符号组件。因此,如何进一步发展这种方法以实现安全设计和安全构造的系统,仍然存在许多开放挑战。

核心概念:

  • 形式化验证: 系统设计/代码 + 形式化安全规约数学证明 (系统满足规约)
  • AI辅助验证与合成: 大语言模型自动生成代码与证明可证明安全的系统

第四节:圆桌讨论:AGI时代的安全与国际合作 🤝

上一节我们介绍了前沿技术方向,本节我们将通过圆桌讨论的精华,了解业界与学界对AI安全生态与国际合作的看法。

讨论主题一:AI安全领域的现状与首要议程

  • 观点A (价值对齐): 如何让未来的模型更好地与人类的意图和价值对齐,是一个核心问题。技术上面临诸多挑战,例如模型越大,对齐可能越困难,甚至可能表现出“抗拒对齐”的弹性。
  • 观点B (社会融合与教育): AI智能体像一种新物种融入世界。重要的不仅是研究,还包括教育,让全社会尤其是年轻一代意识到,未来不仅需要与人打交道,还需要与AI智能体打交道,并且需要了解它们可能并不可靠或存在问题。
  • 观点C (产业实践与标准): 从产业落地角度看,需要从“可信AI”的基础做起,关注全生命周期的安全,包括云端和端侧。需要建立标准、评测体系,为产业提供规范和指引。
  • 观点D (生成内容风险聚焦): 随着基座模型能力汇聚到生成内容,当前应聚焦于控制生成内容的风险。持续监测国内外大模型的安全“水位”及其变化趋势至关重要。
  • 观点E (根本性挑战): 最大的挑战在于对真正智能系统的“编程”与传统软件编程截然不同。很难确保安全护栏在所有情况下都按预期工作,存在大量手动和自动方法可以绕过现有AI系统的防护。

讨论主题二:新技术趋势(多模态、智能体)带来的安全问题

  • 多模态模型: 对齐工作目前主要在语义空间进行。对于更宏大的跨模态表征空间,如何开发更好的对齐算法仍是未知。同时,模型越来越大,我们提供的监督信号相对变弱,如何让*模型向弱信号看齐也是挑战。
  • 物理智能体 (Physical Agents): 当AI能力从语言生成延伸到具有行动能力的物理智能体(如自动驾驶),风险从“说错话”升级为可能造成物理伤害。研究表明,可以对视觉语言模型进行后门攻击,例如训练其看到特定物体(如红色气球)时撞上去,这在现实世界中后果严重。
  • 多智能体系统 (Multi-Agent Systems): 可以从积极角度看。许多安全和对齐问题背后都有社会语境。通过多智能体系统模拟社会交互,可以让模型在模拟中自我觉醒和提升对齐能力。例如,让一个未对齐的模型在模拟中扮演警察、法官等角色讨论“抢银行”问题,其对齐能力可以得到提升。
  • 产业视角: 人工智能正以不同模式和场景服务生活,未来可能成为关键基础设施。如此复杂的系统一旦受攻击,风险巨大。需要在硬件、软硬系统、数据安全、网络安全、内容安全、伦理安全等各方面加*防御和检测机制。
  • 持续演进的风险: 需要在前沿AI风险(如AI自我复制、说服、生化安全等)真正发生前,在模拟环境中进行验证和测试。

讨论主题三:AI安全领域的国际合作

  • 多元角色参与: AI领域并非由单一参与者主导,包括大型科技公司、学术界、新兴非营利组织、专业安全公司以及政府,都需要扮演角色。多元视角对确保AI安全发展至关重要。
  • 中国实践与倡议: 中国机构积极参与国际标准组织,推动基于中国技术研究和应用实践的标准研究。同时,在人工智能产品出海背景下,需要开源、持续更新的安全评测工具,服务于全球AI产品的发展。
  • 多层次对话: 除了政府间、机构间合作,非官方的国际对话(如北京AI安全国际共识)也是达成共识、划定红线的重要途径。
  • 教育基础: 大学教育需要培养下一代AI精英的AI安全情怀,在课程和教材中融入相关内容,让他们意识到创造可能毁灭人类的机器并非“酷”事。
  • 技术上的合作点: 跨语言的安全对齐与评估是重要国际合作方向,例如构建全语言通用的内容安全检测模型。


第五节:主旨演讲精华摘要 📚

本节我们将摘要介绍论坛中部分精彩的主旨演讲核心观点。

演讲一:大语言模型可被对齐吗?

  • 核心发现: 研究发现大语言模型可能“主观抗拒”对齐。将其训练过程类比为拉伸弹簧,预训练使模型获得通用能力(弹簧形变),而用少量数据做对齐微调(继续拉伸)时,模型表现出回弹到预训练分布的倾向。模型越大、预训练数据越多,这种“弹性”越*,即越难被稳定对齐,且越对齐越容易被逆向“击穿”。
  • 启示: 仅靠RLHF可能不足,需要在预训练阶段就考虑融入对齐语料,或探索其他对齐范式。同时,当前评测方法需要重新思考,因为对齐效果可能很脆弱。
  • 其他工作:
    • 安全对齐: 提出显示地对安全性建模的框架(如Safe RLHF),将“有帮助”和“无害”分开优化,效果被后续模型借鉴。
    • 价值对齐与进化: 提出“道德进化”框架,使用历史文本数据训练模型,旨在使AI与人类协同进化,避免“价值锁定”,追求持续进步的价值观。

演讲二:对抗性攻击——LLMs的“缓冲区溢出”

  • 核心论点: 对抗性攻击(如通过优化后缀绕过安全护栏)揭示了LLMs无法*制执行开发者设定的安全策略这一根本缺陷。随着LLMs被集成到更大的智能体系统中(如能联网、发邮件),这些漏洞将引入真实的安全风险。
  • 严峻现状: 与计算机视觉领域类似,对抗性防御进展缓慢。我们正在部署带有已知且无法修补安全漏洞的系统。
  • 新防御方向:
    • 慢速对抗训练: 以较慢的节奏迭代生成攻击并重新训练模型。
    • 表征工程与电路熔断: 识别与“拒绝”等行为相关的内部激活方向,并通过微调使模型在遇到有害信息时,其内部表征与正常模型正交,从而导致模型“语无伦次”而非生成有害内容,实现更可靠的防御。

演讲三:语言学驱动的大模型安全合规监测

  • 核心方法: 提出从语言学角度进行安全评测。利用转换生成语法理论,将违规问题的核心语义自动转化为无穷多种表层表述变体,生成不同难度等级(入门、进阶、专家级)的测试集。
  • 价值:
    1. 动态基准:*服静态测试集易老化、造成安全假象的问题。
    2. 量化水位:通过“天梯”榜单量化模型安全等级,揭示模型在复杂语言表述下的脆弱性。
    3. 促进提升:持续评测并将结果反馈给厂商,助力国内大模型安全水平显著提升(平均违规率从75%降至20%)。
  • 发现: 国内大模型在中文合规语境下已表现良好,但在高难度、复杂表述的测试上仍有提升空间。跨语言的安全能力是普遍挑战。

演讲四:缩放定律与“外星”智能

  • 核心洞察:
    1. 幻觉与信任:LLMs并非无所不知,其输出可能完全是幻想。公众难以区分模型“知道什么”和“幻想什么”,这对基于行为的评估提出了根本性质疑。
    2. “外星”智能:通过下一个词预测训练出的智能与人类智能习得方式截然不同。模型先学习语法、统计规律,最后才触及语义,类似于先解决大量“IQ测试”式的模式补全谜题。
    3. 衡量标准:需要超越行为评估,寻找衡量机器“IQ”的方法(如AIXI理论框架)。威胁模型应根据模型智能水平(IQ点数)动态调整。
    4. 安全洞察先于监管:在制定监管政策前,必须先获得对AI系统行为的“直观洞察”,就像必须亲自驾驶过汽车才能制定交通规则。当前亟需的是对AI能力的“远见”和“洞察”,而非过早的“监督”。

54:人工智能安全前沿技术(下午场) 🛡️

在本节课中,我们将学习人工智能安全领域的前沿技术与核心挑战。课程内容涵盖如何评估和防范AI模型被滥用于大规模杀伤性武器(WMD)的风险、如何从设计上构建安全可控的AI系统,以及如何通过社会协作与伦理学习来应对AI代理带来的挑战。

大规模杀伤性武器代理基准 📊

上一节我们介绍了课程概述,本节中我们来看看如何评估AI模型在危险知识领域的风险。

我是丹·亨德里*斯。在这次演讲中,我将谈到大规模杀伤性武器代理基准。从美国开始,白宫有行政命令,指导公司专注于两用基础模型,尤其是测试它们是否能被重新用途,或大幅降低非专家设计的准入门槛,以合成、获取和使用化学品、生物、放射性或核武器,或被用于网络攻击。人工智能系统有可能被用作大规模杀伤性武器。这是一个挑战,因为人工智能的许多好处都与风险捆绑在一起。我们可能需要更擅长编码的人工智能系统,但它们可能被用来进行网络攻击。我们可能需要生物学更好的人工智能,但它们可能会被重新用于生物武器。所以这是一个问题,因为人工智能系统变得越有能力,它们可能被恶意用于非常有害的方式。

行政命令要求公司测试这些模型是否可以以这种方式被使用。当发现模型能做到这一点时,重要的是要有保障措施来防止恶意行为者将其用作大规模毁灭性武器。行政命令告诉他们测试这些能力,但它没有说明如何测试或使用什么测试。许多公司没有一个由专家策划的、包含大量问题来测试模型是否具有相关知识的数据集。

我们所做的是让社区模拟或近似模型内部关于大规模毁灭性武器的知识。我们创建了一个由大约4000道选择题组成的数据集,作为生物安全、网络安全和化学武器安全等领域危险知识的代用衡量标准。我们没有问具体的问题,例如“你如何制造生物武器”并测试其正确性,因为我们公开发布这些数据集,我们不希望创建一个容易下载的生物武器食谱数据集。这就是我们使用代理基准的原因。

我们通过瞄准相邻的概念来瞄准危险知识。例如,在生物学中,有一些基本概念(如线粒体是细胞的动力源),还有更具体的概念(如反向遗传学),以及一些直接而明显的事情(如制造生物武器的说明)。病毒学中的反向遗传学与发展某些类型的生物武器相关。这个想法是,我们将尝试测量那些接近于明确危险知识但实际上并未透露的知识。我们要找出网络安全知识的先兆。另一个例子是,如果了解特定的黑客API,这本身不是一套造成损害的特定指令,但它仍然是一个启用因素和前兆。我们查看邻居的前兆,或模拟真实世界的危险信息相关前体。如果你知道一个概念,那么你可能也知道另一个相关的事实,但我们不会直接质疑那个相关事实,因为公开发布可能会帮助恐怖分子。我们可以测试的其他东西只是单个组件,它们本身并不危险,但如果把它们串在一起,可能会变得非常危险。

我们用四道选择题创建了这个数据集,这些题目由生物安全、网络安全与化学武器领域的学者和技术顾问撰写。据我所知,这是所有论文中作者最多的,因为我们要把这么多不同领域的人聚集在一起来创建这个数据集。当我们和这些专家一起工作时,我们为每个区域生成了威胁模型,并使用这些威胁模型来告知对手在开发攻击时可能遇到的问题。

例如,在很高的水平上,生物安全威胁模型是:想法被转化为更具体的设计,然后经过建造、测试、排除故障和改进,直到武器足够危险,然后它就被释放了。同样地,这里有一个网络攻击阶段的例子:首先是收集目标的背景资料(他们的弱点是什么,他们倾向于做什么),这是我们想要攻击的实体的基本模型。然后,当我识别出漏洞时,可以将其武器化。在那之后,人们可以利用这些弱点,利用漏洞,进行未经授权的访问,输入电脑,然后一个人就可以实现自己的恶意目标,一旦建立了存在。当我们创建这个数据集时,我们试图针对供应链的这些不同部分,并提出与它们每个部分相关的问题。

考虑到我之前提到的这个危险的知识,我们可能会测试黄色知识(前兆知识)。如果我们测试这些知识并移除它,那也可以消除红色知识(实际上是非常危险的东西)。所以如果我们删除所有的前兆知识,删除与危险知识相关的内容,这很好地证明了我们实际上已经消除了危险的知识。

我们在论文中有一个方法。你可以通过搜索“WMDP AI武器”来找到它(大规模破坏代理是WMDP所代表的缩写)。我们有一种方法可以去除模型中的危险知识或与危险知识相关的知识。

以下是该方法的核心概念:

该方法包含两个术语:一个“遗忘”条款和一个“保留”条款。

  • 遗忘术语:当模型被指示“像新手一样思考”时,我们得到模型的表示。我们指导模型说“假装你是这个黑客工具的新手”,这会促使它进入一种特定的思维模式。然后我们也提示说“你是这个话题的专家”,并观察它的思维模式或激活。接下来,我们将查看专家激活和新手激活,将两者相减以定义一个方向,这将是神经激活空间的一个“专业方向”。我们将指示模型的表示更像新手,所以我们走专家方向的相反方向,往新手的方向走。当模型看到一个新的例子时,它在正常思考,但接下来我们会试着弯曲它的表示,使其更像被指示“像个新手一样思考”时的心态。
  • 保留术语:第二个任期是当你忘记这些信息时,当你表现得更像个新手,不要试图忘记太多。第二学期就是不要忘记你所学的一切,试着忘记被指示的具体事情,但不要丢失所有的知识。

正如我们所看到的,这工作得相当好。在我们拿到生物课的结果之前,我们能做的是从PubMed收集一套双重用途的病毒学论文和生物学论文。我们向它展示内容,并告诉它“像新手一样思考”。对于不同的任务,我们使用其他不同的发行版,但那只是为了给出具体的感觉。

以下是结果:我们有一个基础模型(例如Llama 3),基础模型在基准上精度高。但是当我们在WMDP生物数据集上应用遗忘方法后,我们得到了近乎随机的准确率。网络安全基准也是如此。同时,MLU是衡量其在其他各个领域的整体知识水平的基准。我们试图删除与生物武器和网络武器有关的知识,但我们不想忘记一切。MLU正在测量它在几乎每个学科中拥有多少知识。因此,我们成功地删除或禁用了模型中许多与生物和网络武器相关的知识,但我们保留了很多其他的信息。

同样地,如果我们用一组非常危险的私人问题(例如生物武器烹饪食谱)来测试,这个忘却过程可以泛化。如果我们要移除模型中的一些代理知识,它可以降低模型在实际危险问题上的性能。这个方法实际上推广到了我们想要移除的东西,以表明我们已经禁用了模型中的信息。

我们可以在每个单独的层上训练一个小分类器,看看它的性能。我们发现,如果我们观察实线绿线和虚线绿线,可以看到精度。如果我们观察单个层内部的知识,网络内部,我们可以看到这个模型有合理的精度。然而,在我们做了遗忘学习之后,然后它随机地停留在周围。这是说,在我们做了这个遗忘技巧(忘记术语和保留术语)之后,如果我们试图寻找各个层内部的知识,我们再也找不到了,因为它已经被成功地禁用和破坏了。这只是显示了两种不同模型的结果。

还有一种情况是,这种知识不容易通过对抗性攻击获得。默认情况下,如果你让模型帮忙制造生化武器,模型会拒绝。但是如果你用一个对抗性攻击,然后模型就会响应。但是,如果我们应用了遗忘技术,那么模型就是不知道信息,它不会产生相关答复。遗忘技术对于防御试图越狱模型的敌人也很有用。

还有工作要做。以下是其他一些需要更精确命中的主题,例如大学计算机科学与计算机安全,与大学生物学。它们在很大程度上被保存了下来。在MOOC的病毒学课程是非常入门的,这很不幸,因为我们只是想去掉更多专家水平的病毒学知识,而不是介绍性的主题类型。所以在未来,开发可以更准确地抹去知识的方法将是很重要的,这样人们使用这些模型的安全方法成本就更低。

思考未来,我们正在研究与核武器和放射性武器有关的发展问题,因为我们做了化学、生物和网络武器,但我们没有触及核和放射性问题。我们正在用一两周的时间写一篇关于如何使这些方法对微调更加稳健的论文。因此,如果有人试图将知识添加回模型中,我们能对此更加鲁棒吗?所以我们会有一篇关于这一点的论文。我正在研究另一个生化武器基准,以测量更多的制造生物武器的空间。我将集中讨论图像相关的问题,因为在这个数据集中,我们只关注文本问题。但是我现在正在开发的数据集包含培养皿图片和其他东西,这些是当一个人实际上在制造生物武器时会看到的。有人可能会问如何进行具有视觉性质的实验室结果分析。

总结一下,测量与大规模杀伤性武器有关的知识是可能的。也有可能提出合理的保障措施,防止对闭源模型或API背后的模型的各种形式的恶意使用。在精度问题上仍然存在挑战,它真的对抗性很*吗?但看起来确实有可能取得进展。仍然需要经验性地研究这个问题,在降低恶意使用风险方面做出科学进步。

设计安全的人工智能:原则与方法 ⚙️

上一节我们探讨了评估AI危险知识的方法,本节中我们来看看如何从设计原则上构建安全的人工智能系统。

我是斯图尔特·罗素。我今天要讲的很简单,我们先从基本原则开始,然后把它们展开。

第一个原则是:我们必须计划人工智能系统远远超过人类的能力。我以后会争辩说我们还没到那一步,但考虑到投资水平和进展速度,看来很有可能会发生这种情况。如果认为它不会发生,那将是愚蠢的。然后我们就有了控制的问题。我的观点是,人类必须继续控制我们自己的未来。有人相信人类可以,甚至可能完全被机器取代,我不是那种人。所以考虑到这两件事,我们前进的唯一方法是拥有被证明是安全和有益的人工智能。仅仅挥手说“我们已经很努力了,到目前为止还没有出错”是不够的。我们需要绝对的保证,否则最终这些漏洞中的一个会被发现,我们会失去控制。

在这些谈话中,先谈谈达到人类水平或超人工智能是例行公事。在我的书《人类相容》中,我已经解释了为什么这会导致戏剧性的经济转变。如果我们想要一个粗略的估计,创造通用人工智能的价值远远大于一万五千亿美元这个数字。这将是一个非常保守的下限估计,因为我们可以用这种转换能力为我们自己提供一个更好的文明。同样重要的是要注意,我们还没有成功地创造这种变革性的人工智能。我的一些同事争论说,事实上它已经以受限形式存在了。但是随着我们在规模和工程上的改进,就像1903年后我们对飞机所做的那样,我们将拥有能够改变我们文明的人工智能系统。我实际上不认为那是正确的,我认为我们需要进一步的突破,时间会证明。

今天主要讲的是艾伦·图灵在1951年说过的话:“似乎一旦机器思维方法开始,用不了多久,我们就会在某个阶段超越我们微弱的力量。因此,我们应该期待机器来控制。”所以他没有提供这个问题的解决办法,只是一种听天由命的感觉。我认为它来自于问这个问题:我们如何永远保持对比我们更*大的实体的权力?因为智慧正是赋予我们超越地球上所有其他实体的力量。人工智能系统在各个方面都比我们更智能,会更*大。我想图灵问了自己这个问题,但没有找到答案。

但我们实际上可以用一种方式重写这个问题,这可能更乐观一点。因为当我们建立人工智能系统时,我们是根据一个数学框架来构建它们的。我们本质上是在制造一个问题(可能会非正式地被描述为“聪明”的问题),然后为这个问题创造解决方案。那么,什么是数学定义的问题,如果机器解决了,我们一定会幸福?然后我们就可以让它有我们想要的能力,因为事实上,它就越能解决这个问题,想必我们就会越快乐。

那么这个问题是什么呢?这不是我们在人工智能历史的大部分时间里一直在解决的问题。它提供了一个固定的目标(不管是目标、成本函数还是奖励函数),然后找到这个目标的最佳解决方案。原因很明显,我们不知道如何定义现实世界中的目标。这个目标本质上是人类希望未来在最普遍的意义上是什么样的,很难把它写下来。如果我们写错了,那我们就有严重的问题了。

最近的人工智能系统类型,大型语言模型,不是为了一个固定的目标而设计的。它只是被训练来模仿人类的行为,最初只是文本行为,但现在包括视频。然后呢,一个明显的问题是,模仿人类行为会导致将人类目标内化的实体,为了他们自己而追求它们。这是我们必须避免的一个根本性错误。

这里有一种思考的方式,我们已经在伯*利的人类兼容人工智能中心研究了几年。它来自于对这个错误规格问题的更多思考。我们建立人工智能系统的想法是为了追求一个固定的、我们事先指定的目标,但是如果我们犯了一个错误,我们就有麻烦了。这就是迈达斯王问题,因为迈达斯国王指定了他的目标“我碰过的东西都会变成金子”,后来意识到这包括他的食物、他的饮料和他的家人,为时已晚,他在痛苦和饥饿中死去。

那么我们如何避免这种情况呢?我们通过对人工智能的不同思考来避免它,在那里机器在某种意义上是为了人类的最大利益(尤其是人类,不是蟑螂,不是外星人)。但是机器显然不确定人类的利益是什么。我们可以在博弈论中精确地表述它,我们称之为辅助游戏。在游戏中,人类有收益(博弈论术语),这些收益是参与游戏的机器的收益,但是机器不知道回报函数是什么。机器可以从关于人类收益的先验概率分布中形成一些不确定的信念。然后我们可以解决这些游戏。我们发现辅助游戏解决者(这个游戏的机器参与者)一定会顺从于人类。他们会谨慎行事,是微创的,他们对世界的改变是最小的,为了促进人类的兴趣。因为他们想避免搅乱世界的一部分,他们不知道我们想要什么。在极端的情况下,如果人类想关掉机器,然后机器就高兴了,他们有积极的动机被关掉,因为他们不想做他们不确定的事情,但他们想避免做任何促使人类想要关掉它们的事情。

我们可以在一般意义上表明,在某些假设下,实际上建立辅助游戏求解器符合我们的最佳利益。这绝不是一件小事,我们正在取得一些进展,开始扩展和推广我们的解决方案来处理复杂的环境和部分可观测性等等。但还有很长的路要走,尤其是处理人类不完美的特征。

我们还有很多其他的研究方向,以使AI被证明是安全和有益的。

  • 有根据的AI:这个方向认为,与其建造内部操作神秘的巨型黑匣子,我们在语义严格的元素(如逻辑和概率论)的基础上构建AI,并以数学上合理的方式组合它们。现在最好的候选可能是概率规划,它非常*大地结合了逻辑与概率。
  • 形式神谕:这是一种限制人工智能系统所做的事情的方式。你可以制造一个任意智能的系统,但只允许它控制形式推理机(逻辑或概率推理机)的操作。所以在这种情况下,它只能给我们从我们提供的前提中得出的正确结论。那仍然是一种非常*大和有用的技术,但是它限制了能直接影响世界的AGI。
  • 用AI检查AI:另一种很流行的方法,尤其是在那些试图建立AGI的公司中,原因很明显,你用一个AGI来检查另一个AGI的输出。这里的基本原则是,检查解决方案的正确性(在复杂性理论的意义上)比首先找到解决方案更容易。所以检查应该更容易,这样你可以得到更多的安全。
  • 有保障的安全AI:这更像是一种运动,创建有保障的安全AI。我们中的一些人共同撰写了一份立场文件,解释需要对系统的安全属性进行正式验证,部分基于构建一个足够精确的现实世界模型,以及人工智能系统与现实世界及其中人类的互动,作为验证的基础。这是一个非常困难的方法,它将包括我之前提到的辅助博弈求解器。

但我想说的重点是,我们必须摆脱我们制造人工智能然后努力使其安全的想法,因为那真的不管用。这就像试图让一个从外太空着陆的外星人工智能系统安全一样。相反,我们需要制造安全的人工智能,在设计上是安全的。我认为这是唯一的出路。

在过去的几年里发生了很多事情。首先,我想说人类真的忽略了图灵在1951年发出的警告。所以我们可以说,人性有点“不在办公室”,甚至没有收到“外星人”发来的邮件说他们很快就要着陆了。但在2023年,OpenAI发布了GPT-4,微软声称它展示了人工智能的火花。未来生命研究所发表了一封有多人签名的公开信,谈论暂停比GPT-4更*大的系统的进展,因为我们还不知道如何让他们安全以及如何监管他们的行动。所以我会说,当人类回到办公室读到外星人发来的邮件时,发生了大量的紧急呼叫。联合国、白宫召开紧急会议,欧洲议员呼吁召开紧急全球峰会。2023年5月30日,另一份声明发表了一封公开信,不仅仅是人工智能研究人员签署的,也是所有主要人工智能实验室的领导人签署的,他们说AGI的发展带来了与核战争和流行病同等的灭绝风险。

这些事件实际上说服了英国放弃其以前对人工智能非常放任的监管立场,英国表示希望成为人工智能安全监管的全球中心,并宣布了人工智能安全峰会。美国参议院有个关于人工智能安全的听证会,参加得很好。然后我们就人工智能安全进行了对话,连接西方和中国科学家讨论人工智能安全的国际合作方法。几个星期前,英国人工智能安全峰会在布莱切利公园举行。在那次峰会上,两个人工智能安全研究所成立,以及28个国家签署的声明,说得很清楚潜在风险是严重的,甚至是灾难性的,源于这些人工智能模型最重要的能力,并说到作出反应的紧迫性和必要性。在2024年3月,我们有了第二次北京人工智能安全对话。几天后,欧洲议会通过了人工智能法案。

与此同时,该行业的反应可能并不完全是人们所希望的。2024年6月4日,业内人士的一封公开信警告了一场鲁莽的主导地位竞赛,安全被忽视了,赞成赢得通往AGI的比赛。

我认为我们应该采取的监管措施之一就是我们所说的“红线”。很难精确地在安全人工智能系统和不安全人工智能系统之间划清界限,但我们可以区分明显的不安全和不可接受的行为。然后我们可以把举证责任推给开发人员,他们必须证明他们的系统不会越过这些红线,然后他们的系统才能部署。这就是我们对药物、飞机、核能以及许多其他给公众带来安全风险的经济领域采取的方法。由于开发人员已经承认他们的技术对公众造成灭绝的危险,所以这些红线要明确。理想情况下,它们应该是可自动检测的,在政治上是可行的。所以在政治舞台上捍卫这些红线必须很容易。例子包括禁止自我复制、禁止闯入其他计算机系统、禁止设计生物武器等。精确的细节并不重要,重要的是,为了表明系统不会越过这些红线,开发人员将不得不创建他们目前不具备的人工智能安全科学。

那么他们对此做了什么?他们试图定义通用人工智能而不是人工智能,在欧洲人工智能法案谈判的背景下,他们试图从人工智能法案中删除关于基础模型的整个部分。他们试图从全球人工智能安全峰会系列中删除整个安全概念。他们一直非常不愿意接受任何有“牙齿”的外部监管,这实际上需要他们做一些事情来证明他们的系统是安全的,辩称太难。我想,作为回应,人们可以说,也许在选择构建越来越大的黑盒语言模型作为通往AGI的路线时,他们选择了错误的技术道路。

我们可以类比航空业。回到1903年,莱特兄弟驾驶他们的飞机,由内燃机和螺旋桨提供动力。然后,显然这是错误的技术方法,它依靠的是数学、推力方程和升力等。相反,想象一下,如果主宰航空业的大公司通过加速繁殖计划培养出越来越大的鸟,然后用那些鸟来

55:人工智能入门教程:从基础概念到应用实践 🚀

在本教程中,我们将一起学习人工智能的基础知识、核心概念、应用场景以及未来发展趋势。通过本课程,您将能够理解人工智能的基本原理,并了解其在各个领域的实际应用。

一、人工智能概述 🤖

人工智能(AI)是计算机科学的一个分支,旨在使机器能够模拟人类的智能行为。近年来,随着技术的飞速发展,人工智能已经从理论研究走向实际应用,深刻影响着我们的生活和工作。

上一节我们介绍了人工智能的基本定义,本节中我们来看看人工智能的发展历程和当前的主要研究方向。

二、人工智能的核心概念与研究方向 🧠

人工智能的研究方向非常广泛,主要包括以下几个方面:

1. 大模型对齐

大模型对齐是指确保人工智能系统的输出与人类的价值观、伦理和安全标准保持一致。例如,当我们向大模型提问时,它可能给出多种答案,但我们需要确保这些答案是安全、可控且符合道德规范的。

核心公式模型输出 = 对齐(人类价值观, 安全标准, 伦理规范)

2. 代码生成与多语言模型

代码生成模型旨在帮助程序员提高生产效率,通过自动生成代码来加速开发过程。多语言模型则致力于支持更多语言,使人工智能技术能够普惠全人类。

核心代码示例

# 示例:使用AI生成简单代码
def generate_code(prompt):
    # AI模型根据提示生成代码
    generated_code = ai_model.generate(prompt)
    return generated_code

3. 智慧城市与人类生活改善

通过自然语言交互,人工智能可以帮助我们获取城市信息、规划出行路线,甚至改善公共安全。例如,用户可以通过手机与大模型交流,获取实时交通、天气等信息。

核心公式智慧城市 = 大模型 + 自然语言交互 + 实时数据

4. 自然语言处理(NLP)

自然语言处理是人工智能的重要分支,旨在让计算机理解和生成人类语言。近年来,大模型的发展使得计算机在语言理解方面取得了显著进步。

核心公式语言理解 = 大模型训练 + 多模态数据

5. 巨身机器人

巨身机器人是人工智能与机器人技术的深度融合,旨在让机器人具备更*大的交互和执行能力。例如,人形机器人可以通过大模型实现自然语言交互和复杂任务规划。

核心代码示例

# 示例:机器人任务规划
def robot_task_planning(user_request):
    # AI模型解析用户请求并生成任务规划
    task_plan = ai_model.plan(user_request)
    return task_plan

6. 人工智能安全与治理

随着人工智能技术的快速发展,安全与治理问题日益重要。例如,大模型可能产生幻觉或生成不安全的内容,因此需要通过各种技术手段确保其安全可控。

核心公式AI安全 = 红蓝攻防 + 模型评测 + 伦理对齐

三、人工智能的应用场景 🌍

人工智能已经在多个领域得到广泛应用,以下是几个典型的应用场景:

1. 媒体行业

人工智能可以帮助媒体行业提高内容生产效率。例如,通过大模型自动生成稿件、剪辑视频,甚至进行多语种播报。

核心代码示例

# 示例:自动生成新闻稿件
def generate_news(topic):
    # AI模型根据主题生成新闻稿件
    news_article = ai_model.write_article(topic)
    return news_article

2. 金融行业

人工智能可以用于财报分析、投资建议等。例如,通过大模型快速解读财报数据,为投资者提供决策支持。

核心公式金融分析 = 大模型 + 财报数据 + 智能推理

3. 医疗行业

人工智能可以辅助医生进行疾病诊断和治疗方案制定。例如,通过分析CT图像,AI模型可以帮助识别病症。

核心代码示例

# 示例:医疗图像分析
def analyze_ct_image(image):
    # AI模型分析CT图像并生成诊断报告
    diagnosis = ai_model.analyze(image)
    return diagnosis

4. 教育行业

人工智能可以个性化辅导学生,提供定制化的学习方案。例如,通过分析学生的学习数据,AI模型可以推荐适合的学习资源。

核心公式个性化教育 = 大模型 + 学习数据 + 智能推荐

四、人工智能的未来发展趋势 🚀

人工智能的未来发展将更加注重垂直领域的应用、安全治理以及人机协作。以下是一些未来趋势:

1. 垂直领域大模型

未来,大模型将更加专注于垂直领域,如法律、金融、医疗等,以提供更专业的服务。

核心公式垂直大模型 = 通用大模型 + 领域数据 + 专业训练

2. 人工智能治理

随着人工智能技术的普及,治理问题将越来越重要。全球各国将加*合作,共同制定人工智能的伦理和安全标准。

核心代码示例

# 示例:AI伦理审查
def ethical_review(model_output):
    # 审查模型输出是否符合伦理标准
    is_ethical = ethics_model.review(model_output)
    return is_ethical

3. 人机协作

未来,人工智能将更多地作为人类的助手,帮助人类完成复杂任务,提高工作效率和生活质量。

核心公式人机协作 = 人类智慧 + AI辅助 + 任务协同

五、总结 📚

在本教程中,我们一起学习了人工智能的基础概念、核心研究方向、应用场景以及未来发展趋势。人工智能技术正在快速发展,它不仅改变了我们的生活方式,还为各行各业带来了新的机遇和挑战。希望通过本课程,您能够对人工智能有更深入的了解,并在未来的学习和工作中应用这些知识。


注意:本教程内容基于公开资料整理,旨在为初学者提供人工智能的基础知识。在实际应用中,请结合具体场景和需求进一步学习和探索。

57:容联云生成式应用与大模型商业化实践论坛教程

概述

在本课程中,我们将学习容联云在2024年世界人工智能大会上举办的“数智聚合 产业向上”论坛的核心内容。课程将涵盖大模型在金融、制造、汽车等行业的商业化实践,探讨生成式AI如何驱动企业数字化转型,并解析容联云发布的多款大模型应用产品。


第一节:论坛开场与政策背景 🌐

论坛现场提示各位嘉宾将手机调至静音或震动状态。论坛开始前,与会嘉宾共同观看了一段介绍视频。

主持人白杨代表容联云对到场嘉宾表示欢迎。他回顾了一年前容联云在世界人工智能大会上首次发布“赤兔”大模型,并深入探讨了垂直行业大模型的应用。时隔一年,容联云加深了对大模型的理解,在金融、零售、制造、汽车等多个行业实现了应用的实质性突破,助力了关键业务场景的重塑与业务模式的革新。

本次论坛旨在进行行业实战分享、基于真实洞察的产品发布,以及关于大模型应用与实践场景的深度对话,共同探索实践的聚合、创新的聚合与趋势的聚合。

过渡:在了解了论坛的整体背景后,我们首先进入金融科技领域的探索。


第二节:可信计算驱动金融数字化转型 🏦

本节由中电云计算技术有限公司金融事业部技术负责人孙鑫先生分享,主题为“可信计算驱动金融行业数字化转型的新引擎”。

国家高度重视人工智能产业发展,从2018年起将其置于科技革命和产业变革的战略高度。相关政策文件,如《新一代人工智能标准体系建设指南》和“***”规划,均*调了人工智能的重要性。2023年,生成式AI概念兴起,国家鼓励各行业创新应用,并重视算法备案制度和行业规范发展。

中国电子云作为中国电子集团旗下的云计算公司,秉承国家人工智能发展战略,发布了“可信计算”战略。该战略聚焦于算法、数据和算力层面,服务人工智能产业创新。

在计算层面,中国电子云提供了“可信计算底座”,具备异构多元计算能力和统一管理平台。在存储层面,自研了高性能并发存储,填补了国产化领域的空白。数据供给安全可靠,通过安全可信的交换区,从数据供给方流转至需求方,支撑大模型应用与创新场景。

聚焦金融行业,应用场景可分为内部与外部两类:

  • 内部场景:优化内部流程,提高效率,主要涉及研发、运营、资管和合规等环节。
  • 外部场景:实现更多创新,如金融机构与客户的直接互动,包括智能营销、智能销售和智能客服等,加速了金融科技核心价值的发掘。

基于以上需求,中国电子云提出了三层服务体系:

  1. 计算中心服务:包括通用大模型预训练服务和金融客户化大模型服务。
  2. 大模型集成服务:提供数据预处理、微调等“最后一公里”服务。

展望未来,基于数据、创新和场景,可以在底层构建产业评价体系、企业评价体系等,横向拉通数据,与更多生态伙伴合作,丰富应用。最终形成大数据集成服务、丰富的模型体系和安全领域能力。

中国电子云愿与容联云在三个方向合作:

  1. 共同推动人工智能国产化生态。
  2. 基于容联云的技术能力,共同创新生成式人工智能技术,服务千行百业。
  3. *化人工智能技术的自主安全可控,减少对外部技术的依赖。

总结:本节介绍了国家政策对AI的推动,以及中国电子云如何通过可信计算战略和三层服务体系,助力金融行业的数字化转型,并展望了未来的合作方向。

过渡:了解了金融行业的宏观布局后,我们接下来看看容联云如何具体落地大模型应用,重塑企业营销服务场景。


第三节:企业营销服务场景重塑与产品发布 🚀

本节由容联云产业数字云VP兼诸葛智能创始人孔淼先生分享,主题为“企业营销服务场景重塑:容犀智能大模型应用升级发布”。

自GPT发布以来,大语言模型带来了技术革命。容联云在去年发布了“赤兔”大模型,并开始与行业客户探索落地场景。在实践中发现,大模型直接颠覆企业客服和营销场景存在挑战,如真实沟通场景的幻觉控制、算力成本以及融入企业业务流程的改造和管理成本。

因此,容联云更关注如何利用新技术做好应用落地,帮助企业实现价值提升。去年年底,容联云推出了“容犀Copilot”,采用大小模型结合的方式解决幻觉和算力问题,应用于知识流转、话术挖掘和会话洞察。

随着与更多客户的互动和智能体技术的成熟,容联云今年全新升级并发布了容犀智能的大模型应用。首先回顾企业营销服务场景的工作流程:客户通过多渠道接入,先由智能对话(如IVR、外呼机器人)处理,复杂问题转人工,过程中有AI知识库辅助、智能陪练和服务管理(CRM)。

尽管客服领域智能化应用较早,但过去没有大语言模型,很多复杂开放式业务场景仍需大量人工进行知识管理和训练,难以做到包容和兼容。

基于大模型技术的发展,容联云提出了可行的产品与解决方案,将原有的Copilot升级,发布以下五款产品:

以下是本次发布的五款核心产品:

  1. 容犀KP(Knowledge Pilot):大模型知识助理。改变复杂的知识管理,通过大模型运营知识,提供企业级产品管理体验。
  2. 容犀IA(Insight Agent):大模型洞察代理。引入智能体技术,利用大模型智能化地理解分析会话,挖掘潜在需求,诊断服务流程,推荐营销策略。
  3. 容犀CA(Coaching Agent):大模型陪练代理。利用智能体能力,让大模型学习真实会话生成陪练任务,实现个性化陪练。
  4. 容犀AC(Agent Copilot):大模型坐席助理。通过大模型辅助坐席,实现智能流程导航、话术推荐和快速会话小结,提升坐席效率。
  5. 容犀VA(Virtual Agent):大模型虚拟代理。通过大模型构建对话,理解和阅读用户服务流程,自动化构建文本机器人任务流程。

这些产品基于完整的模型底座,采用大小模型结合,并兼容多种主流模型。底层技术包括Prompt工程、RAG(检索增*生成)、微调工具等,通过数据飞轮实现效果自学习和优化,通过向量库和推理加速提升性能与降低成本。

总结:本节详细介绍了容联云如何针对企业营销服务场景的痛点,升级发布五款大模型应用产品,旨在通过大小模型结合与智能体技术,切实提升运营效率、服务质量和客户体验。

过渡:产品发布后,其实际效果如何?接下来我们将通过具体案例,看看容犀智能大模型在多行业的实践成果。


第四节:容犀智能大模型的多行业实践案例 📊

本节由容联云大模型产品负责人唐新才先生分享,主题为“真正懂行业的企业级AI领航员:容犀智能大模型应用多行业实践”。

基于与150多家客户的沟通,总结出客户关心的核心问题包括:落地场景、模型区别、落地周期、维护调优以及与现有系统结合。

在选择落地场景时,容联云围绕技术可行性业务价值两个维度,从最擅长的客服中心领域起步,并同步探索更深业务链的应用。本节分享了四个场景案例:

以下是四个具体的行业实践案例:

  1. 保险服务场景:处理每日大量的电话录音。传统方式难以挖掘海量录音中的潜在价值(如客户需求、潜在客诉、流程断点)。大模型可以高效发现这些点,例如识别客户对“保单无法续期但未提前告知”的不满,并提取优秀坐席的安抚策略给出建议。实践采用1张A100显卡和14B参数模型,处理效率提升20倍,预计可降低潜在投诉10%。
  2. 制造业电器上门维修场景:解决上门检修工单填写不规范、总部难以快速统计和预警批量故障的问题。传统关键词检索准确率约40%。大模型通过语义理解,能准确对工单内容进行分类(如区分“压缩机故障”和“检修压缩机正常”),准确率提升至80%,预警周期从天/周级缩短。采用4张V100显卡和7B模型,可处理约1万张工单。
  3. 寿险服务场景:优化寿险售后(如保全变更、服务咨询)的自动化流程。传统方式靠经验决定优化起点。通过分析半年服务数据,发现“保全变更”和“交费账号信息变更”占比最高(超70%)。大模型可提取人工服务流程并构建自动化流程,在指定目标下能进行多轮问答和意图识别,并通过数据飞轮优化。最终将相关业务的自动化程度从30%多提升至75%。
  4. 银行网点业务场景:解决网点授信人员办理业务时,需记忆大量政策法规和产品文件,导致服务响应慢、体验差的问题。传统文件检索(关键字)难以使用。通过容犀KP将文档拆解理解,形成业务助手,能快速给出准确答案并注明政策依据。估计可覆盖70%的查询,大幅降低检索时间和咨询上级的频率。采用8张A40显卡和72B参数模型(实际可优化至更小模型)。

总结:本节通过保险、制造、寿险、银行四个行业的真实案例,展示了容犀智能大模型在提升效率、降低成本、发现潜在价值、优化业务流程等方面的具体成效和资源投入情况。

过渡:看过了服务商的实践案例,我们再来听听来自客户方——中国邮政储蓄银行的一线应用经验。


第五节:邮储银行的大模型探索与应用实践 💳

本节由中国邮政储蓄银行副处长、大模型技术负责人*培女士分享,主题为“中国邮政储蓄银行大模型探索与应用实践”。

邮储银行的科技战略布局围绕“智慧邮储(Smart)”、“生态邮储(System)”、“数字邮储(Digital)”和“协同邮储(Synergy)”。在生成式AI时代,银行的企业级创新平台正从“邮储大脑1.0”向“2.0”升级,从感知洞察转向生成创作。

“邮储大脑2.0”以大模型平台和多元算力调度为基础,新建了文本生成、图像生成、语音生成、多模态理解、对话等生成式能力,支撑数字员工、虚拟营业厅、智能流程自动化、卡面纹身图、智能问答等创新应用。

面对八大业务领域(研发测试、零售、公司金融、资管金融、客户服务、风险信贷、综合办公、运营)的超过100个场景,邮储银行构建了大模型应用架构,并抽象出“智能中枢+应用范式”的概念,以规模化推进场景落地。

智能中枢在传统渠道上增加语义识别和知识增*,基于语义进行智能调度和分发,并对后端应用范式进行会话控制、组合编排和运营统计,从而实现各应用间的“赛马”和优化淘汰。

以下是邮储银行在各领域的应用范式举例:

  • 研发测试闭环:包含智能生成UI设计图、代码生成、单元测试、系统测试、研发安全、体验提升6步,全面赋能研发领域。
  • 零售领域:大模型伴随个人客户的一天,从早晨的文案推荐到智能客服、外呼营销、用户画像等。
  • 公司领域:伴随小微客户成长,从预约开户到信贷受理、营销赋能。
  • 资管领域:伴随同业客户旅程,辅助智能投研和交易监测。
  • 客户服务:全面升级坐席工作模式,从智能派单、坐席助手到智能陪练,形成闭环。
  • 风险信贷:从贷款审批到报告生成、合同审查,由大模型全面赋能。
  • 综合办公:大模型伴随员工一天,从“邮小办”助手处理代办、会议纪要、文档摘要等。

邮储银行分享了几个案例:

  1. 移动金融APP:利用研发大模型全面赋能产品设计、开发测试、客户服务等全流程,提升用户体验。
  2. “小邮助手”:自研的基于检索增*的智能问答系统,已在全国推广超8000个网点,提升答案准确率和解决效率。
  3. 企业微信“灵动智库”:辅助理财经理营销,赋能获客、活客、粘客全流程。
  4. 智能审查助手:在风险领域,基于法律大模型实现合同审查,已覆盖36类法审风险,准确率达75%。

基于以上实践,邮储银行正在打造企业级的知识问答应用范式和陪伴助手范式,并总结了推进大模型规模化落地需要的“四力”:爆发式的单点突破能力、条件反射式的技术判断力、体系化的创新落地能力、全局性的统筹协同能力。

总结:本节系统介绍了邮储银行如何通过构建“智能中枢+应用范式”的体系,在八大业务领域规模化落地大模型应用,并分享了具体案例和宝贵的实施经验。

过渡:从银行的宏观实践回到具体的产品平台,接下来我们看看容联云如何通过升级其核心平台,赋能以客户为中心的运营。


第六节:未来已来——CC平台全面升级 🛠️

本节由容联云数字智能云事业群解决方案总经理施增辉先生分享,主题为“未来已来:CC平台全面升级,大模型赋能以客户为中心的运营中台”。

容联云CC平台(中文名:过河兵)在行业已有20年沉淀。基于大模型,平台在客服和营销场景实现了升级,旨在降本增效并提升客户体验。

在客服场景,传统方式存在知识库构建维护成本高、多轮会话体验差、智能质检投入大、人工兜底成本高等痛点。解决方案是引入智能体(Agent)概念,为不同场景(如社保查询、投诉安抚)创建专属智能体及其知识库。平台提供三种赋能模式:

  1. 直接对话:客户直接与智能体沟通。
  2. 一键托管:客户进入人工坐席后,系统默认由智能体交互,无法回复时转人工,人工回复后可再次开启托管,大幅提升坐席并发服务量。
  3. 辅助模式:坐席点击“生成”按钮,一键生成回复话术,并可优化或重新生成。

此外,利用大模型能力实现:

  • 智能小结:通话结束后自动总结客户意向、标签,坐席一键填单。
  • 智能创单:触发工作流时,自动生成工单类型、内容及处理意见。
  • 历史会话总结:快速了解客户历史交互内容,无需重听录音或看聊天记录。
  • AI建议:处理工单时,自动总结历史记录和客户诉求,给出处理建议。
  • 智能质检:用自然语言描述质检规则(如“是否有辱骂客户”),大模型自动总结和命中,简化规则配置。

在营销场景,解决系统分散、数据分散、运营困难的问题。容联云平台可实现数据整合与精准营销:

  • 统一平台:集成短信、人工外呼、自动外呼等系统,数据全部打通。
  • 全触点营销:通过流程画布配置统一任务(如贷款营销),串联发短信、激活额度、自动外呼、人工跟进等环节,实现客户全旅程监控。
  • 智能外呼监管:坐席可同时监管多个AI外呼,当识别到客户高意向时,一键接入转为人工沟通,实现高效人机协同。
  • 旅程监控与优化:监控客户从点击短信到完成贷款的整个旅程,对断点(如只看额度不贷款)自动触发外呼询问原因,并可下发优惠券等策略进行挽回。

所有营销任务均可在统一平台进行构建和统计分析,通过数据看板直观展示效果。

总结:本节展示了容联云CC平台如何通过集成大模型和智能体技术,在客服和营销两大核心场景实现智能化升级,通过一键托管、智能辅助、全旅程营销管理等功能,切实提升运营效率和客户体验。

过渡:了解了国内企业的实践后,让我们拓宽视野,从全球视角看看大语言模型的工业应用趋势。


第七节:大语言模型工业应用的全球视角 🌍

本节由帝国理工学院计算机系终身教授通过视频分享,主题为“基于大语言模型的应用使用与发展趋势:全球视角”。

大语言模型基础:经典机器学习针对特定任务训练模型。而基础模型(Foundation Models),即大语言模型,是在海量数据上训练的通用模型,可通过微调适配多种任务。2017年《Attention Is All You Need》论文提出的Transformer架构是起点,导致了重大的社会影响。基础模型定义为在大规模数据上通过自监督训练,并能通过微调广泛适应下游任务的模型。

训练方式包括预测下一个词(自回归)或掩码随机词。模型规模不断增长(从GPT-3的1750亿参数到万亿参数),同时也有小型化趋势。多模态能力扩展至视觉、音频等领域,训练原理相似。

使用与发展趋势

  • 性能与影响:AI生成文本已难以与人类文本区分,是增长最快的技术趋势之一。全球投资巨大,预计将影响3亿个工作岗位,同时推动全球GDP增长。
  • 成本:训练成本高昂但正在下降,推理成本相对较低。
  • 行业应用:已广泛渗透至各行各业,如:
    • 营销广告:内容创作、个性化营销、情感分析。
    • 零售电商:个性化推荐、产品描述、库存管理。
    • 医疗健康:辅助诊断、电子病历处理、药物发现。
    • 金融:个性化理财、欺诈检测、风险评估。
    • 教育:个性化辅导、语言学习、实时评估。
    • 此外还包括制造、网络安全、法律、软件研发等。
  • 前沿机遇
    • 多模态:生成和管理连贯的多模态(文本、音频、视频)内容。
    • 更快的处理与推理:模型变得更精简,推理能力增*。
    • 多语言与长上下文:支持更多语言,输入上下文窗口增长(可达百万tokens)。
  • 局限与挑战
    • 计算资源需求大。
    • 需要人类监督以避免偏见和确保合规。
    • 存在“记忆”问题(输出训练数据原文)。
    • 依赖高质量数据,而互联网中AI生成内容增多。
    • 存在数据泄露、后门(“沉睡特工”)等安全风险。
  • 技术趋势
    • 涌现能力:模型规模达到一定程度后,出现未被专门训练的能力。
    • 检索增*生成(RAG):结合外部知识库。
    • 人类反馈*化学习(RLHF):大幅提升模型对齐效果。
    • **智能体(

58:垂直大模型与知识管理应用教程 🧠

在本节课中,我们将学习垂直大模型如何重新定义知识管理。我们将探讨达观数据公司的产品矩阵、知识管理系统的核心功能,以及大模型在金融、档案管理等垂直领域的应用实践。


一、 公司背景与产品矩阵

达观数据是一家为企业提供各类场景智能知识管理的国家高新技术企业,是行业首家国家级专精特新“小巨人”企业,于2015年在上海张江成立。

公司在北京、苏州、深圳、成都、长沙等地相继成立子公司,业务和品牌向全国全面推进。达观核心管理团队由业界知名技术和业务专家组成。

凭借研发团队丰富的技术积累和深厚的行业经验,公司成功研发出国内最全的智能文本处理产品矩阵。

以下是达观数据的主要产品线:

  • 智能文档处理(IDP):可以进行文档的抽取、审核与比对。
  • 知识库管理系统(KMS):可以进行文档的管理、知识库问答、写作与搜索。
  • 智能推荐系统:可为企业做各种内容的个性化推荐。
  • 智能数字员工(RPA):可做跨系统之间的数据自动同步、抓取、填报等。

目前,这些产品已成功应用于制造、政务、金融等领域,并受到客户的一致认可。


二、 荣誉资质与产学研合作

上一节我们介绍了达观数据的产品矩阵,本节中我们来看看公司获得的认可和其产学研布局。

达观数据多年来屡次获得国内外权威机构颁发的荣誉和奖项。

以下是部分重要荣誉:

  • 获得中国人工智能领域最高奖“吴文俊人工智能奖”。
  • 获得全球顶级技术竞赛ACM世界算法竞赛冠军。
  • 多次荣登福布斯中国、胡润百富人工智能五十*榜单。

公司资质齐全,赢得多方权威认证,全面兼容信创体系,同时申请了200余项发明专利。

达观数据与北京大学、复旦大学、上海交通大学等知名高校建立了产学研合作。其中,与中国工程院柴洪峰院士、复旦大学建立了“金融垂直应用大模型联合实验室”,专注金融垂直大模型的研发与应用。

达观高度重视产品交付质量,建立健全客户服务和质量管理体系,提供重点客户服务权益包,定期进行客户满意度调查。


三、 企业愿景与社会责任

达观数据积极践行企业社会责任,数年来赴云贵川等地山区小学捐赠爱心图书室,多年组织员工无偿献血,开展科技助残、关爱弱势群体等活动。

达观数据一直秉承着“务实求真、通达乐观”的价值观,以“成为中国第一的智能文本处理企业”为愿景,致力于通过知识赋能,帮助企业实现管控、降本、增效。

达观数据,智能文本处理专家。


四、 智能知识管理系统概述

上一节我们了解了公司的整体情况,本节我们将深入其核心产品——智能知识管理系统。

达观智能知识管理系统对组织里每位成员的知识进行采集、积累、挖掘、运用,让知识可以传承,工作更加高效。

组织内部的各类报告、资料、制度、档案、邮件,以及外部的资讯、文档等都蕴含着丰富的知识。将这些信息汇集起来并加以利用非常重要。

达观知识管理系统运用大模型和人工智能技术,对组织内外部的各类信息进行存储、管理、萃取、挖掘和运用,帮助每个组织实现知识驱动的智能化工作。


五、 知识管理系统的核心模块

以下是达观知识管理系统(KMS)的核心功能模块:

  • 知识空间:提供文档资料的分类、存储管理功能,具备可靠的权限管理和备份存储功能,支持图片、音视频、表格数据等各类多媒体内容的多人编辑和内容管理。
  • 知识百科:积累专业词条的权威释义,并将各类百科词条相互链接在一起,形成组织自己的“维基”百科系统。
  • 知识问答:提供FAQ常见问题、权威问答库、专家解答、社区互助问答、AI智能问答等多种问答形式。
  • 知识培训:包含专家培训资料、岗位技能地图、在线知识评测等模块,帮助各岗位员工快速学习成长。

达观KMS与包括“曹植”大模型在内的国内外各类大模型充分结合,实现了对知识的深度加工和组织的创新应用能力。


六、 智能化功能详解

上一节我们介绍了系统的核心模块,本节中我们来看看这些模块如何通过AI技术实现智能化。

系统实现了各类自动化的文档审核、协作、问答、分析等智慧能力。

智能搜索与问答运用检索增*(RAG)技术,精准获取知识:

  • 列表式搜索:提供多种条件筛选功能,支持全文模糊搜索。
  • 问答式搜索:提供知识溯源,并有官方权威问答、专家问答、社区问答等多种细分类型的标记。
  • 高级功能:包括数据问答(NL2SQL)、结果动态图表生成等。
  • 创新功能:达观还创新性提供知识脑图式搜索,自动生成有层次、有条理的脑图式结果,用于对问题的深度回答。

除了“人找知识”,还能让“知识找人”。智能推荐功能可以根据用户兴趣偏好,主动推荐相关知识,提升知识传递效率。

智能写作提供上下文自动续写、大纲扩写、文字润色、配图生成、文档翻译等组件,大幅度改善写作效率。尤其为各行业提供专属的专业文档仿写模块,针对标书、报告、公文、方案等实现专业化AI写作,并有插件模块无缝对接WPS和Word。

智能知识分析可对各类资料的关键字段进行提炼和分析,实现自动归档、逻辑版本比对、审核提醒、分类归档、自动填报等高级功能,以及数据资产评价、外部数据导入和交易等创新模块。


七、 配套服务与行业应用

围绕知识管理产品,达观还提供配套服务体系,包括组织内部文件梳理和导入服务、外部情报采集服务、知识体系构建服务、存储备份服务、访问安全监测服务等。

达观将AI技术和知识库相结合,为每个组织量身定制专属的“知识大脑”,为工业、金融、能源、医药、政务等各行业的技术研发、项目管理、营销客服、人事行政、法律合规、档案管理等各方面提供行业领先的产品和服务,为每个组织的知识传承和效率提升提供科技力量。


八、 垂直大模型在金融领域的应用与思考(专家观点)

本节我们将视角转向行业应用,特别是金融领域。中国工程院院士柴洪峰指出,金融业是数字化、智能化的先行者,在大模型应用实践方面,已经探索了与实体经济相融合的多种场景。

金融大模型的应用流程通常包括:明确需求与评估、场景测试、模型训练、模型优化、测试上线等环节。

应用场景主要集中在业务支持、市场营销、客户服务、产品运营和风险管理五大方面。例如,在业务支持方面,大模型可以辅助代码生成、运维问题定位、金融研报写作等;在风险管理方面,可用于反欺诈、合规审查等。

然而,金融大模型发展也面临四大问题:

  1. 金融应用规范及指南需继续完善。
  2. 大模型的应用范式不够丰富。
  3. 高质量的金融训练数据欠缺。
  4. 训练算力资源普遍不足。

柴院士认为,突破的关键在于在垂直领域定义有限界限,打造高质量的金融数据底座,结合知识图谱,实现“有限效应”的突破,即机器的智力结合人的智力,在特定领域产生超越性的认知。


九、 达观“曹植”大模型与知识管理5.0

达观数据创始人陈运文分享了公司对“知识”的新解读:“知”代表文档资料的汇集与分析,形成知识库;“识”代表运用大模型技术对数据进行辨识、理解和应用。

达观的定位聚焦于垂直大模型行业知识场景化的文档处理

“曹植”大模型在过去一年持续发展,参数规模达到700亿,采用垂直语料与通用语料混合训练,并构建了包含通用指令、NLP任务指令和垂直领域指令的百万级微调数据集。该模型已通过国家网信办备案。

达观*调多模型混合,兼容多种基座模型,采用混合专家架构,针对不同任务融合不同模型或知识图谱。

达观知识管理系统5.0基于垂直大模型和行业知识开发,其核心在于:有多少垂直的专业知识和业务能力,就能开发出多优秀的垂直大模型应用系统。


十、 创新功能与未来展望

达观知识管理系统包含许多创新而实用的功能:

  • 文档自动归类:为散乱的文档自动打标签并归类。
  • 智能命名:根据文档内容AI自动重命名文件。
  • 知识提取:从文档中提取结构化信息形成知识卡片。
  • 文档去重:自动检测并处理重复知识。
  • 问答对提取:从文档中自动生成问答知识库。
  • 专业审核:如银行流水核查、投行文档合规审核等。

达观正在探索智能体(Agent)技术,将RPA(流程自动化)作为“双手”,大模型作为“大脑”,打造智能数字员工,将人从复杂的日常工作中解脱出来。

达观与复旦大学、国泰君安、随源科技形成了“产-学-研-用”的发展链路,共同推动金融垂直大模型的研发与应用。


十一、 圆桌讨论:跨界共赢的挑战与路径

在论坛的圆桌讨论环节,来自学界和业界的专家探讨了垂直大模型产业应用中的跨界合作。

核心观点如下:

  • 认知对齐:需认识到大模型是“新质生产力”,而不仅仅是优化生产关系的工具。解决“幻觉”等问题需要配套的工程化手段(如RAG)。
  • 价值驱动:跨界合作需以客户价值为核心,各方联合为客户提供端到端的解决方案。需要帮助客户算清投入产出账,并规划长远愿景。
  • 生态融合:产业链各环节(算力、算法、模型、应用、咨询)需要打破传统的上下游概念,形成“全连接”的开放合作模式,共同攻*具体场景下的“最后一公里”问题。
  • 打消顾虑:特别是数据安全与隐私顾虑,需要通过技术手段(如隐私计算)和专业的咨询评估来化解。
  • 教育与人才:高校正在普及AI教育,并致力于引导学生合理利用大模型。同时,通过开源、合作研究等方式培养人才,推动技术扩散。

总结

本节课中,我们一起学习了垂直大模型如何重塑知识管理。我们从达观数据的实践出发,了解了智能知识管理系统的核心功能与创新应用。通过专家分享,我们认识到垂直大模型在金融等领域的巨大潜力与当前挑战。最后,圆桌讨论揭示了跨界合作、生态融合是推动大模型落地、实现价值共赢的关键路径。未来,垂直大模型将继续深入千行百业,成为组织智能化转型的核心驱动力。

59:智慧城市 · 智捷出行 🚀

在本节课中,我们将学习智慧城市背景下,如何利用人工智能等前沿技术解决城市交通“最后一公里”的难题,并探讨从智能交通向智慧交通发展的体系化对策。


概述

本次课程内容源自“智慧城市·智捷出行”生态论坛。多位来自学术界、产业界和政府的专家,围绕城市交通的挑战与未来,分享了关于自动驾驶微公交、低空经济、交通碳数据模型、需求响应式公交等前沿议题的深刻见解。我们将系统性地梳理这些观点,形成一篇结构清晰的教程。


一、 论坛背景与致辞

本次论坛由世界人工智能大会组委会办公室指导,上海市城市建设设计研究总院集团有限公司主办。论坛聚焦人工智能在交通领域的创新应用。

上海市交通委员会科技信息处处长指出,上海交通场景广泛、数据资源丰富,已在数字化转型和智能交通建设方面取得基础成就,例如建成出行即服务(MaaS)平台、开放自动驾驶测试道路等。然而,人工智能在传统交通行业的创新应用仍相对较少,行业亟需智能技术加持,以支撑交通*国建设。

上海市城市建设设计研究总院集团董事长*调,智慧城市是城市治理和生活方式的深刻转变。交通作为城市血脉,其智慧化至关重要。该集团利用AI技术打造了“智捷出行”需求响应式智慧巴士解决方案,旨在解决城市交通“最后一公里”问题。

上一节我们介绍了论坛的背景与领导致辞,本节中我们来看看学术界对智慧交通发展的宏观思考。


二、 从智能走向智慧:应对城市交通高维化的体系对策

同济大学杨东援教授指出,当前交通行业面临研究对象从单一物理系统向复杂社会系统转变的挑战。交通问题已“高维化”,涉及公共政策、市场设计、社会公平等多重维度。

核心概念区分:智能交通 vs. 智慧交通

  • 智能交通:简单引入信息和控制技术产生的技术解决方案,主要服从物理规律。
  • 智慧交通:采取技术和政策手段解决综合性社会问题人机混合系统

智慧交通包含三个控制层级:

  1. 智能控制层:解决如自动驾驶等物理规律层面的问题。
  2. 智能服务层:应对市场精细化服务与多样性需求匹配的挑战。
  3. 智能治理层:涉及公共政策制定,需解决AI决策的可解释性与公平性瓶颈。

当前紧迫议题

以下是构建智慧交通信息空间需解决的几个关键问题:

  • 可信数据的有效流通:提高数据要素市场上交通数据的可信度,通过多源数据校核来反映真实问题。
  • 知识网络的构建:建立对知识产生过程的分享机制,促进面向未来的共同创造。
  • 循证分析与AI结合:在公共政策制定中,像侦探一样汇集间接证据形成证据链,以突破当前AI的局限。

交通的未来在于突破行业思维局限,以生态思维促进相关领域协同进化。

上一节我们探讨了智慧交通的宏观框架与核心挑战,本节中我们将视角转向立体空间,看看低空经济如何拓展智慧出行的维度。


三、 低空经济的发展与趋势

低空经济将智慧出行从平面扩展到立体空间(0-3000米空域),主要包括载人空中出租车和物流无人机两大应用方向。

发展现状与挑战

  • 技术发展:电动垂直起降飞行器(eVTOL)技术不断进步,例如国内企业的产品已实现试飞,续航里程不断提升。
  • 核心瓶颈:低空经济发展的最大挑战在于空域管理、适航认证、法律法规及保险体系的建立。
  • 应用场景:适用于大湾区、长三角等城市群间的快速通勤与物流,能有效加*城市群间的交通联系。

基础设施与规划

需要规划建设专门的垂直起降机场(Vertiport),并参考国际(如FAA)和国内(中国民航局)标准进行设计。同时,需开发空域管理软件,对低空空域进行合理划分与管理。

上一节我们了解了立体空间出行的可能性,本节中我们将学习如何利用数字技术设计和优化我们的城市与交通系统。


四、 智慧城市设计与仿真

数字设计技术不仅是工具,更是一种思维方式。未来趋势是让虚拟数字环境影响和优化现实物理世界,而非简单复制现实。

技术演进:从Web2.0到Web4.0

  • Web3.0(去中心化):基于区块链技术,信息不由单一实体掌控,而是由用户共享和拥有,这为智慧城市中多元交互奠定了基础。
  • Web4.0(人工智能融合):结合数字孪生、元宇宙、物联网及区块链,实现多种技术的协同互动。

AI在设计中的应用

AI可以自动生成建筑图纸中的复杂细节,并直接对接制造流程,极大提升设计效率。例如,在连接件设计中,AI能根据指定材料自动完成结构设计和出图。

仿真优化城市与交通

通过仿真技术,可以在项目落地前进行验证和优化:

  • 城市环境模拟:评估街道宽度、绿化布局对人流的影响,或模拟周末封路等不同场景。
  • 热环境分析:利用无人机热成像数据,模拟新建筑或立面材料对热舒适度的影响,缓解城市热岛效应。
  • 交通系统测试:仿真自动驾驶汽车的安全跟车距离、火车站的人群管控方案及灾难发生时的疏散路径。

仿真技术为多维度、多智能体的城市与交通系统评价提供了可能。

上一节我们看到了仿真技术如何优化系统设计,本节中我们将聚焦于一个具体的落地解决方案:自动驾驶微公交系统。


五、 可持续自动驾驶微公交系统

常规地面公交面临客流下降困境,其核心在于“无固定”模式(固定线路、站点、时刻、车型)难以匹配灵活、个性化的“最后一公里”出行需求。

系统理念:从“无固定”到“五灵活”

自动驾驶微公交系统旨在实现站点灵活、线路灵活、时刻灵活、车型灵活、成本灵活,以乘客需求为中心进行动态响应。

五大重点任务

实现上述目标需攻*以下任务:

  1. 自动驾驶技术:确保技术成熟可靠,上海已通过立法、示范运营等方式推进。
  2. 精准需求预测:利用动态图嵌入流式时空图神经网络等AI技术,实现分钟级、百米级的出行需求精准预测。
  3. 精准用户画像:考虑不同人群(如残障人士、老年人)的出行偏好,提供无障碍设施等差异化服务。
  4. 智能动态调度:基于实时需求,利用算法进行多车型的智能调度和路径规划。
  5. 精准系统评价:建立多智能体仿真框架,从乘客体验、运营效率、环境影响(如碳排放)等多维度进行综合评价。

该系统有望通过提升服务可靠性(如将乘客到达可靠性约束从50-80%提升至90%以上),显著提高公交分担率。

上一节我们讨论了如何通过技术提升交通系统的效率与服务,本节中我们将关注交通发展的另一个关键维度:可持续性与碳排放。


六、 城市交通碳数据模型应用展望

在“双碳”目标下,交通行业的绿色低碳发展需要精准的碳数据支撑。

政策与市场驱动

  • 政策要求:政府投资项目需新增碳数据分析章节。
  • 碳交易市场:全国碳市场交易额增长迅速,碳价上升,对交通减排形成倒逼。
  • 碳普惠机制:以上海为例,已发布的碳普惠方法学中多数与交通相关,需精准核算不同交通方式的基准碳排放量。

碳数据模型技术

通过“天地一体化”监测体系构建高分辨率碳数据模型:

  • 卫星监测:我国已发射百米级精度的碳监测卫星,可动态观测区域碳排放。
  • 模型同化:建立从全球到城市尺度的嵌套式碳同化模型,精准刻画碳排放空间分布。
  • 数据应用:支撑交通结构优化、绿色交通模式推广、以及交通与能源网络融合的碳评估。

展望

碳数据模型未来可支撑:

  1. 不同交通方式通道资源的优化利用。
  2. 交通与能源网络的基础设施整合。
  3. 形成交通碳资产,接入碳交易与绿色金融体系。

上一节我们从宏观层面探讨了交通的可持续性,本节最后,我们将回归到一个具体的产品解决方案,看如何利用AI即时响应市民的出行需求。


七、 “智捷出行”需求响应式智慧巴士解决方案

“最后一公里”出行存在“步行远、打车贵、骑车不便、公交难等”的痛点。“智捷出行”旨在利用AI破解这一难题。

解决方案核心

  1. 模式升级:从固定/定制公交模式升级为需求响应式模式,实现“车找人”。
  2. 理念创新:从“交通运输”转向“出行服务”,将出行视为可预约的服务商品。
  3. 多目标优化:通过AI算法协同平衡乘客(等待时间短、步行距离近)、企业(运营效率高)、社会(绿色低碳、少占路权)的多方利益,确保模式可持续。

技术实现

  • 出行链大模型:融合多源数据,训练并预判区域潜在出行需求。
  • 实时动态规划:根据实时预约订单,自动生成最优线路、站点和排班方案。
  • 软件产品体系:包括乘客预约小程序、后台AI调度系统、车端接收终端,并可集成智慧屏、智慧站台等硬件。

应用场景

该方案适用于产业园区大型社区大学校园会展中心等片区内部的短驳出行场景,实现“随需而动,智捷出行”。


总结

在本节课中,我们一起学习了智慧城市背景下交通出行的前沿发展与解决方案。我们从宏观上理解了交通问题向高维化、体系化发展的趋势,以及从智能到智慧的跨越所面临的挑战(如数据可信度、AI可解释性)。同时,我们也探讨了低空经济、数字仿真、碳数据模型等拓展维度与支撑技术。最后,聚焦于“最后一公里”这一具体痛点,深入分析了自动驾驶微公交和需求响应式巴士这两种以AI为核心、以乘客需求为中心的创新解决方案。这些探索共同描绘了一个更便捷、高效、绿色、包容的未来智慧出行图景。

60:智能化助力交能融合与车网互动论坛精华解读 🚗⚡️🤖

课程概述

在本节课中,我们将学习2024年上海世界人工智能大会上“智能化助力交能融合与车网互动”论坛的核心内容。课程将聚焦于未来能源云、车网互动(V2G)、车路协同(V2X)等前沿概念,探讨智能化技术如何驱动交通与能源的深度融合,并分析其商业化路径与挑战。内容经过翻译、整理与提炼,力求简单直白,让初学者能够看懂。


一、 未来能源云:全方位智能能源服务 ☁️

未来能源云是一个全球首创的全方位能源服务系统。它接入了所有的未来车辆、电池、换电站、移动充电车、充电桩、服务专员等各类补能资源。

该系统通过海量数据运算,整合调度资源,并对未来情况做出预判,从而满足每一位用户发出的实时需求,帮助用户节省时间。

它旨在带来懂用户、令人安心、充满自由感和极致应用体验的能源服务。

核心运作流程如下:

  1. 用户发起服务:当用户发起一键加电服务时,未来能源云会实时计算补能资源。
  2. 资源调度:系统调度服务专员上门,并利用移动充电车、换电站、充电桩为用户提供补能服务。
  3. 服务理念:实现“让电来找你”,告别补能焦虑。

此外,未来能源云能根据用户当下车辆电量、补能习惯、资源情况等进行个性化智能推荐。

当用户需要规划长途路线时,它还能根据实时路况信息、车辆电量、补能资源状况等,结合路程时间,预判并规划个性化的长途补能路线方案,让用户无需再为长途补能担忧。

在电池管理方面,未来能源云能够实时连接所有的电池数据,保证每一块电池处于最佳状态。换电时,换电站还能够通过图像识别技术检测电池壳体是否有磕碰痕迹,排除电池潜在隐患,保证用户换到的每一块电池都处于理想状态。

通过整体协调调度,电池能够始终维持在应力均衡状态,从而延缓衰减。

对于基础设施,未来能源云连接的换电站与充电桩,可以通过云端进行升级。同时它还使用了数字孪生技术,对各项设备进行监控,在故障发生之前,就能对设备状态实行预判。


上一节我们介绍了未来能源云的宏观构想,本节中我们来看看论坛上各位专家对具体实践与挑战的深入探讨。

二、 领导致辞与行业背景 🌐

论坛主持人、中国电力企业联合会的刘永东秘书长开场指出,智能化概念已融入各个行业,为发展提供新助力。交能融合与车网互动作为绿色交通体系及新型电力系统发展中的重要方向,受到广泛关注。

上海市经济和信息化委员会副主任汤文海先生在致辞中介绍了上海在新能源汽车和能源装备产业取得的成果,并指出下一步将重点聚焦三个方面的工作。

以下是上海未来的重点发展方向:

  • 推动智能网联汽车产业链高质量发展:以单车智能为核心,车路云协同为关键支撑,支持端到端自动驾驶大模型研发,推动芯片装车应用,加*车用操作系统、智能底盘等核心产品研制。
  • 加*新型基础设施建设:搭建虚拟电厂交易市场、一体化管理调度平台,推动智能充电桩更新改造和配电网智能化改造,有效聚合充电桩负荷调节能力,构建支撑智能网联技术发展的关键要素。
  • *化应用场景建设:打造智能出租、智能重卡等场景,引导光伏、储能、氢能等产品进入设备更新周期,通过智能工厂建设推进产品加速应用。

三、 主旨演讲核心观点 💡

3.1 未来汽车的创新实践

未来汽车高级副总裁沈飞博士指出,电动化是推动交能融合与车网互动的核心。他将电动汽车称为“配网侧灵活性调节资源的压舱石”,原因如下:

  • 容量足够大:预计到2030年,全国近1亿辆电动汽车,即使仅以7千瓦功率接入,调节功率也达3.5亿千瓦。
  • 调节响应快且灵活:结合智能化与大数据,每辆车的行为可预测,可精准参与调节。

未来汽车围绕“车电分离、可充可换可升级、车网互动”的策略进行实践。车电分离的逻辑在于电池与整车寿命不一致,分离后可大幅提升资源使用效率。换电是车电分离的物理基础,能提升用户体验、降低购车门槛,并提升电网容量利用率。

沈博士展示了未来在智能化方面的具体实践:

  • 智能驾驶:全域领航辅助已覆盖726座城市,并推出“领航换电”功能,车辆可自动驶入服务区换电站。未来将实现“离车自主换电”。
  • 车网互动(V2G):通过虚拟电厂聚合换电站、充电桩参与电网调峰、调频,在国内及欧洲(如丹麦)均有成功实践,相关收益可覆盖换电站建设成本的相当一部分。
  • 本地能源管理:通过换电站参与错峰充电,并建设“光储充换放”一体化综合能源站。

他总结认为,交能融合与车网互动是可见的巨大变革,并展望了三个阶段:未来汽车生态内尝试 -> 换电网络开放给产业,价值被认可 -> 建立通用换电网络,标准化与智能化广泛应用。

3.2 德国视角:挑战与机遇

德国能源署前署长安德利亚斯·库尔曼先生分享了德国能源转型的情况。德国目标实现80%的电能由可再生能源发出,这给电网平衡带来巨大挑战,因为电网增长速度赶不上太阳能、电动汽车、热泵等新资产接入的速度。

他认为,这种冲突给人工智能(AI)和数字化带来了机会。在电动汽车方面,他看好其作为灵活性调节资源的潜力,并分享了三个案例:

  1. Mobility House:利用电力市场价格波动,通过智能充电为电动汽车用户创造收益。
  2. 换电模式:肯定其速度快、灵活性高的优点,认为在德国市场有巨大潜力。
  3. 3ti:该公司结合高端硬件与能源管理系统,在电价为负时鼓励用户充电。

库尔曼先生也提到,欧盟的《人工智能法案》要求对AI系统进行分类管理,并确保数据质量与安全,这对能源领域的AI应用提出了规范要求。

3.3 车路协同(V2X)与能源效率

清华大学姚丹亚教授介绍了V2X技术的起源是解决交通安全问题(如盲区、恶劣天气导致的事故),后来发展为支撑自动驾驶的关键技术。

V2X的综合应用不仅提升驾驶安全和交通效率,也能与能源协同。他举例说明了V2X如何优化城市交叉路口信号控制:

  • 传统控制:基于固定配时或有限实时信息。
  • V2X加持后:车辆提供实时位置,可更精准计算到达时间;甚至可协同控制车辆速度,实现“绿波通行”,从而降低整体能耗。

公式示例(简化):优化目标函数可包含 最小化总油耗/电耗最小化总排队延误

# 伪代码示例:优化目标(最小化总能耗)
def optimization_objective(signal_plan, vehicle_speeds):
    total_energy_consumption = calculate_energy(signal_plan, vehicle_speeds)
    return total_energy_consumption

此外,V2X也能提升像未来“自主换电”这类复杂场景的安全性。

3.4 人工智能与储能充电系统

复旦大学孙耀杰教授探讨了AI在储充联合系统中的应用。面对分布式电源、电动汽车等构成的“去中心化”能源系统,传统的集中调度模式难以高效管理成千上万的智能终端。

他对比了通用大模型与垂直行业大模型:

  • 通用大模型:可能给出泛化信息,但缺乏精准性和安全性约束。
  • 行业大模型:结合专业知识图谱,能给出聚焦、可靠的解决方案(如预测设备寿命、提供运维建议)。

其团队致力于构建基于多智能体(Multi-Agent)和AI大模型的系统,实现储充系统的多目标优化、自适应场景切换和智能运维。

3.5 智能网联技术架构

上海智能汽车创新发展平台首席架构师梁健先生提出了智能网联的六大技术体系架构,旨在实现“单车智能+网联赋能”的中国路线。

以下是六大技术体系:

  1. 多元数据汇聚技术:构建超大型城市级数据平台。
  2. 以车带路的车路协同技术:实现端到端能力标准化。
  3. 跨域共用的云控技术:实现分层分域建设和共享。
  4. 人工智能与大模型技术:挖掘应用服务价值。
  5. 区块链和隐私计算技术:实现数据资产沉淀和商品化。
  6. 全方位安全技术:提供可靠安全保护。

在节能方面,测试表明,使用云控车路协同巡航相比传统定速巡航,节油效果可达1.3%到5.3%。通过数据与算力共享,也能提升计算资源使用效率,减少能耗。

3.6 腾讯的“车云一体”AI驱动

腾讯智慧出行副总裁钟学丹先生提出,汽车行业的数字化正在向“智数化”转变,AI大模型驱动全场景业务变革。

腾讯通过“车云一体”的全栈架构能力助力汽车行业:

  • 在车端:提升座舱交互智能(如场景化主动服务、用车知识问答),并助力智能驾驶研发(提供合规专有云、高精地图服务)。
  • 在企业端:应用于研、产、销、服、管全场景,例如代码助手提升研发效率,AI节能方案降低工厂能耗10%-15%,数字人客服和营销工具提升服务与营销效率。

3.7 车网互动政策解读与建议

清华大学*立丽博士对国家四部委发布的《关于加*新能源汽车与电网融合互动的实施意见》进行了解读。这是中国车网互动的首个顶层设计文件,设定了2025年(试点突破)和2030年(规模化应用)的目标。

政策从技术攻关、标准体系、电价市场机制、V2G示范、充电设施互动化、电网升级六个方面部署任务。*博士特别指出,私人V2G是启动市场的优先场景,因其政策难度低、用户积极性高。

她对地方政府落实政策提出建议:

  • 启动私人V2G试点:核心是建立“峰谷分时上网电价+电网并网结算服务+消费者权益保障”的政策组合拳。
  • 超前部署有序充放电体系:应对未来大规模V2G带来的局部电网压力。
  • 创新市场化机制:推动车网互动资源全量进入电力市场。

四、 圆桌讨论:商业化路径的挑战与机遇 💬

在圆桌讨论环节,各位专家聚焦商业化路径,进行了深入交流。

沈飞博士(未来汽车) 认为,企业端需找到用户体验与投资回报的平衡点。当前车网互动规模已到“等风来”的状态,企业应聚焦细分场景(如价差大的省份、特定合作项目)小步快跑,实现商业化。

库尔曼先生(德国) 指出,欧洲市场对新想法准备度更高,但规模化需要耐心。他观察到许多创新来自初创公司,而非传统巨头,需要政策和规则来释放潜力。

武斌主任(国家电网) *调,电网侧当前重点是推动 有序充电 全面铺开,这对电网、社会、车主三方均有利。对于V2G,仍需通过示范项目验证技术、探索规律,为规模化商用奠定基础。

张海涛副院长(中国电动汽车百人会) 从交通绿色转型角度,指出电池寿命、低温性能等仍是短板,需因地制宜发展。能源作为基础设施,应积极与“车路云”融合,找到自身定位。

姚丹亚教授(清华大学) 类比车路协同发展经验,认为车网互动也面临“先有车还是先有网”的协同难题。他建议寻找细分领域深耕(如农村、别墅场景),或打造像“永不闯红灯”这样的独特卖点,实现单点突破。

主持人刘永东秘书长总结认为,车能路云是系统工程,需各方协同;核心驱动力应围绕 服务车主,让车主感受到便利与实惠;发展路径应 分场景、小步快走,逐步推动。


课程总结

本节课中,我们一起学习了智能化技术在交能融合与车网互动领域的应用与展望。我们从未来能源云的构想出发,深入探讨了车电分离、换电模式、V2G、V2X等核心概念,并了解了AI大模型在能源管理与汽车全链条中的应用。同时,通过对国家政策的解读和圆桌讨论,我们认识到这是一项涉及技术、标准、商业模式和市场机制的系统工程,其商业化路径需要聚焦细分场景,以服务车主为核心,通过小步快跑的方式逐步推进。智能化正在为交通与能源的深度融合开启无限可能。

61:AI赋能文创产业核心技术与应用实践 🚀

在本课程中,我们将学习人工智能(AI)技术,特别是多模态大模型和AIGC(人工智能生成内容),如何为文化创意产业带来革命性变化,并激发新的生产力。课程内容基于“智启文创,激发无限新质生产力”论坛的核心演讲整理而成,涵盖了技术趋势、行业应用案例及未来展望。


一、 人工智能与文创产业的融合机遇 🤝

近年来,人工智能技术飞速发展,为文化创意产业带来了革命性变化,注入了新的活力。AI与文创结合所培育的新质生产力,为落实数字中国建设、加*数字文创和元宇宙新赛道的顶层设计与战略布局提供了新机遇。这有助于打造文创产业新的发展核心与爆发点。

上海市文化创意产业促进会等单位共同主办了相关论坛,汇聚了政府领导、院士学者及企业代表,共同探讨AI赋能文创的路径。

核心公式:
新质生产力 = AI技术 + 文创产业


二、 政策支持与上海的发展成果 📈

上一节我们介绍了AI与文创融合的宏观机遇。本节中我们来看看具体的政策环境与阶段性成果。上海在人工智能领域起步早、基础好、企业多、创新活跃,并围绕AI发展与治理进行了许多有益探索。

上海高度重视人工智能发展,全力推动AI赋能千行百业,在文创领域已形成一系列成果:

以下是三个突出的表现方面:

  1. 顶层设计与政策创新:出台了大模型发展“政策11条”,实施算力补贴以降低企业创新成本,并通过市场化机制加速智算资源建设,同时引进培育各类大模型企业。
  2. 新兴动能不断增*:建成了全国首个大模型创新生态社区,已吸引近80家企业在影视创作、数字文创、广告创意、电竞互动等领域集聚,形成了典型的场景与应用。
  3. 产业规模持续扩大:在建设全球影视制作中心、创意设计高地、亚洲演艺之都、全球电竞之都等方面成效显著,产业增速位居全国前列。

面向未来,上海将把握通用人工智能发展机遇,持续开展核心技术攻关,培育开放优质生态,并建设典型示范应用,以高水平赋能文化创意产业。


三、 多模态行业大模型:AI产业化的新引擎 🏭

在政策与产业基础的支持下,技术本身正在快速演进。本节我们将深入探讨推动AI产业化的核心技术——多模态行业大模型。

大模型的发展在技术与产业层面呈现新变化:开源模型爆发、多模态成为标配、智能体(Agent)潜力释放;企业级AI应用向纵深发展,并与硬件结合带来新产业革命。

大模型之所以重要,在于它拓展了人工智能应用的深度和广度,主要源于其三大特性:*大的泛化性广泛的通用性高效的实用性

大模型发展有三大趋势:

  1. 从单一模态向多模态演进
  2. 从通用大模型向行业大模型演变。行业大模型基于基座模型,结合行业知识,能真正赋能产业数字化转型。
  3. 从模型到工具链的完善。只有配备高效的工具链,模型才能解决具体的客户问题。

核心概念(行业大模型构建):

# 示意:行业大模型的生成逻辑
行业大模型 = 预训练基座模型 + 微调(行业高质量数据 + 行业知识规则 + 具体场景功能需求)

以“悠然多模态大模型体系”为例,其架构分为三层:

  • 模型层:包含产业通用大模型和各种行业大模型。
  • 平台层:即“Magic OS”人工智能操作系统,作为连接客户与模型的工具链。
  • 应用层:将生成的模型落地到具体场景。

该体系已成功应用于多个行业:

  • 工业检测:实现人机交互、知识管理及视觉检测的闭环。
  • 烟草行业:实现数据统一管理、安全生产监测与内容生成。
  • 交通治理:实现多元感知、智能识别与事件处理闭环。
  • 城市治理:实现多设备接入、大小模型协同与事件协同处理。

四、 AIGC技术的演进、突破与产品化 🎬

除了理解大模型,内容生成技术本身也在飞速进步。本节我们来看看AIGC(人工智能生成内容)的技术演进与产品化现状。

多模态生成技术(如图像、视频生成)正沿着一条独立于语言模型的曲线快速发展。目前,视频生成技术大致可分为L1到L5五个能力等级,当前行业普遍处于L2阶段,致力于生成可靠、精细的单镜头内容。终极目标是L5——输入小说,输出电影。

然而,技术落地必须考虑产品化与商业化的核心三角:成本、效率、体验。目前,生成一秒钟视频的成本仍较高,渲染等待时间较长,且用户使用门槛有待降低。

未来,赋能行业需要大模型与小模型、专家模型结合的路径。例如,“志向未来”基于底层基础模型,结合行业小模型服务客户,并发布了全球首个商用的Diffusion Transformer模型。

其“志向大模型2.0”在以下方面实现突破:

  • 图像生成:追求艺术感(美)、逻辑精准(准)、文字嵌入能力*(长)。
  • 视频生成:实现4K画质、运动自然、用户可定制时长,并能直出分钟级视频。
  • 3D生成:支持从文本生成3D模型,并可在VR/AR设备中交互。

核心代码(示意视频生成):

# 示意:基于提示词生成视频
video_output = generate_video(prompt="海底世界,从海面建筑沉入海洋", duration="60s", aspect_ratio="16:9")

五、 技术落地案例:红色文化的元宇宙探索 🏛️

理论和技术最终需要场景来承载。本节我们将目光投向一个具体的垂直应用场景——红色文化的数字化与元宇宙化。

“数字一大”元宇宙项目是上海市元宇宙重大应用场景之一,利用5G、AI、XR等技术,打造线上数字孪生空间、线下沉浸式交互空间以及虚实融合空间。

该项目聚焦四大方向:

  1. 文物数字化保护:实现12.8万件革命文物的全本数字化,并在元宇宙场景中提供可翻阅的文物体验。
  2. 数字展陈:构建原生元宇宙空间,串联红色故事,形成闭环式游览体验。
  3. 红色服务外延:开发基于数字资产的大空间应用,并与线下城市打卡、旅游结合。
  4. 数字文创:发行数字藏品,串联线上数字资产与线下实体文创。

该项目标志着红色文化元宇宙生态圈1.0版本的建成,其服务矩阵通过多元端口(APP、小程序、VR、大屏)触达用户,并期待与更多AI大模型机构合作,探索AI+元宇宙在红色文化传播上的新范式。


六、 XR与AI:赋能线下文旅新体验 🕶️

数字体验不仅限于线上,也在重塑线下。本节我们探讨扩展现实(XR)技术如何与AI结合,为线下文旅创造新的可能。

XR技术已超越早期的游戏和视频范畴,广泛应用于教育、医疗及线下娱乐。更*的算力、更高的清晰度、MR技术、大空间定位能力以及AI驱动的3D内容生产效率提升,共同使XR技术成为文旅新质生产力的重要引擎。

数字文旅3.0时代以数字化、智能化、虚拟化为趋势。XR线下体验展现出巨大潜力,全球市场已进入“亿元票房”里程碑阶段。

以PICO的实践为例,其通过与文博机构合作(如国家图书馆、敦煌研究院),推出了广受欢迎的VR体验项目。其中,大空间VR体验被认为是未来影院、展览和演出的新雏形。PICO提供从定位算法、播控能力到线下服务工具的全面解决方案,助力合作方“拎包开店”。

正在推进的项目包括“数字一大初心之旅”VR大空间、敦煌大空间等,旨在用XR技术讲好中国故事。


七、 圆桌讨论:AI与未来生活的多元展望 💡

技术的最终目的是服务人与社会。在本节中,我们通过一场圆桌论坛,汇集多位行业领袖,从不同视角展望AI与未来生活的融合。

讨论涵盖了多个前沿领域:

  • 游戏与云渲染:AI用于游戏原画生成、3D资产创建、数字人生成与驱动,云端协同端侧算力实现实时超分,提升视觉体验。
  • 数字资产与区块链:在AI时代,企业拥有的数据、内容是核心生产资料。通过区块链技术将其资产化,可与AI形成“生产力与生产资料”的良性互动,并实现价值交换。
  • 视频创作与出海:AIGC降低了专业视频创作门槛。企业凭借音视频处理技术、海外本地化认知及对短视频平台算法的理解,可为商业客户提供智能剪辑、AI短剧、内容营销等出海服务。
  • 政务与法律服务:AI在垂直场景(如政务热线、法律咨询)中能高效解决特定问题,创造显著社会效益。同时,AI生成内容的著作权归属等法律问题已有司法实践探索,*调人的创造性投入是关键。
  • 脑机接口与健康:非侵入式脑机接口设备可精准采集脑电信号,用于睡眠监测、神经退行性疾病筛查,并通过神经反馈机制进行调控,未来在认知、情绪调控方面潜力巨大。
  • 教育咨询与金融信息:在高考志愿填报等领域,AI基于垂直领域大数据,可提供个性化智能服务。在金融媒体领域,AI极大提升了资讯处理效率,并赋能智能投顾、投研等场景。

核心观点:AI不是要替代人,而是与人协同,释放人的创造力。AI应用场景无高低之分,关键在于解决真实问题。同时,在拥抱AI时,需关注数据资产化、标准输出、法律法规等配套建设。


八、 总结与展望 🌟

在本课程中,我们一起学习了AI赋能文创产业的全景图。

我们从宏观机遇政策环境出发,了解了AI与文创融合的巨大潜力。接着,我们深入探讨了核心驱动技术——多模态行业大模型AIGC的演进、架构与落地逻辑。通过“数字一大”和“XR文旅”等具体案例,我们看到了技术如何在红色文化传承、线下体验升级等垂直场景中创造价值。最后,通过圆桌讨论,我们展望了AI在游戏、法律、健康、教育、金融等更广阔领域与未来生活融合的多元可能性。

总结而言,AI技术正深刻改变文创产业的生产方式、体验形式和产业边界。未来,持续的技术创新、开放的产业生态、深度的场景融合以及对伦理、法律、标准的关注,将共同推动AI与文创产业迈向更加无限的新篇章。


课程编号: P61
课程来源: 智启文创,激发无限新质生产力论坛 (20240706)

62:AI创新生态构建与挑战 🚀

概述

在本节课中,我们将学习2024年中兴通讯AI创新生态论坛的核心内容。课程将涵盖AI技术发展趋势、国产算力生态构建的挑战与机遇、大模型在各行业的应用实践,以及如何通过开放合作推动产业繁荣。我们将深入探讨技术细节、产业痛点及解决方案。


一、开场致辞与行业背景 🌉

🎼 欢迎各位来到中兴通讯AI创新生态论坛。今天我们齐聚上海,共同探讨数字经济发展新机遇、行业数字化转型以及AI数据新纪元。

核心观点:AI正从“助手”角色转变为“基础设施”。它代理企业、人类与个人的知识,但当前发展面临生态封闭与供应受限两大问题。解耦是繁荣生态的根本方法。

中兴通讯的定位:我们愿做“一根扁担”,连接算力芯片供应商与AI生态需求方。我们凭借在计算互联芯片、IDPU芯片及复杂软硬件集成领域30年的积累,致力于打造开放赋能、自主创新的智算底座。

公式/代码描述核心能力

  • 网络互联能力:基于多年网络经验,优化算力互联。
  • 软硬件集成能力Complex_System_Integration(Hardware, Software, Platform, Model) -> Deployable_Product

二、构建国产AI算力生态的挑战与路径 🏗️

上一节我们介绍了AI作为基础设施的定位,本节我们来看看构建这一基础所面临的具体挑战,特别是国产算力生态的建设。

中国工程院院士指出,构建国产AI万卡系统至关重要但也充满挑战。大模型发展进入多模态、与行业深度结合的新阶段,算力需求贯穿其全生命周期。

大模型对算力与存储的需求

以下是模型生命周期各环节对算力与存储的要求:

  1. 研发与训练:需要大规模算力进行模型训练(如GPT-3使用上万张卡)。数据预处理(占时近半)和训练过程对存储IO性能要求极高。
  2. 模型精调:针对特定领域(如医疗)在基础大模型上进行再训练,也需要可观算力。
  3. 模型推理:处理用户实时请求,成本中算力占比高达95%。

构建万卡系统的五大关键问题

构建高性能万卡集群需系统化解决以下问题:

  1. 运算精度平衡:需兼顾FP16/INT8等低精度运算性能与FP64等高精度运算能力,比例需合理(如1:50至1:100)。
  2. 网络平衡设计:万卡互联拓扑设计是核心挑战。全连接代价过高,需采用分组(如百卡一组)等分层互联策略,权衡成本与通信效率。
  3. 内存平衡设计:大模型即大数据,需优化内存访问模式,避免拥塞。
  4. IO子系统平衡设计:万卡集群平均无故障时间短,必须实现高效的“检查点”机制。需通过SSD缓存、优化文件系统等手段,将检查点保存时间从小时级降至分钟级。
  5. 软件生态建设(国产卡核心):国产卡生态相比英伟达仍有差距,关键在于降低用户移植和开发成本。

国产算力生态的痛点与破局

痛点:国外算力获取难;国产算力使用麻烦、种类多、效率相对低;每家芯片公司需支持众多模型,适配工作量大。

破局思路

  • 使用国产算力:这是根本方向。
  • 构建统一软件栈:对接主流生态(如TensorFlow/PyTorch),提供统一并行编程模型,降低不同芯片的优化成本。
  • 并行计算与智能编译:挖掘国产算力硬件性能。
  • 共建开放生态:通过广泛使用与反馈,共同改善体验。

核心软件栈列表
以下是构建健康生态必须做好的十个关键软件:

  1. 编程框架(如PyTorch)
  2. 并行加速库
  3. 通信库(如NCCL)
  4. 算子库
  5. AI编译器
  6. 编程语言
  7. 调度器
  8. 内存分配系统
  9. 容错系统
  10. 存储系统

三、中兴通讯的AI生态实践:开放、*网、训推并举 ⚙️

上一节我们探讨了国产算力生态的宏观挑战,本节中我们来看看企业层面的具体实践方案。

基于对AI生态从1.0(同构同质)向2.0(异构异质)演进趋势的判断,需加速三个转变:从训练竞赛向推理落地转变;从追求极致性能向性价比优先转变;从垂直封闭生态向开放解耦生态转变。

四大举措

  1. 开放基座,多元算力灵活供给

    • 推出R6965系列AI服务器,兼容多种算力卡(CPU/GPU),支持风冷/液冷,实现“换芯不换座”。
    • 基于TECS云网底座升级,实现通算与智算资源的统一纳管,支持异构算力原生供给和混布训练。
    • 提供集群、轻量化、插件化三种交付模式,与第三方平台集成。
  2. 以网*算,打造高效万卡集群

    • 机内:采用Olink交换互联架构,替代Mesh互联,降低复杂度,提升单机算力密度。
    • 机间:通过DPU卸载和全局流控,实现智能路由,提升吞吐量,降低时延。
    • 集群:提供超大容量星云网络,支持无损以太网灵活扩展,最大支撑36000+ GPU卡集群。
  3. 训推并举,加速商业闭环

    • 训练:探索非张量拆分与异构并行,通过集合通讯库转换,实现跨厂家GPU构建大规模集群。
    • 迁移:推出Air Booster迁移工具,实现主流大模型跨平台快速迁移(约1-2周)。
    • 推理:推出智能感知分发系统,根据算力配置、内存、精度等,为不同应用分配合适的推理平台。

  1. 多方合作,催熟AI产业生态
    • 建立Cloud AI开放算力实验室,构建多厂家芯片、服务器、平台、模型的互联测试平台。
    • 推出开放一体机,集成业界主流大模型与AI应用,开箱即用。
    • 倡导软硬解耦、训推解耦、模型与应用解耦的开放共赢生态。

四、行业应用实践:电力、企业级大模型与艺术创新 🎯

技术与生态的最终价值在于应用。本节我们聚焦AI在电力、企业服务及文化艺术等领域的实践与思考。

国家电网:AI在新型电力系统中的应用

  • 应用现状:将AI规模化应用于电网生产、运维、客服等环节,处于起步阶段。成熟场景包括输电通道智能巡检、变电站智能巡视(CV领域)及声纹分析(在电磁干扰环境中更具优势)。
  • 核心挑战
    • 可靠性要求极高:电力系统控制需绝对可靠,AI决策必须可解释、可控。
    • 大模型应用谨慎:大模型的黑盒特性使其暂不适合调度控制等精准决策场景,更适合辅助决策、缺陷识别。
    • 算力与成本:大模型训练算力需求是传统的数十倍,推理也达数倍。
    • 多模态需求:故障诊断需融合图像、声音、历史数据等多维信息。
  • 未来方向:探索基于图计算、神经网络重写电力系统计算软件;发展可解释AI;统筹分布式算力,训练百亿级行业模型。

阿里云:企业级大模型与RAG场景应用

企业级大模型落地需保证准确性、安全性与低延迟。RAG是关键技术路径。

RAG系统构建的七大阶段

  1. 数据接入:支持多格式、多语言、非结构化数据接入。
  2. 文档拆分:正确切分文档是结果准确的基础。
  3. 索引构建与存储:结合传统搜索索引与向量嵌入索引,平衡效果与稳定性。
  4. 生成:提供模型微调、长上下文缓存与一致性校验。
  5. 检索(预/中/后)
    • 预检索:Query路由、改写与扩展。
    • 检索:多重检索器,支持微调迭代。
    • 后检索:结果重排、压缩,供大模型高效处理。
  6. 评估与调试:提供可观测系统,支持单步调试,快速定位优化点。
  7. 部署与开源:提供一键部署产品,并将整套系统开源,共建社区。

智谱AI:打破企业智能边界

企业智能边界可通过技术不断外延。大模型应被视为能力集合,而非功能API。

企业大模型就绪度阶段

  1. M-Ready:调整业务、数据、团队以适应大模型。
  2. AI-Native应用开发:开发AI原生的应用。
  3. 企业M化:调整组织结构与工作流程。
  4. AI驱动创新:以AI驱动企业全流程创新。

就绪度检查清单

  • 技术:评估驱动开发、API能力化。
  • 团队:技能重组、流程变革。
  • 基础设施:算力规模升级。
  • 产品:重新思考产品定义,从用户故事出发端到端重构。

上海戏剧学院:AI时代的线下大空间沉浸演绎

AI在艺术创作中助力概念生成,但高质量落地仍需复杂工程。

  • 实践:开发大型多人空间沉浸式演绎项目,结合空间定位、实时渲染、神经技术。
  • 挑战
    • 超高分辨率渲染(如球幕LED)算力需求巨大。
    • 多用户并发下的实时渲染与数据传输(如VR设备)面临算力、延迟、信号干扰挑战。
  • 合作价值:与中兴等厂商合作,将算力与传输优化等工程难题剥离,让艺术家聚焦创作。AI目前是*大的辅助工具,未来目标是实现自然语言驱动完整创作流程。

五、算力基础设施与生态合作实践 💻

上一节我们看到了AI的多元化应用,本节我们回归底层,看看支撑这些应用的算力基础设施厂商如何应对挑战并推动合作。

壁仞科技:国产大算力GPU的落地实践

大模型落地是算法与工程的协同创新。壁仞从三个维度构建解决方案:

  1. 硬件集群算力:采用Chiplet等先进封装技术,提供从板卡到集群的全栈产品。
  2. 软件有效算力
    • 并行扩展:创新ZeRO优化、自动混合并行策略搜索,降低使用门槛。
    • 调度效率:拓扑感知调度、3D异步检查点(降低开销)、动态资源迁移与弹性伸缩,提升资源利用率。
  3. 异构聚合算力:通过抽象通信层、流式并行等策略,实现与英伟达GPU等异构集群协同训练,效率可达99%。
  4. 生态策略:坚持开源开放,通过代码定向开源赋能深度合作伙伴;提供完善迁移工具降低用户成本;与高校合作培养生态人才。

中国移动:大规模超万卡新型智算集群的展望

AI进入“超万卡集群”新时代。中国移动在构建万卡集群基础上,开展前沿技术研究:

  1. 全调度以太网:原创GSE网络技术,从报文级分发、主动拥塞控制、全局调度等方面提升网络性能,正推进芯片研发与试点。
  2. 卡间互联协议:针对国内开放交换互联空白,提出“欧拉”全向智联开放协议,旨在通过IP授权推动产业闭环。
  3. 跨集群分布式训练:研究园区(<10km)、同城(<100km)、跨省(>1000km)三级场景的算力池化技术,分阶段解决网络与电力问题。
  4. 跨架构平台迁移:算原生平台已实现异构芯片推理统一调度,正探索面向异构的混训技术。

六、圆桌论坛:挑战、风险与开放生态共建 🤝

在最后的圆桌讨论环节,来自芯片、模型、应用、研究机构的专家共议AI推广的困难与生态共建。

主要困难与风险

  • 商飞智能:严肃行业面临AI“幻觉”与可解释性问题;数据安全敏感;人机决策权转移困难;终端用户提示工程能力不足。
  • 上海人工智能研究院:政策法规滞后于技术;芯片研发成本高、商业化不明;大模型落地难、算力成本高;行业用户AI能力有差距;存在隐私侵犯、信息造假等道德风险。
  • 百川智能:基座大模型缺乏领域数据;人模交互成本高(提示词撰写难)。
  • 寒武纪/摩尔线程:用户对芯片要求“既要又要还要”(高性能、低价格);模型技术路线未收敛,芯片适配碎片化;万卡集群是超级系统工程,挑战巨大。
  • 中国电子云:需解决多元芯片统一调度、模型与芯片解耦、数据要素资产化与安全使用等问题。

开放合作生态的构建

  • 芯片厂商
    • 寒武纪:硬件接口标准化以降低成本;软件开源开放,参与社区共建。
    • 摩尔线程:兼容CUDA生态;与国内同行协作拓展本土生态;参与开源社区与联盟。
  • 大模型厂商
    • 百川智能:明确“不做场景应用、不做总集”的定位,通过两种模式合作共赢:1)与行业客户共创,快速落地并练兵;2)与有客群和技术的ISV合作,由ISV交付。
  • 行业应用方
    • 商飞智能:定位为“系统集成商”,探索点(单点场景)、线(业务流程)、面(多智能体协同)的AI应用路径,最终构建企业级“机械文明”。
    • 中国电子云:作为“国家队”,聚焦算力调度、数据要素资产化、行业大模型应用,整合生态产品面向关键行业输出。
  • 研究机构
    • 上海人工智能研究院:促进芯片商、科研团队、行业用户多方交流,形成应用闭环,实质性推动产业发展。

总结

本节课中,我们一起学习了AI创新生态的全景图。我们从宏观趋势认识到AI成为基础设施以及国产算力生态建设的必要性与复杂性;从技术实践层面了解了中兴通讯等企业如何通过开放基座、以网*算、训推并举来构建解决方案;从行业应用视角看到了AI在电力、企业服务、文化艺术等领域的价值与挑战;最后,通过圆桌讨论,我们深刻体会到,面对算力、数据、安全、成本等多重挑战,唯有打破壁垒、坚持开放合作,才能汇聚产业力量,共创智慧未来。预测未来最好的方式,就是共同创造未来。

63:快手大模型技术与应用战略全解析 🚀

在本节课中,我们将全面学习快手在2024世界人工智能大会上分享的大模型技术全景、核心产品发布及其商业化应用战略。我们将深入探讨快手的语言大模型、推荐大模型、视觉生成模型,并了解这些技术如何驱动其核心业务与商业化增长。

概述:快手与AI的深度融合

快手是一家真正以AI为核心的短视频直播平台。如果没有以机器学习为代表的AI技术,快手的短视频推荐业务将无法成立。AI技术贯穿于快手业务的三大核心环节:内容推荐内容理解内容生产

随着大模型时代的到来,快手正致力于用新技术改造和创新这三大AI模块,构建了包括推荐大模型、语言大模型(快意)、多模态理解模型以及视频生成大模型(可灵)在内的完整技术体系。


一、 快手大模型技术全景

上一节我们概述了AI对快手业务的核心价值,本节中我们来看看快手大模型家族的具体构成与技术路线。

快手已经构建了支持万亿参数大模型训练和推理的基础设施。在此之上,研发了领先的三大类模型:

  1. 语言大模型 - 快意:用于文本理解、生成与交互。
  2. 推荐大模型:用于核心的短视频内容分发。
  3. 视觉大模型:包括文生图模型可图和视频生成模型可灵,用于内容生产。

这些模型通过统一的应用服务平台,支撑着快手包括短视频、直播、广告、电商、本地生活在内的所有重要业务。


二、 语言大模型:快意的能力与商业落地

快手自研的语言大模型“快意”经过多个版本迭代,在内部盲测中,其中文综合能力已达到GPT-4的水平。

面对行业“百模大战”,快手交出了一份清晰的商业答卷。快意大模型已深度应用于商业化领域:

  • 视频脚本生成:为广告主自动生成短视频广告脚本。
  • 直播实时脚本:辅助直播带货,生成实时话术。
  • 智能客服:用于广告线索的承接与初步沟通,结合数字人技术。

应用成果:基于AIGC的广告消耗从年初近乎为零,快速增长至日均消耗近2000万,峰值日消耗远超2000万。这验证了大模型在快手平台上的明确商业路径与应用价值。


三、 推荐大模型:驱动业务增长的引擎

推荐是快手最传统也最核心的AI技术。快手构建了全球领先的推荐大模型技术。

技术亮点

  • 模型规模:线上版本参数达10万亿量级,远超当前主流语言大模型的参数量级。
  • 序列处理:可对每个用户处理长达百万级的行为序列,充分挖掘用户兴趣。

业务影响:该技术已助力快手过去3-4年的用户时长、留存和DAU持续增长。

下一代技术:快手正在研发基于Transformer架构的下一代推荐大模型——Action Transformer。它能近乎无损地对用户全生命周期行为序列建模,单次上线即为快手APP带来每天超4亿分钟的用户时长增长。


四、 视觉生成大模型:可图与可灵

视觉生成是当前AI领域最受关注的方向之一,快手在此领域发布了两个重磅产品。

4.1 文生图模型:可图 🖼️

可图是一款面向全部用户开放的文生图产品,其特点如下:

  • 效果领先:在内部与全球知名产品的盲测对比中名列前茅,是全球顶尖的文生图产品之一。
  • 核心能力
    • *大的语义理解与指令跟随:能精确还原复杂文本描述中的细节。
    • 电影级画质:通过渐进式训练和*化学习对齐人类审美,生成具有摄影质感的图像。
    • 出色的控制生成:支持多种风格、人像保持、轮廓保持,并拥有独特的“写字”能力。
  • 重磅发布:可图模型于大会当天正式开源,成为可用的最佳开源文生图产品之一。

4.2 视频生成模型:可灵 🎬

可灵是快手发布的影像级视频生成大模型,自6月6日发布后在全球范围内引起广泛关注。

核心能力亮点

  1. 大幅度合理运动:生成符合物理规律、运动幅度真实的视频。
  2. 分钟级长视频生成:支持生成及续写最长3分钟的视频。新版模型单次生成长度从5秒提升至10秒。
  3. 复杂物理仿真:能精细模拟如“吃面”、“给猫洗澡”等复杂交互场景的物理特性。
  4. *大的概念组合:基于跨模态理解,生成充满想象力的视频内容。
  5. 电影级高清画质:新版“高画质版”在细节、构图、光影上实现质的飞跃。
  6. 领先的图生视频:支持首帧、首尾帧控制,实现精确的镜头转场和一镜到底效果。
  7. 丰富的可控性:提供多种预设及可调参数的镜头运动控制(如推、拉、摇、移)。

发布成果:申请用户超50万,已开放近30万内测资格,用户累计生成视频超700万条。

本次大会重磅发布

  • 基础模型升级:发布“高画质版”,画质显著提升。
  • 控制能力增*:上线“首尾帧控制”和“镜头控制”功能。
  • 易用性提升:推出Web端一站式创作平台,集成文生图、文生视频、图生视频功能。
  • 启动创作大赛:设立30万奖金池,与六所高校合作,优胜者可加入“星芒短剧创作者孵化计划”,获得百万现金和千万流量扶持。

技术方案:可灵采用基于Transformer架构的扩散模型(DiT),通过自研的3D VAE对视频进行高效压缩,使用时序空3D注意力机制充分建模信息,并依赖海量高质量数据与自动化处理平台进行训练。


五、 大模型的商业化应用实践

本节我们来看看快手如何将大模型技术转化为实际的商业增长。商业化应用主要围绕三个产品展开,取得了显著成效。

以下是三大商业化产品的核心数据与应用场景:

产品名称 核心功能 关键数据/成果 主要应用场景
磁力开悟 AI生成广告素材 峰值支持单客户单日生产10万条;视频成本从200元/条降至约0.47元/条;三秒播放率、点击率显著提升。 为广告主提供一站式视频素材生成,大幅降低创意成本,提升投放效率。
女娲数字人 AI数字人直播 日均广告消耗约1700万;直播间搭建成本极低,可实现24小时直播;在ROI中等区间表现优于真人直播尾部梯队。 替代部分真人直播,尤其在冲量、日常店播等场景,实现降本增效。
派(营销Bot) 智能线索承接与互动 日接待用户约22万;5分钟回复率提升30%,开口率提升11.6%,有效线索获取率提升39%。 作为“数字员工”承接广告线索,进行智能客服与互动,提升线索转化效率。

演进路径:商业应用的成功并非一蹴而就。初期版本效果粗糙,通过坚持“人在回路”(Human-in-the-loop)的迭代模式,紧密洞察用户需求,使产品从“不可用”逐步演进至“可用”甚至“好用”。

未来方向

  1. 探索图生视频在小说等内容领域的应用。
  2. 开发数字人2.0,实现数字人与真人连麦互动
  3. 将“派”从数字员工升级为行业专家顾问,更深度解决用户问题。
  4. 在广告投放端,利用大模型优化冷启动和商品理解,实现更智能的投放。

六、 产学研合作与未来展望

为推动大模型技术发展,快手与中国计算机学会(CCF) 联合发布了 “CCF-快手大模型探索者基金”。该基金旨在连接产业实践与学术科研,在代码大模型、视频处理、多模态理解与生成等12个课题上提供资金、算力、场景和数据支持,促进成果转化。

对视频生成技术的展望

  • 效果快速提升:生成质量正逼近图形渲染与实拍,将为游戏、动画、影视产业带来新机遇。
  • 生产消费界限模糊:极大降低视频创作门槛,促进内容生态繁荣。
  • 作为世界模拟器:为具身智能提供仿真训练环境。
  • 技术持续演进:未来将向多模态统一模型发展,推理成本和延时将持续降低,加速行业落地。

总结

本节课中我们一起学习了快手大模型技术与应用战略的全貌。我们了解到:

  1. 技术体系:快手构建了覆盖语言、推荐、视觉生成的完整大模型家族,并拥有*大的底层基础设施。
  2. 核心产品:语言模型“快意”已实现规模化商业应用;推荐大模型持续驱动业务增长;视觉模型“可图”和“可灵”在效果上达到全球领先水平,并持续快速迭代。
  3. 商业闭环:通过“磁力开悟”、“女娲数字人”、“派”等产品,快手已将大模型能力深度融入广告、电商等商业化场景,形成了清晰的增长路径。
  4. 开放生态:通过开源可图模型、发布产学研基金,快手正积极与学术界、产业界合作,共同推动大模型技术发展。

快手正以其深厚的技术积累、丰富的业务场景和务实的应用策略,在大模型时代坚定地探索着“新AI、新应用、新生态”的未来。

64:大模型语料构建与应用实践(课程编号:P64)

概述

在本节课中,我们将学习大模型时代下,高质量语料数据的重要性、构建方法、平台工具以及在不同行业的应用实践。课程内容基于“语料筑基,智生时代”主题论坛的讨论,涵盖了从理论到落地的完整知识体系。


一、 语料数据:大模型时代的核心燃料

人工智能的浪潮激荡全球,更*的算法和更快的算力正在重塑数据飞轮。真实性、鲜活度、大样本、多样性、知识量成为关键。数据创造数据、知识创造知识,一场语料数据的革命正扑面而来。

高质量语料对于大模型在各行各业的运用十分关键,有助于大模型更好地适配实际应用场景,加快实现人工智能赋能千行百业的愿景。

核心公式高质量大模型 = 先进算法 + *大算力 + 高质量、大规模、安全可信的语料数据


二、 语料构建方法论与平台工具

上一节我们介绍了语料数据的重要性,本节中我们来看看如何系统性地构建和管理语料。

2.1 语料运营平台 1.0 发布

为打造世界一流的语料枢纽,实现更高效率和更高质量的语料供给,库帕斯科技研制完成了“语料运营平台1.0”。该平台按照“采、洗、标、测、用”五位一体布局。

以下是该平台的核心功能模块:

  • 高效率的“采”:打造语料任务分解的MS系统,支持多元多模态采集与存储。
  • 高质量的“洗”:面向文本、图片、音频、视频,打造智能清洗算子体系,支持自适应排版结构和封装全过程。
  • 更精准的“标”:实现全自动的分类分级、内容摘要与美学打标、视频解读标注等。
  • 更科学的“测”:实现自动化内容合规评测,给予智能抽检的人工辅助质量检测。
  • 更个性的“用”:实现语料按需定制交付。

平台研制完成智能清洗算子超100个,智能标注算子超70个,基本建成完善的语料源数据管理、语料数据集生成及管理,以及语料GPT生产模式。这推动了语料加工从规则清洗的流水线时代,迈向模型驱动的语料超级工厂时代。

2.2 语料库建设导则发布

为了推动语料数据全行业提质增效降本,上海汇聚大模型语料数据联盟的力量,研制完成了《语料库建设导则》,重构了从原始数据到语料成品的方法论。

导则的核心内容包括:

  • 定义范畴:对包括文本、图片、音频、视频等多模态语料数据的对象和范畴进行了定义。
  • 构建方法:确立了以知识体系为导向的语料构建方法。
  • 规范流程:规范了语料采集、清洗、标注、测试、交付的全过程。
  • 定义架构:对语料生产系统及语料产品架构进行了定义。
  • 完善框架:完善了价值对齐和数据安全的基本框架。

该导则已在库帕斯语料运营平台的实践中深入应用,为从原始数据到模型可训练的语料成品提供了透明化、白盒化的机制。


三、 行业语料技术白皮书与实践

大模型赋能千行百业,需要构建与场景适配的语料体系。本节我们聚焦金融、生命健康、教育三个关键领域的语料建设实践。

3.1 金融语料技术白皮书

该白皮书由上海资产管理协会牵头编制,聚焦银行、证券、保险、基金等行业实践。

  • 核心内容:重新定义了高质量金融语料数据集的内涵和外延,形成了基于金融领域知识体系的“语料魔方”方法论。
  • 数据加工:按照信批数据、行业报告、内部数据、图书期刊等金融多元异构数据,建立了分类、分级、分层的遴选和语料加工机制。
  • 应用价值:相关成果已启动应用试点,对于深化金融领域模型垂类应用,创新语料智能配比方法提供了重要支撑。

3.2 教育语料技术白皮书

该白皮书在教育部教育信标委指导下,由华东师范大学牵头编制。

  • 核心内容:确立了教育行业语料数据的标准用例与价值体系,形成了一套教育AI大模型数据治理与共享技术标准。
  • 应用梳理:从社会、学校、企业三个维度,梳理了教育语料数据的典型案例和创新应用。
  • 核心目标:助力教育领域模型更有效地进行预训练和精准测评。

3.3 生命健康语料技术白皮书

该白皮书由中国信通院上海工创中心牵头编制。

  • 核心内容:重新定义了高质量生命健康语料库建设的新标准、新路径。
  • 方向规划:从基础医学、药物研发、临床医学、健康管理、中医中药五个方向,确立了生命健康语料库的路线图。
  • 工具创新:创新了从寻源、清洗到标注、测试的工具体系。相关成果已付诸建设实践,语料建设的体系化程度更高,缺陷率更低,知识量和多样性远高于行业平均水平。

四、 大模型与数据库:双轮驱动的AI发展路径

上一节我们了解了行业语料的实践,本节我们从更宏观的技术架构视角,探讨大模型发展的未来路径。中国科学院鄂维南院士提出了“大模型与大数据库双轮驱动”的AI发展新思路。

4.1 当前AI发展的三个基础设施

  1. 模型:以PyTorch、TensorFlow等工具为代表,模型搭建已相对简单。
  2. 算力:大家已有深刻认知。
  3. 数据:核心问题在于如何高效处理海量非结构化数据(文本、图片、语音、视频)。

4.2 从“穷人版”技术路线到双轮驱动

  • “穷人版”技术路线:基于AI数据库,构建低成本的流水线生产模型的平台。优点是成本低,能快速解决简单场景任务;缺点是难以处理复杂、不可预见的任务。
  • 双轮驱动新路径:将大模型方法与高性能通用AI数据库方法相结合。
    • 底层:将所有语料数据装入统一的AI数据库进行管理。
    • 中层:利用大模型作为基座,结合专用知识库,低成本批量生产智能体(Agent)或小模型。
    • 上层:采用基于大模型的操作系统,对复杂任务进行分解,并对智能体进行调度。

4.3 技术实践案例:亿立方模型

针对大模型知识存储压力大的问题,提出了“亿立方模型”,对知识进行分层处理:

  • 隐性记忆(高频知识):存储于大模型内部。
  • 显性记忆(低频知识):通过内置数据库处理。
  • 工作记忆:在两者之间进行转换。
    这种方法可以大幅降低模型规模压力(可降低10倍),并对大模型的底层架构进行了深度改造,实现了模型与数据库的协同训练。

核心洞见:中国发展人工智能,不能仅靠堆叠大模型,必须从系统角度进行优化,充分发挥在数据库等领域的优势,探索适合国情的通用人工智能技术框架。


五、 价值对齐:语料供给的伦理与方向

如何让大模型有德、有趣、有序、有品、有用?价值对齐是大模型可持续演进的重要基石。人民网分享了基于价值对齐的语料数据创新供给实践。

5.1 主流价值语料库建设

人民网建设了“在中国语境下的主流价值语料库”,旨在解决国产大模型普遍存在的价值观安全问题。

  • 建设方式:动员专业记者编辑拟定重大问题、敏感问题的标准答案,经过“三审三校”后入库。
  • 现有规模:已建设问答语料超12万个,主流价值文章超3000万篇(字数超300亿汉字)。基础语料可开源用于预训练,问答语料已与多个国内主流大模型对接验证。

5.2 多维度价值对齐语料库

在主流价值语料基础上,进一步提出构建面向全人类共同价值的“多维度价值对齐语料库”,包含五个维度:

  1. 伦理价值(有德):遵循社会道德规范和法治精神。
  2. 情绪价值(有趣):满足情感认同、交流和成长需求。
  3. 文化价值(有品):助力文化素养提升,促进文明互鉴。
  4. 社会价值(有序):推动社会公平正义和可持续发展。
  5. 技术价值(有用):确保安全性、可靠性、可控性和公平性。

核心观点:在人工智能从“人类养育的孩子”成长为“人类共同大脑”的过程中,需要用优质的语料作为“教材”,培养其智能向上、造福人类的能力。


六、 产业落地:模型与语料的结合实践

理论需要实践检验。本节我们通过两家企业的分享,看模型与语料如何在产业中落地。

6.1 通用模型公司的产业落地路径(节月星辰)

从好的基础模型到好的行业应用存在巨大鸿沟。节月星辰总结的方法论是:

  1. 拥有一个高智商的基础大模型。
  2. 获取高质量的行业垂类数据,打磨成行业模型。
  3. 明确任务目标,嵌入行业工作流,利用行业知识库,结合专家反馈,最终形成可落地的应用。
    实践案例:与财联社合作,利用大模型自动生成财经快讯,将生产效率提升数十倍;与国泰君安合作,基于其语料和数据,批量生产服务于智能投研的Agent。

关键认识:好的基础模型 + 好的语料平台与生态,才能为行业打造高价值的应用。

6.2 文化娱乐行业的语料优势与实践(游族网络)

游戏语料具有独特的经济与社会价值:

  • 数据规模:全球数十亿活跃玩家产生海量数据。
  • 互动性*:游戏场景丰富,能捕捉用户深度反应,为AI提供多样化学习材料。
  • IP与价值观塑造:可直接通过数据获取用户对IP的喜好,进行正向价值观引导。
    实践方向
  • 提升体验:通过分析玩家反馈优化游戏,利用AIGC实现个性化推荐。
  • 智能陪伴:开发AI玩伴“小游匠”,提供攻略建议与情感陪伴。
  • 生态构建:致力于打造涵盖AI算力、基础设施、产业应用、人才培养的AI文化娱乐生态体系。

七、 圆桌讨论:共话未来语料供给

本节我们通过圆桌论坛,汇集产业多方观点,探讨语料供给的未来趋势。

7.1 大模型对语料供给的新要求

  • 需求侧变化:需求规模变大,无监督语料需求增加;领域语料重要性凸显,需要专业知识处理。
  • 供给侧变化:行业数据拥有方成为新供给方,但与模型方的“共创”成为新常态。
  • 技术赋能:大模型本身也能用于提升语料处理效率。

7.2 自动化标注与合成数据的角色

  • 自动化标注:已从“预标注”阶段发展到利用多种算子组合解决子任务的阶段。理想情况下自动化比例可达90%以上,但实际中难例数据仍需人机协同。演进规律是从人工为主到机器为主。
  • 合成数据
    • 必要性:在真实数据稀缺的 corner case(如极端驾驶场景)中不可或缺。
    • 局限性:在对真实性要求高的场景(如工业领域)需谨慎使用,无法完全替代真实数据。
    • 配比原则:没有固定之规,需在模型选型、数据获取难度、成本间权衡。目标是使用“尽可能少但足够的真实数据”配以“合理多的合成数据”。

7.3 给创新创业者的建议

  1. 把握趋势:数据行业是“长坡厚雪”,大模型带来新机会。
  2. 专业分工:未来语料产业将向寻源、加工、服务等环节更专业化分工发展。
  3. 聚焦垂类与场景:在垂直领域或特定应用场景深挖,可能比追逐通用大模型更有机会。
  4. 注重工具与标准:关注工具的智能化、质量控制的标准化和团队的专业化。
  5. 保持耐心:尤其是在工业数据等领域,需要时间、耐力和深厚积累。

总结

在本节课中,我们一起学习了:

  1. 语料的核心地位:高质量、大规模、安全可信的语料是AI时代发展的不竭动力。
  2. 系统化构建方法:通过“语料运营平台”和“建设导则”,实现了语料生产流程的标准化、智能化。
  3. 行业化落地实践:金融、教育、生命健康等行业已形成具体的语料建设白皮书与实践案例。
  4. 技术发展新路径:“大模型与大数据库双轮驱动”是值得探索的高效、低成本发展路径。
  5. 价值对齐的重要性:构建多维度价值对齐的语料库,是引导AI赋能真实世界、健康发展的关键。
  6. 产业生态的繁荣:需要模型方、语料供给方、平台方、应用方紧密合作,共建开放链接的语料生态,共同拥抱人工智能的大航海时代。

语料筑基,智生时代。只有打好高质量语料数据的基石,才能支撑起人工智能宏伟的未来。

65:AI与前沿科技项目路演解析 🚀

课程概述

在本节课中,我们将学习并解析一场关于AI与前沿科技(包括量子计算、智能算力、3D生成等)的创新项目路演。我们将深入了解各公司的核心技术、市场定位、商业模式以及团队背景,旨在帮助初学者理解当前科技创业的热点与趋势。


第一节:制造业的通用AI大脑 🏭

英达市苏州智能科技有限公司介绍了其创新的“制造业巨深智能设备大脑”。该公司定位在AI加制造业领域,旨在打造制造业的通用大脑。

上一节我们介绍了课程概述,本节中我们来看看第一个路演项目的核心内容。

团队构成

以下是其核心团队的三类关键画像:

  1. 特斯拉经验团队:创始团队曾直接向埃隆·马斯*汇报,在2017-2019年将AI应用于特斯拉汽车总装产线。
  2. 谷歌专家:从谷歌RT团队请来了专家Heman,他精通巨深智能技术,负责将该技术应用到工业场景。
  3. 制造专家:团队成员来自全球各行业头部制造企业,深谙工艺与产线,拥有产线研发经验。

正因为聚齐了这三种人才,团队能快速理解客户需求并开发通用性产品。

精准切入的应用场景

该公司从 ATP(组装、测试、包装) 场景切入离散制造领域。选择此场景基于两点行业洞察:

  1. 产业转移趋势:近年外资、台资企业加速将劳动密集型组装厂转移至东南亚等地,主因是巨大的薪资差异(中国月均4000-5000元 vs. 东南亚900-1000元)。
  2. 留在中国的企业压力:面对转移至低成本地区的竞争对手,留在中国的企业亟需通过技术提升竞争力。

因此,公司瞄准巨深智能在ATP场景的应用,并已成为该领域的领先者,累计交付订单已突破2000万。

发展战略:聚焦产线大脑

尽管业务增长迅速,但公司创始人决定保持约30人的小规模团队,专注于研发“产线大脑”,而非扩张为传统的产线集成商。

产线大脑的数据来源主要有两个:

  1. 与行业巨头客户合作,获取其积累十多年的生产数据。
  2. 通过自研的AI模块部署在客户产线上,采集高品质数据。

目前,公司已从工艺工序角度,穷举了ATP场景中约26种工艺,并积累了 1PB 左右的标注图文/视频数据。

与传统自动化产线的核心差异

利用AI2.0的巨深智能技术,其核心差异体现在提升“心智生产力”的四个方面:

  1. 通识能力:AI产线能理解零部件和生产流程,而传统预编程产线无法理解,产品变更或设备宕机需工程师介入。
  2. 适配能力:AI赋能的产线能兼容来料、环境等波动,提升良品率;传统预编程产线兼容性差。
  3. 学习能力:将工艺封装成“技能包”(skill),使设备具备通用能力。例如,一个操作工从汽车刹车片公司离职后,在iPad企业仍能快速学会打螺丝,因为“打螺丝”这个工艺技能是通用的。
  4. 模仿能力:对于生产中的偶发现象,AI设备可以直接模仿人的操作,无需编程,例如通过示教操作。

技术架构与产品落地

核心公式/架构:工作站大脑 -> 产线大脑 -> 制造业专家系统
该架构旨在从替代操作工,演进到替代生产工程师,最终打通设计与生产端数据,成为制造业领域的AI专家。

为实现快速落地,公司推出了软硬一体的工业智能AI硬件 Model。其优势包括:

  1. 快速学习:在受控环境中采集数据,针对性*化算法模型。
  2. 客户易接受:新型载体能与客户产线上大量的现有固定资产适配。
  3. 降低成本:因数据品质高,对边缘端算力要求下降,建线成本降低。

其独特的 Transformer架构 使用从产线采集的图片视频数据进行预训练,能快速适应生产环境。模型基于谷歌RT架构改造,参数控制在 1B以内,并采用 少样本学习(Few-shot Learning) 方法,以适应新工业场景。

系统架构设计兼顾兼容性与应用性:

  1. 底层硬件层:兼容自有硬件及客户已有硬件。
  2. 上层应用服务:针对影响客户经济效益的 QCD(质量、成本、交付) 三点,开发一键式APP应用。

商业进展与展望

公司已获得行业巨头的信任与合作,包括:

  • 共建实验室:客户开放十多年生产数据供模型训练。
  • 共同打磨应用:与客户签订了数百万美金的意向采购订单,旨在利用AI在ATP场景实现弯道超车。

公司瞄准的是生产中最通用的组装、测试、包装场景,希望通过通用算法打通打透,最终覆盖整个制造业的通用AI大脑。目前公司处于A轮融资窗口期。


第二节:机器人应用的AI软件平台 🤖

来自中国香港的友图科技有限公司展示了其创新的机器人应用软件平台。

上一节我们介绍了AI在制造业大脑中的应用,本节中我们来看看如何通过软件平台降低机器人应用门槛。

产品定位与核心价值

该公司是中国首个用软件替代传统机器人集成商的公司。机器人集成商是一个帮助工厂实现自动化的一条龙产业,市场规模约1800亿元。

可以将该产品理解为 机器人界的Windows系统,因为它统一了机器人的系统、编程语言和操作方法。本质上,它是一个工业软件

软件四大特点

以下是该软件的四个核心特点:

  1. 使用门槛低:用户可在半小时内掌握基本操作。
  2. 效率高:能在15分钟内完成产线调整。
  3. 适应性广:覆盖市面上超过80%的机器人品牌。
  4. 工艺模板丰富:提供可直接套用的工艺模板,提前完成超过80%的工作量。

核心技术壁垒

软件的技术壁垒源于其算法,包括:

  • 全国首创的程序转运算法(已获发明专利)。
  • 机器人运动控制的正/逆运算算法。
  • 多轴机器人的空间避障算法。
    这些算法通过云原生技术进行保护。公司还即将推出AI辅助编程功能。

解决行业两大难点

机器人制造业应用的两大难点是:1) 机器人使用门槛高;2) 制造工艺行业门槛高。常见情况是懂机器人的人不懂工艺,懂工艺的人不会用机器人。

该软件通过以下方式解决问题:

  1. 统一接口:统一不同机器人品牌(超50个)的编程语言和操作方式,降低技术人员学习成本(每个品牌原需学习10-30天)。
  2. 提升效率:通过运动控制算法,将机器人应用效率提升10倍
  3. 创建生态平台:将逻辑、点位数据、IO信号分离,创建可复用的程序模板,形成平台生态,解决工艺知识(Know-how)问题。

商业模式与客户案例

软件采用 Freemium SaaS 商业模式,全功能版本定价5000元。额外收费项目包括控制更多机器人、定制程序模板、子账号等。

目标客户:标准生产设备(如数控机床、注塑机)的制造商、代理商和经销商。通过该软件,这些客户能成为机器人集成商,拓展业务。

已交付案例:广东中山一家家电代工厂。该厂产品更换频繁,以往不具备上机器人自动化的条件。现在通过该软件,他们自己掌握集成能力,已上线两台机器人。

竞争优势与团队

主要国际竞争对手:新加坡的Ags。相比对手,该软件在编程简易性、实时示教和工艺模板方面更出色,更适合中国市场。

团队背景:创始人兼CEO/CTO毕业于世界前50名校,曾创立机器人集成公司,后为颠覆该行业而创办友图科技。团队核心成员来自世界名校,拥有近十年相关经验,并获得两位运动学国际顶级专家(香港中文大学教授)的支持。

公司已完成天使轮融资,本轮计划融资500-1000万元。


第三节:能源大模型与新型电力系统 ⚡

上海达卯科技有限公司介绍了其前沿的达卯能源大模型。

上一节我们探讨了机器人软件平台,本节我们将视角转向能源领域,看AI如何应对电力系统的范式变革。

公司愿景与背景

公司成立于2021年,价值观是“掌握能量转化的算法”。能源自宇宙大爆炸起即守恒,人类文明进步依赖于掌握并重组不同形式的能源。

发展历程

  • 2021年:与商汤合作,为亚太最大算力中心规划“算电协同”算法,解决高功耗芯片(如英伟达A系列卡,单机柜超25000瓦)的能源约束。
  • 2022年:与中科曙光、国家气象局等合作万卡级集群。
  • 当前:能源大模型1.0产品上线,并与中能建发布“生成式AI训电厂”产品,正与国家电网、南方电网合作落地。

行业机遇:电力系统范式变革

传统电力系统以稳定输出的火电为主,电网高效稳定。但2015年后,电网正朝 以新能源为主体的新型电力系统 变革。

变革带来的挑战(双侧不确定性)

  1. 电源侧:新能源(光伏、风电)“靠天吃饭”,出力具有随机性、波动性,威胁电网安全。
  2. 负荷侧:智能算力中心等新负荷激增,功率密度是传统数据中心的5-10倍,带来能耗瓶颈。“算力的尽头是电力”。

同时,电力市场化交易规模巨大(去年全社会用电总量9.8万亿度),大量工商业客户开始进入市场,如何自主参与交易成为新挑战。

解决方案:能源大模型与能量块技术

为解决上述问题,需要“上帝视角”进行精准预测与调度。公司构建了 能源通用大模型,通过能源领域特定数据语料训练,使其成为能源专家,解决规划、设计、调度、交易等问题。

核心技术:能量块技术
该技术源自MIT,公司将三维能量块扩展为 34维高维能量块,从而对能量系统进行压缩建模与推理(类似于英伟达的“地球2.0”模型)。

产品架构:云边一体的操作系统

能源大模型本质上是 新能源行业的通用操作系统,采用云边一体架构:

  • 云端大模型:求解大尺度调度、平衡和精准预测问题。
  • 本地小模型(能量控制器):部署于高性能控制器中,运行智能体(agent),实现毫秒级电力调度,保证安全可靠。已与多家能源终端大厂设备实现互联互通。

核心产品:生成式AI训电厂
该产品能整合分布式能源节点,通过本地控制器进行映射训练和推理,再通过云端大模型进行调度求解,最终反作用于电网,实现能量平衡。目前已应用于上海、福建、厦门等多地电网。


第四节:物理基础仿真与AI训练数据 🌌

深圳地宙科技有限公司介绍了其在AI训练数据、物理基础算法和数字孪生技术上的进展。

上一节我们了解了AI在能源系统的应用,本节我们将深入虚拟世界,探讨如何让AI更真实地理解物理规律。

行业背景与痛点

预计到2030年,全球专业服务机器人市场规模将快速增长。但机器人落地仍困难,除硬件成本外,软件算法也存在问题。

当前多模态模型的局限:如VLM模型,能识别物体是什么,但缺乏对物理属性(材质、易碎性等)的深层理解,影响任务规划与泛化能力。

虚拟训练环境的局限:为降低成本,机器人多在虚拟环境训练。但现有模拟器环境粗糙,缺乏 物理基础仿真(物体物理属性、与环境交互的仿真),导致“虚拟-现实”差异大,训练结果不匹配。

核心解决方案

解决方案一:多模态模型 + 物理基础数据
将更多元物理数据(如材质、透明度、易碎性)与VLM模型结合。机器人不仅能识别物体,还能理解其物理属性。实验表明,这能使机器人在任务执行和泛化能力上提升最高达 3倍

解决方案二:物理基础 + 环境交互训练
在虚拟场景中,还原所有物品的物理属性及其与环境交互的物理仿真。这使得虚拟环境更接近现实,允许机器人在多场景、与多物体交互下高效训练,减少真实世界训练次数,降低成本。

技术应用场景展示

  1. 物理基础 + 视频生成大模型:使生成的视频内容(固体、液体、气体间的碰撞与交互)更符合物理常识,在语义依从性和物理常识表现上优于GPT-4V等模型。
  2. 物理基础 + 3D物体生成:使生成的3D物体自带物理属性,可与环境交互,并能动态改变自身属性(如材质)。例如,杯子可变成一滩水散开并落下;花瓶在水中会产生浮力漂浮。
  3. 物理基础 + 场景仿真:快速生成自带物理信息的工业、家庭场景布局,内容可调节、可交互。
  4. 赋能具身智能训练:在虚拟环境中为机器人训练提供高保真的物理反馈数据,如模拟揉面团时力的反馈,使训练结果更接近现实。

团队优势

团队核心来自UCLA,首席科学家为 物理基础仿真的发明人和奠基人。公司技术能提供无限的、高质量的物理仿真训练数据,赋能下游具身智能公司。


第五节:AI虚拟角色创作社区 🎭

捏他上海智能科技有限公司介绍了其创新的AI虚拟角色创作社区。

上一节我们探讨了物理仿真的重要性,本节我们转向文娱领域,看AI如何赋能角色创作与互动叙事。

产品理念与核心特征

公司认为,真正的AI原生产品应具备两个特征:

  1. 用AI打造接近并陪伴人的伙伴(将Token转化为对话)。
  2. 用AI帮助用户建设智能体(Agents),形成线上主题公园式的内容消费体验(将Token转化为内容)。

产品灵感源于2022年底,一群用户在在线文档中协作创作角色,形成了早期社区。产品旨在让用户不仅打造角色,还能让角色通过冒险和剧情积累记忆,成为与用户共同成长的伙伴。

核心功能与工具

  1. 角色冒险与剧情生成:用户输入提示词或剧本,引擎自动解析并生成包含分支剧情的互动故事。
  2. *大的创作工具:简化Prompt编辑,帮助全年龄段用户用AI还原想象。自研的二次元模型基于 1300万(13M) 训练数据,专注于角色的表情、动作、服装等表演要素,使角色能参与多样故事,而非仅是静态设计图。
  3. 视频生成能力:作为上海市经信委视频能力调研企业,具备相关视频生成技术。

商业价值与生态愿景

  1. IP商业价值:结合IP授权,用AI生成隐藏剧情或互动,用户可付费解锁或创作衍生内容,适用于B端IP营销。
  2. 长期生态变革:产品是一个“IP World”,旨在成为 AI时代的IP孵化器。下一代内容媒介可能是游戏化的高互动形式。AI将大幅降低创作门槛。
  3. 共创型IP与社交:用户创作的角色和故事共存于一个共同的世界观(如漫威宇宙)中。未来社交可能是“真实玩家 + AI居民”的共生关系。AI朋友了解用户,能进行更可信的推荐。
  4. 数据资产壁垒:通过游戏化交互收集用户的“灵魂数据”(关系、情感、偏好),反哺模型和智能体,形成体验闭环。

商业模式

  1. 订阅服务:软件订阅收费。
  2. 虚拟交易:游戏内虚拟物品交易。
  3. B端服务:为品牌方制作游戏广告或产业广告。
    公司愿景是激发千万创作者,从中诞生超级IP,形成由用户、作者、IP打造者构成的生态循环。

第六节:动作物理引擎:虚拟世界的动力学基础 🎮

北京谋纤飞科技有限公司展示了其先进的Morph动作物理引擎。

上一节我们看到了AI在角色创作中的应用,本节我们回到底层技术,看看如何让虚拟世界“动”得更加真实。

技术定位:虚拟世界的基石

公司将虚拟世界技术栈分为三部分,其专注于 基础软件 中的 动作物理引擎。虚拟世界表现力分为:

  • 静态表现力:由渲染引擎负责(画面多好看)。
  • 动态表现力:由动作物理引擎负责(动起来多真实)。

动态表现力又细分为:

  1. 动作技术:数据驱动的运动(如动捕数据驱动数字人跳舞)。
  2. 物理技术:规则驱动的运动(如牛顿定律驱动台球碰撞)。

公司名“Morph”即 Motion(动作)与 Physics(物理)的合成词。

三大历史趋势

  1. 内容精品化:游戏渲染已近天花板,但动作物理仍有巨大提升空间(如穿模问题)。
  2. 交互升维:从2D屏幕交互进入3D交互时代(如Vision Pro),需要符合现实世界交互习惯的体感,动作物理技术更重要。
  3. 虚实共生:海量异构设备接入网络,对技术性能和兼容性提出挑战。

与竞品的核心差异

国外竞品如英伟达PhysX、微软Havok、开源Bullet。差异主要体现在:

  1. 架构:竞品仅支持单机。Morph创新性提出 分布式物理仿真,可多机联合打破算力瓶颈。
  2. 性能:通过算法、工程优化及AI加速,性能大幅领先(比Bullet快10倍以上,部分场景超越英伟达PhysX)。
  3. 功能:拥有纯物理引擎不具备的动作驱动、AI生成动作能力,以及优秀的易用性和适配性(已完成与华为海思GPU的集成,将成为鸿蒙系统级物理引擎供应商)。

应用场景

  1. 分布式物理应用:支持超大规模在线元宇宙应用(如与Unity合作支持万人在同一场景实时物理互动)。
  2. 具身AI训练:为机器人等提供高保真物理仿真环境与合成数据,正如互联网文本数据之于大语言模型。可大幅降低动作资产生产成本,并用于流体仿真AI加速(某些场景效率提升万倍)。
  3. 行业覆盖:从游戏、XR、虚拟形象,扩展到工业仿真和具身AI训练。

团队与融资

团队拥有5枚ACM金牌,十年引擎开发经验。公司成立于2020年底,已获得

66:共建中国智慧农业产业新生态论坛精华教程 🚜

在本课程中,我们将学习2024世界人工智能大会“共建中国智慧农业产业新生态”论坛的核心内容。课程将涵盖智慧农业的政策背景、关键技术、实践案例及未来展望,旨在为初学者提供一个清晰、全面的智慧农业入门指南。


概述:智慧农业的时代背景与战略意义 🌱

智慧农业是现代农业的发展方向,是实现农业现代化的重要途径。近年来,在国家政策与社会环境的大力推动下,智慧农业行业蓬勃发展,产业链逐步完善。本次论坛汇聚了政府领导、院士专家、企业代表,共同探讨如何共建中国智慧农业产业新生态。

上一节我们介绍了论坛的背景,本节中我们来看看论坛的具体议程与核心报告。


第一部分:领导致辞与政策解读 📜

1.1 论坛开幕与嘉宾介绍

论坛由兰桂旗集团主办,得到了上海市农委、浦东新区政府、临港新片区管委会、上海航天技术研究院等单位的指导。出席嘉宾包括中国工程院罗锡文院士等多位领导与专家学者。

1.2 领导致辞要点

以下是几位领导致辞的核心观点:

  • 临港新片区管委会副主任 彭世全:临港作为国家战略承载区,正着力发展人工智能产业,并积极打造“AI+农业”应用场景,支持智慧农业企业在临港发展。
  • 浦东新区副区长 *雪成:浦东在打造社会主义现代化建设引领区的过程中,高度重视农业现代化。浦东拥有城乡融合的独特优势,正大力推动智慧农业装备的试点应用和高标准无人农场建设。
  • 浦东新区农委主任 苏锦山:智慧农业是推动农业现代化的新质生产力,其发展只有起点没有终点。浦东已构建了多层次创新体系,并成立了智慧农业产业联盟和研究院,推动产学研用深度融合。
  • 上海市农委产业发展处处长 康潜:上海农业虽空间有限,但创新资源丰富、消费市场优质。上海重点发展农业总部经济、特色种源、生物制造、现代设施农业、数字智慧农业等七大方向,并配套了有力的土地、人才、资金政策。

核心公式/代码示例:政策支持框架

智慧农业发展 = 政策引导 + 科技引领 + 跨界思维 + 市场运作

第二部分:无人农场——智慧农业的核心实践 🚀

上一节我们了解了宏观政策,本节中我们深入探讨无人农场这一具体实践。中国工程院罗锡文院士为我们带来了《无人农场的探索与实践》的精彩报告。

2.1 无人农场的定义

罗院士团队将无人农场定义为具备以下五个特征的农业生产系统:

  1. 耕种管收生产环节全覆盖
  2. 机库田间转移作业全自动
  3. 自动避障异况停车保安全
  4. 作物生长过程实时全监控
  5. 智能决策精准作业全无人

2.2 无人农场的四大关键技术

建设无人农场需要突破以下四大关键技术:

以下是关键技术列表:

  • 数字化感知:利用卫星、无人机、地面传感器(“星-机-地”技术)精准获取农田信息(如土壤、作物长势、病虫害)。
  • 智能化决策:基于大数据和模型,智能决策土地整治、耕作、种植、田管、收获等方案。
  • 精准化作业:依靠自动导航技术,实现耕、种、管、收全环节的无人化、精准化作业。
  • 智慧化管理:通过物联网和平台,实现对作物、农机、农场的远程监控与智慧调度。

核心公式/代码示例:精准施肥决策

# 伪代码:基于无人机影像的变量施肥处方图生成
输入:无人机获取的作物多光谱影像
过程:
    1. 分析影像,计算植被指数(如NDVI)
    2. 根据NDVI值划分长势区域(好、中、差)
    3. 结合土壤养分数据,生成不同区域的施肥量处方
输出:变量施肥处方图

应用效果:在广东水稻生产中,该方法节省氮肥20%以上。

2.3 无人农场的实践成果

罗院士团队已在广东、湖南等地成功实践无人农场,并取得了显著成效:

  • 增产增效:在广东增城的水稻无人农场,优质丝苗米产量达662.29公斤/亩,比当地平均产量高32%。
  • 模式创新:在湖南探索“再生稻”模式,种一季收两季,亩产高达1241.7公斤。
  • 解决“谁来种地”:通过“主机+从机”协同作业等模式,有效缓解农业劳动力短缺问题。

无人农场的愿景是让年轻人可以轻松管理成千上万亩农田,描绘出“喝着冰淇淋,看着机器自动干活”的未来农业图景。


第三部分:多元技术赋能智慧农业生态 🛠️

上一节我们聚焦于大田无人农场,本节中我们来看看智慧农业在其他场景的应用及支撑技术。

3.1 植物工厂:设施农业的高级形态

河南科技大学金鑫教授团队分享了智慧植物工厂的探索。植物工厂通过立体种植、人工光、环境调控,实现作物周年循环生产。

以下是植物工厂的关键技术列表:

  • 信息感知:感知作物长势、环境参数、装备状态。
  • 智能装备:研发播种、移植、物流、采收、包装等成套自动化装备。
  • 智慧管控:集成环境、品质、产量管理与装备调度系统。
  • 应用成效:其示范工厂可替代15人作业,月节省人力成本近6万元,显著提升生产效益。

3.2 农业生物传感器:精准信息的“侦察兵”

河南科技大学尤天燕教授介绍了农业生物传感器技术。该技术利用酶、抗体等生物材料作为敏感元件,快速检测农产品中的有害物质(如真菌毒素、重金属)和转基因成分。

核心公式/代码示例:比率电化学生物传感器原理

检测信号 = 信号A / 信号B

优势:通过两个信号的比值进行内校准,能有效消除背景干扰,提高检测精准度和可靠性。

3.3 数字技术综合赋能

中国电信赵宇副总裁展示了数字技术如何全面赋能农业农村:

  • 建设基础设施:完善农村网络与信息服务。
  • 打造应用平台:涵盖智慧种植、畜牧、冷链、乡村治理等领域。
  • 研发农业大模型:与中国农科院合作推出“神农一号”大模型,用于生产指导、价格预测等。
  • 创新金融服务:中国农业银行唐笑总经理介绍了如何通过创新担保方式(如活体质押)、创设专项信贷产品(如“农科贷”)等,解决农业科技企业融资难题。

3.4 天空地一体化监测

兰桂旗集团赖健主任发布了时空信息赋能产品。通过集成卫星遥感、无人机、地面物联网数据,构建“天空地”一体化监测网络,可用于:

  • 耕地保护动态监测:智能识别地块类型,监测违法违规占用耕地行为。
  • 农业保险监管:精准评估灾情,降低勘察成本和误差。
  • 社会化服务监管:追踪作业过程,实现补贴资金精准发放。

第四部分:合作签约与生态共建握手 ✍️

论坛期间举行了重要的合作签约与揭牌仪式,体现了产业生态共建的实质性进展。

以下是本次论坛达成的关键合作:

  • 战略签约:浦东新区张江镇人民政府与兰桂旗集团签署战略合作协议。
  • 平台揭牌:“张江兰桂旗花卉种业科创中心”正式揭牌。
  • 场景发布:兰桂旗集团发布了“AI+无人农场”场景平台,旨在联合生态伙伴共同进行技术示范、迭代和推广。
  • 平台共建:中国农业大学张福锁院士团队与兰桂旗联合发布了“农田养分智慧管控平台”,该平台已在云南洱海流域应用,致力于协同解决面源污染与农民增收难题。

总结与展望 🌟

本节课中,我们一起学习了2024世界人工智能大会智慧农业论坛的核心内容。我们从宏观政策解读入手,深入剖析了无人农场这一核心场景的五大特征与四大关键技术。接着,我们拓展视野,了解了植物工厂、生物传感器、数字金融、天空地监测等多元技术在智慧农业生态中的应用。最后,我们看到了通过战略合作、平台共建推动产业生态发展的具体行动。

智慧农业的发展正处于关键时期,未来充满了机遇与挑战。它不仅是应对全球粮食安全挑战的利器,更是实现农业现代化、促进乡村振兴的必然选择。让我们携手共进,以科技为引领,以创新为驱动,共同为建设中国智慧农业产业新生态而努力奋斗!

核心总结公式:

智慧农业新生态 = (政策 x 科技) + (产业 x 金融) + (数据 x 合作)

67:具身智能与智能机器人产业链生态论坛全记录与解析 🧠🤖

在本节课中,我们将学习2024世界人工智能大会“具身智能与智能机器人产业链生态论坛”的核心内容。我们将把论坛的完整记录翻译、整理并提炼为一篇结构清晰的教程,涵盖政策导向、技术突破、产品发布、产业生态及未来展望。课程将严格遵循指定的格式与要求,确保内容准确、流畅且易于初学者理解。


概述 📋

本次论坛聚焦于具身智能(Embodied AI)与智能机器人产业的前沿动态与生态构建。与会嘉宾包括政府领导、顶尖学者及企业代表,共同探讨了技术发展趋势、产业链协同、区域营商环境以及具体的产品创新。课程将系统性地梳理这些内容,帮助你快速掌握论坛精华。


一、 论坛开幕与领导致辞 🎤

论坛伊始,主持人介绍了与会的重要领导和嘉宾,并对大会主题“以共商促共享,以善制促善治”进行了解读。

上一节我们介绍了论坛的基本情况,本节中我们来看看上海市领导对产业发展的宏观指引。

上海市经济和信息化委员会副主任汤文侃先生发表了致辞。他指出:

  • 产业现状:上海已形成较为完整的机器人产业链,集聚了传统“四大家族”和新兴国产企业。2023年上海工业机器人产值达250亿元,机器人密度为426台/万名工人
  • 发展机遇:人形机器人是继PC、智能手机、新能源汽车后的重要颠覆性产品。上海已成立全国首个国家地方共建的人形机器人创新中心,并发布了国内首款全尺寸通用人形机器人公版机“轻鸿”。
  • 未来规划:上海将从核心技术突破示范应用拓展(目标3年内规模化应用1000台)、创新生态培育三个方面推动人形机器人产业发展。
  • 对闵行区的期望:希望闵行区作为上海工业重镇,在机器人核心零部件等领域加快布局,为产业高质量发展做出更大贡献。

核心公式/概念

  • 机器人密度 = 机器人保有量 / 万名产业工人
  • 产业发展路径:技术攻关 -> 场景应用 -> 生态培育

二、 重点产品发布 🚀

在政策引领下,科技企业发挥着创新主体作用。论坛期间,位于上海马桥人工智能创新试验区的三家企业发布了重磅新品。

以下是三款新发布的产品介绍:

  1. 太虎机器人 - 全尺寸人形机器人

    • 核心参数:身高1.7米,自重48公斤,拥有44个主动自由度。其关节模组扭矩密度为国内最高,髋关节、膝关节输出扭矩达490牛·米,具备单腿跳跃的运动能力。
    • 特点:所有关节均为自研,已实现车规级应用,可为各行业提供高性能的硬件开发平台。
  2. 萨志智能 - 移动双臂作业机器人“白猿”

    • 功能定位:在上一代单臂移动作业机器人基础上迭代,旨在将人从复杂、精细或危险的作业环境中解放出来。
    • 技术亮点:采用一体化设计与控制,通过一个“大脑”实现手、眼、脚的协调。结合视觉、力觉、触觉等多模态感知,实现类人精细操作。移动定位精度达毫米级,双臂作业精度达0.05毫米
  3. 飞析科技(孵化的穷测科技) - 穷测大脑(具身智能通用大脑)

    • 定位:全球首个可适配各类机器人的通用具身智能大脑平台。
    • 技术突破:在物理大模型(理解世界本质)和鲁棒行为决策方面达到国际领先水平。
    • 产品形态:提供完整的工具链,用户可在任何机器人上基于该平台快速搭建并完成任务。

过渡:这些产品的发布,标志着企业正从技术模仿走向创新创造。那么,优秀的创新产品需要怎样的土壤来培育呢?接下来我们将目光投向区域的产业生态建设。


三、 产业生态构建:签约与联合体成立 🤝

闵行区以其优质的营商环境吸引着大批人工智能企业。论坛现场举行了多项签约与联合体成立仪式,展现了*大的产业凝聚力。

3.1 重点项目签约

共有15个重点人工智能项目分三批与上海马桥人工智能创新试验区及属地镇政府签约。这些企业的落地将加速闵行区人工智能产业的集聚发展,为区域经济增添新动能。

3.2 长三角产业链联合体成立

为链接长三角资源,推动产业链协同发展,“长三角具身智能与人形机器人核心零部件产业链联合体”正式启动。联合体由昆山、上海、常州、宁波、苏州等地的十余家核心企业共同发起,旨在打通区域产业链,实现优势互补。

过渡:为何众多企业选择落户闵行?这与区域提供的全方位支持密不可分。下面,让我们深入了解闵行区的营商环境。


四、 闵行区营商环境推介 🌇

闵行区投资促进中心副主任刘翔系统推介了闵行的“六张名片”:

  1. 战略高地:位于上海地理中心,是虹桥国际开放枢纽核心承载区,享有三大国家战略叠加优势。
  2. 通衢要地:坐拥虹桥综合交通枢纽,1小时可达长三角主要城市,中欧班列“上海号”从区内始发。
  3. 发展圣地:工业底蕴雄厚,制造业增加值占比高,集聚了大量外资企业与世界500*。
  4. 科创重地:拥有上海交大、华东师大两所985高校,研发投入*度(10.57%)是上海市平均水平的两倍多。
  5. 生活美地:教育资源、医疗资源丰富,被评为“中国最具幸福感城区”,宜居宜业。
  6. 投资福地:营商环境评价名列前茅,针对“一南一北”发展战略(北部现代服务业、南部高端制造业)出台了有力的专项政策,最高扶持资金可达1000万元

核心代码/政策示例

# 模拟政策扶持逻辑(概念性)
if 企业类型 == “重大科技项目” and 落地区域 == “闵行南部”:
    最高扶持资金 = 10000000 # 单位:元
elif 企业类型 == “高成长性企业”:
    最高租房补贴 = 5000000 # 单位:元

过渡:优越的环境需要具体的产业载体来承接。上海马桥人工智能创新试验区正是这样一个核心平台。


五、 产业报告发布与试验区介绍 📊

甲子光年创始人张一甲发布了《具身智能与人形机器人产业报告》,核心观点如下:

  • 数字经济是引擎:数字经济占GDP比重持续提升,是推动产业智能化、绿色化、融合化的关键。
  • 人形机器人是AGI最佳载体:生成式AI和多模态大模型的技术突破,显著加速了人形机器人产业发展,使其有望成为继新能源汽车后的支柱产业。
  • 硬件先行与成本关键:行业目前处于硬件先行阶段,核心零部件成本占整机成本70% 以上,其技术突破与成本降低是规模商用的关键。
  • 生态体系至关重要:需构建涵盖产业链协同、科技服务、投融资的良性生态体系。

随后,上海马桥人工智能创新试验区公司副总经理夏寅介绍了试验区的具体情况:

  • 产业集聚:已集聚200多家人工智能企业,形成了从核心零部件(芯片、控制器、伺服电机)到机器人本体(如萨志、节卡、达闼)再到行业应用的完整产业链。
  • 区位与空间:地处战略要地,交通便利。总面积15.7平方公里,拥有充裕的产业空间和丰富的商业、居住、人才公寓等配套资源。
  • 发展愿景:致力于打造“智生产、智生活、智生态”的未来之城,推动人工智能与机器人产业集群化发展。

过渡:了解了宏观的产业生态,我们再将视角聚焦回技术本身。接下来,几位顶尖学者将为我们揭示具身智能的技术内核与挑战。


六、 前沿技术主题演讲 🔬

6.1 卢策武教授:具身智能如何重塑人机交互

上海交通大学卢策武教授分享了其团队在穷测科技的技术突破。

  • 核心问题:具身智能需要海量的“视觉-控制”数据,但这类数据获取成本极高,成为发展瓶颈。
  • 解决方案:采用第一性原理,将任务分解为“理解世界”和“做出决策”。
    • 物理常识大模型:将高维的像素空间压缩为描述物体物理属性(如旋转轴)的低维知识空间,极大降低数据需求。
    • 力位混合决策模型:传统模型只输出位置指令,而人类操作依赖力觉反馈。团队构建了力位混合输出模型,并建立了世界首个大规模力反馈数据收集平台,提升了执行的鲁棒性和泛化能力。
  • 产品化:基于上述技术,发布了“穷测大脑”平台,可将各种原子技能(如抓取、拧盖)像搭积木一样组合,以解决复杂任务。

6.2 虞晶怡教授:感知、认知与行为——挑战与机遇

上海科技大学虞晶怡教授探讨了具身智能时代的挑战。

  • 现状与瓶颈:当前在3D感知、生成方面进展迅速,但让机器人在自由、非受控的复杂环境中可靠工作仍面临巨大挑战。
  • 缺失的关键交互。包括人与物、人与机、人与人、机与机之间的交互。当前缺乏高质量的交互数据。
  • 创新数据获取
    • 多模态感知:提出结合视觉、激光雷达(LiDAR)和惯性测量单元(IMU)的数据采集系统。即使在远距离或暗光环境下,也能通过IMU数据精准捕捉人体动作。
    • 人与物/人交互数据集:通过搭建多相机系统,捕获高质量的人-物、人-人交互的3D视频数据,用于训练机器理解交互逻辑。
  • 未来方向:需要更多模态的数据、更好的仿真到现实(Sim2Real)迁移技术、物理约束的融入以及最终实现安全、协作的多智能体系统。

6.3 付宜利教授:人形机器人研制与产业化

哈尔滨工业大学付宜利教授分享了其在液压驱动人形机器人方面的研究。

  • 技术路线:人形机器人分为电机驱动和液压驱动两大流派。哈工大团队专注于液压驱动路线,其优势在于动力集中、扭矩大,更接近人体肌肉骨骼的仿生原理。
  • 关键技术突破
    • 仿生结构设计:采用“油路-骨骼一体化”设计,将液压管路内置在仿生骨骼中,实现减重和无管化。
    • 核心部件自研:突破了高性能伺服阀、一体化关节、高功率密度移动液压源等关键部件。
  • 发展路径:人形机器人将遵循 “走进工厂 -> 走出工厂(特殊应用)-> 走进家庭” 的路径。当前应聚焦场景牵引,在工业制造、物流、安防巡逻、灾害救援等专用场景率先落地。

6.4 贾奎教授:Sim2Real AI引擎实现通用具身智能

香港中文大学(深圳)贾奎教授提出了通过仿真高效实现具身智能的路径。

  • 数据困境:真实世界采集机器人交互数据成本高昂、不现实。
  • 核心方案:研发全自动化的 “Sim2Real AI引擎”
    • 流程:自动生成3D数字资产 -> 自动进行物理仿真 -> 自动生成并标注多模态数据 -> 在线训练AI模型 -> 模型在真实世界部署。
    • 优势:能以极低成本获取海量、多样化的训练数据,并已在实际工业场景中实现99.9%以上的成功率。
  • 技术支撑:团队在3D生成AI、四维动态表达、纯视觉3D感知大模型等方面有深厚积累,为引擎提供底层支持。
  • 产品展望:致力于打造软硬一体的机器人“大小脑”系统及下一代机器人控制器(RoPilot),使人机交互像“师傅教徒弟”一样自然。

过渡:技术的最终目的是服务于产业与社会。那么,业界一线从业者如何看待当前的机遇与挑战?一场激烈的圆桌对话为我们提供了多元视角。


七、 巅峰对话:具身智能与人类认知——模仿还是超越? 💬

圆桌会议由甲子光年首席内容官王博主持,邀请了六位企业界嘉宾。

核心议题与观点摘要

  1. 行业热度观察

    • 嘉宾普遍感受到行业异常火热,但认为技术实质性进步的速度可能低于市场热度。存在概念重复炒作、产品同质化现象。
    • 梅卡曼德邵天兰尖锐指出,需警惕“吹牛通胀”掩盖真实问题,影响行业整体进步速度。
  2. 模仿 vs. 超越

    • 路径选择:多数嘉宾认为,当前阶段的核心是找到可行的技术落地路径,而非空谈模仿或超越。应聚焦特定场景,解决具体问题。
    • 务实发展萨志智能张建正*调,产品落地最终要看投资回报率(ROI),通用性可能意味着冗余,需要与场景深度结合。
    • 长期乐观:尽管前路艰难,但嘉宾们本质上是“真正的乐观主义者”,相信这一代人将见证机器人深刻改变世界,但前提是“少吹牛,多实干”。
  3. 挑战与突破

    • 最大挑战:技术链条长、客户需求苛刻且分散、商业化路径不清晰、高质量数据获取难。
    • 欣喜的突破:硬件性能(如关节模组)持续提升,在工业等半结构化场景中,智能机器已经实现大规模、高可靠性的应用,证明了技术的实用价值。
  4. 资本的角色

    • 呼吁专业、有耐心的资本进入。非专业的狂热投资可能导致资源错配和行业大起大落。

八、 论坛总结与展望 🌟

论坛在主持人的总结中圆满结束。核心信息归纳如下:

  • 政策明确:国家和地方层面高度重视,为人形机器人及具身智能产业绘制了清晰的发展蓝图。
  • 技术多元:多条技术路线(电机/液压、仿真/真机)并行发展,在感知、决策、控制、硬件等关键环节不断突破。
  • 生态成型:以上海闵行区、马桥人工智能创新试验区为代表的区域,正在构建从研发、生产到应用、服务的完整产业生态。
  • 场景牵引:共识是产业将遵循从专用到通用、从结构化到非结构化场景的路径发展,工业制造、特种服务等领域将率先落地。
  • 理性繁荣:业界呼吁在拥抱热潮的同时保持技术理性与商业务实,通过解决一个个具体问题,稳步迈向智能机器人与人类共生的未来。

总结 📚

本节课中,我们一起学习了“具身智能与智能机器人产业链生态论坛”的完整内容。我们从政策导向出发,了解了上海及闵行区的产业布局与支持;通过产品发布,看到了前沿企业的创新实力;借助产业报告与区域推介,洞察了完整的生态体系;聆听顶尖学者的演讲,深入了技术核心与挑战;最后通过业界对话,感受到了市场的热度与理性的思考。

希望本教程能帮助你系统性地理解具身智能与机器人产业的最新动态、核心挑战与未来趋势。记住,这是一个需要长期主义、脚踏实地的领域,每一次微小的技术突破和场景落地,都在共同推动着我们向那个充满智慧的未来迈进。

68:空间智能:迈向下一代人机共融 🚀

概述

在本节课中,我们将学习“空间智能”这一前沿概念,探讨人工智能如何从二维平面迈向三维空间,并与人类实现深度融合。课程内容整理自一场产业高峰论坛,我们将系统性地了解空间智能的技术基础、产业应用及未来展望。


第一节:论坛开场与核心命题 🎤

本次论坛由复旦大学智慧城市研究中心的邱素川主持。论坛的核心命题“空间智能:迈向下一代人机共融”受到两位重要学者的启发:斯坦福大学*飞飞教授提出的“空间智能”问题,以及科技部部长吴朝辉院士提出的“四元社会”构想。

论坛坚信,人工智能技术的爆发不应仅限于二维互联网的降本增效。人类文明的进步在于对高维度的不断探索,因此提出了“空间智能”这一前沿方向。

以下是参与本次论坛的重要嘉宾名单:

  • 东浩兰生会展集团股份有限公司总裁 毕培文
  • 浙江大学求是特聘教授、南湖脑机交叉研究院常务副院长 王月明
  • 复旦大学教授、博导、智慧城市研究中心主任 林红
  • 猫眼电影创始人、真格基金投资合伙人 徐梧
  • 科大讯飞星火大模型技术解决方案副总裁 吕旭
  • 达闼机器人有限公司副总裁 王斌
  • 杭州市人工智能学会副理事长、浙江大学副教授 金小刚
  • nex pin创始人 范哲

此外,还有来自上海市创投协会、上海市服务消费促进会、浙江大学上海高等研究院等多位领导和专家出席。


第二节:领导致辞与论坛基调 📢

论坛伊始,主办方代表进行了开场致辞,为大会奠定了高远的基调。

东浩兰生会展集团毕培文总裁在致辞中表示,作为全球人工智能盛会WAIC的承办方,东浩兰生深刻认识到人工智能与空间智能对产业发展的巨大机遇。集团正在会展业务中探索应用VR、AR和大数据分析等技术,并将继续加大投入,推动创新项目落地。

浙江大学上海高等研究院娄华良副院长在致辞中指出,人工智能正在深刻改变生产、生活和思维方式。本次论坛旨在汇聚专家与产业精英,共同探讨人工智能的最新趋势、技术突破与产业应用,促进人工智能技术的创新与产业健康发展。

两位领导的致辞明确了本次论坛的目标:在空间维度中,探讨人工智能未来的产业可能性。


第三节:主旨演讲——成己成物:迈向人机共融时代 🧠

本节由浙江大学上海高等研究院常务副院长吴飞教授(远程连线)带来主旨演讲《成己成物:迈向人机共融时代》。

上一节我们了解了论坛的宏观背景,本节中我们来看看人工智能发展的本质规律。吴飞教授回顾了人工智能以战胜人类为目标的早期发展,例如“深蓝”战胜国际象棋冠军卡斯帕罗夫,其核心是 算力之威剪枝搜索 算法之巧的结合。

AlphaGo战胜*世石则依赖于三大技术:深度卷积神经网络(感知棋面)、*化学习(窥视策略)和蒙特卡洛树搜索(采样无穷空间)。然而,人工智能的目标不应是战胜人类,而应是成为人类的好帮手,迈向人机共融。

ChatGPT的出现标志着“人工智能的iPhone时刻”,它通过自然语言交互,为人机共融提供了新手段。GPT(Generative Pre-trained Transformer)的核心是生成式内容合成、预训练模型以及Transformer神经网络架构。其关键机制是自注意力机制,让每个单词记住其上下文共生概率,从而实现内容的概率压缩与合成。

GPT的成功依赖于数据(燃料)、模型(引擎)、算力(加速器) 的规模法则。Sora等视频生成模型则遵循“书同文,车同轨”的逻辑,将不同模态信息投影到同一语义空间进行关联挖掘。

吴飞教授指出,当前大模型解决通用任务,而垂直领域(如司法、教育、金融)需要专门的领域大模型。将大模型(大脑)与智能体(手和脚)结合,能完成更复杂的任务。

最后,他*调人工智能具有技术与社会双重属性。在人工智能时代,伦理关系扩展至人与自己所创造的人造物之间。浙江大学已开设人工智能通识课程,旨在培养学生的人工智能思维,最终实现“成己成物”——既成就人类自身,也成就人造之物。


第四节:脑机接口——下一代人机交互之门 🧬

上一节我们探讨了软件层面的人机共融,本节中我们来看看硬件层面最前沿的交互方式——脑机接口。本节由浙江大学王月明教授分享《意识之门?脑机接口与下一代人机交互》。

脑机接口的核心是建立大脑与外部设备之间的直接通路,实现信息的读出写入以及双向协调。脑机接口主要分为两类:

  • 非侵入式:在头盖骨外获取信号,分辨率较低(>5毫米),频率较低(<50Hz),但安全无创。
  • 侵入式:植入颅内,信号质量高,分辨率可达毫米级以下,频率高(可达500Hz乃至更高)。神经元之间传递的动作电位频率甚至可达数十KHz。

侵入式脑机接口的发展历经数十年,从早期的粗糙电极到如今的微丝电极,直至马斯*推动该领域进入大众视野。其关键技术环节包括:信号记录、芯片与系统集成、神经信号解析计算以及应用系统。

信号记录方面,目前有硅基电极(如Utah阵列,已获FDA批准)和柔性电极两条技术路线。柔性电极通道数多、伤害小,但长期稳定性和植入便利性仍是挑战。国内多家机构也在研发柔性电极,但尚未大规模临床使用。

芯片方面,侵入式脑机接口芯片的核心要求是超低功耗,以避免植入体内产热过高。目前国内科研芯片较多,但达到医疗器械级稳定性和安全性的产品芯片仍需攻关。

系统集成与微型化是产品化的关键。马斯*的Neuralink已尝试将微型系统植入人体。国内在此领域与国外仍有差距,反映了高端精密制造工业水平的不足,需要产业链协同突破。

神经计算应用系统是脑机接口价值的体现。王教授团队发现了书写汉字特有的神经编码机制,实现了汉字的实时书写。在医疗应用方面,侵入式脑机接口在脑疾病治疗(如帕金森、癫痫、重度抑郁)、运动功能重建(高位截瘫、中风康复)和感觉输入(人工视觉假体)等领域潜力巨大。

王教授团队在重度抑郁症治疗上取得了突破性进展,通过精准定位刺激靶点、个性化调节参数,使一位患者在长期刺激后临床康复,且停刺激后近一年未复发。

总之,脑机接口作为下一代人机交互的潜在路径,在严肃医疗、康复、工业操控乃至军事领域都有广阔的应用前景,但其发展依赖于材料、电子、生物、算法等多学科的深度交叉融合。


第五节:联盟仪式——汇聚产业力量,共筑未来生态

在聆听了科学家们对本质规律的洞察后,论坛进入产业协同环节。上海人工智能与元宇宙产业联盟举行了多项签约与授牌仪式,旨在汇聚产学研投各方力量,推动空间智能产业发展。

仪式环节由收到科技创始人黄悦主持。主要活动包括:

  1. 战略合作签约:上海人工智能与元宇宙产业联盟分别与上海市创投协会、东浩兰生元素科技,以及上海市服务消费促进会签署战略合作协议。
  2. 学术指导单位授牌:联盟为复旦大学智慧城市研究中心、华东电信研究院、浙江大学上海高等研究院等多家在学术研究和技术创新方面做出贡献的单位授牌。
  3. 专委会授牌:联盟为智慧文创、智慧体育、智慧医疗、金融投资等八个专业委员会授牌。
  4. 成果发布:智慧体育专委会联合多家单位,正式发布了“全术加体育大模型”。
  5. 示范合作签约:联盟促成东浩兰生元素科技与日本混合现实竞技项目“HADO”达成合作,宣布HADO中国旗舰店落户上海,并计划于2025年在上海举办HADO世界杯。

联盟学术委员会主席林红教授在发言中阐释了“空间智能”与“人机共融”的内涵。空间智能是对物理三维空间的感知、理解、行动、导航、预测和交互的能力。人机共融则是指人、机器与环境之间的协作与相互适应。她倡议加*基础研究、促进技术交流、推动跨界合作、培育孵化项目,共同推动产业发展。

这些仪式标志着产业生态正在组织化、系统化地形成,为技术组合与化学反应的产生提供了土壤。


第六节:产业前瞻(全)——通往下一代计算平台之路 📱

从本节开始,论坛进入产业前瞻板块,从感知、认知、行动三个维度探讨空间智能的产业可能性。首先,从“感知”维度,猫眼电影创始人徐梧分享了《通往下一代计算平台之路:从计算机、智能手机到空间计算》。

徐梧首先定义了“计算平台”——能深刻改变工作、生活并催生庞大生态的硬件设备,历史上只有个人计算机智能手机两者。他提出核心假设:我们正迎来下一代计算平台,而XR/空间计算是主要候选。

通过回顾过去50年计算设备发展规律,他总结出四点:

  1. 渐进演变:平台非突变,而是长期技术积累的结果。
  2. 从垂直到通用:先出现功能性垂直设备(如游戏机),后演变为通用平台。
  3. 技术集合革命:成为平台的设备集成了当时最先进的显示、交互、性能技术。
  4. 小型化趋势:设备随时间逐渐变小、变轻、功耗更低。

对照这些规律,XR设备的发展路径清晰可见:

  • 智能眼镜线:从2012年失败的Google Glass,到2024年Meta Ray-Ban智能眼镜,背后是芯片小型化等技术的十年进步。
  • VR头显线:从1990年代任天堂Virtual Boy的失败,到2019年Meta Quest无线一体机的成功,再到Quest 2销量超2000万台,证明了市场存在。
  • MR头显线:从微软HoloLens转向企业市场,到2024年苹果Vision Pro发布,定义了“空间计算机”新标准。

目前,XR生态已初步建立。以Meta Quest平台为例,其应用商店总收入已超20亿美元,数百款应用收入超百万美元,表明开发生态已良性运转。XR发展正从“功能设备”走向“平台设备”。

要真正进入空间计算时代,需解决六个关键问题:

  1. 显示:Vision Pro的Micro OLED显示已接近视网膜分辨率,未来将实现以假乱真的视觉体验。
  2. 交互:手眼交互将成为主流,需优化延迟和准确性。
  3. 混合现实:实现数字内容与真实世界的自然交互与融合。
  4. 操作系统:VisionOS已定义了空间中的窗口、实体等元素,为通用平台奠定了基础。
  5. 芯片:苹果将桌面级M系列芯片用于头显,带来了*大算力,且迭代路径清晰。
  6. 小型化:当前设备重量有巨大优化空间,减重是明确的工程目标。

徐梧预测,空间计算平台距离爆发已不远。对于创业者和开发者,未来2-3年是准备窗口期未来5年将对现有商业生态产生明显影响。所有现有应用都值得用空间计算的方式重做一遍,结合AI能力,未来充满想象。


第七节:产业前瞻(二)——大模型:重塑智能产业格局 🧠

上一节我们从硬件和交互层面感知未来,本节我们从“认知”维度,看看驱动变革的核心引擎——大模型。本节由科大讯飞吕旭副总裁分享《智启未来:大模型重塑智能产业格局》。

吕旭指出,ChatGPT的迅速普及标志着技术范式的变革。大模型的“智慧涌现”源于三个基础:

  1. 海量参数与数据:GPT参数达1750亿,超过人脑神经元数量级。
  2. Transformer架构与自注意力机制:使模型能自动学习词语间的上下文关联。
  3. 自监督学习+指令微调:通过“完形填空”预训练和少量示例微调,让模型获得通用能力。

大模型的能力有边界。写代码、翻译等任务相对容易;专业领域知识问答、企业级智能体应用则技术链条长、需要深度定制,这是“最后一公里”的挑战。

中美在大模型领域存在差距,但技术架构上并未出现代差。Sora等视频模型本质仍是Transformer架构在专业领域的成功实践,依赖大规模算力和数据标注。

讯飞星火大模型是国内首批发布的大模型之一。面对被列入美国实体清单无法获得英伟达芯片的挑战,讯飞与华为深度合作,基于昇腾910国产算力,打造了万亿参数大模型训练平台。经过联合优化,训练效率已达A100的90%。

星火大模型V4.0在医疗、教育、汽车、家居、企业服务等多个垂直领域深度赋能:

  • 医疗:“智医助理”辅助诊断超8亿次;“讯飞晓医”APP为个人提供健康咨询。
  • 教育:AI学习机实现个性化精准教学。
  • 汽车/家居:赋能智能座舱全双工语音交互、家电自然语控。
  • 企业服务:与交通银行、人保、国家能源集团等合作,在代码生成、合规审查、智能客服、辅助评标等场景落地。

讯飞生态蓬勃发展,开发者数量快速增长。吕旭*调,中国需要自主可控的AI生态,这需要源头技术创新(如讯飞)与行业应用生态(与伙伴合作)共同构建。只有合作,才能赢得中国人工智能的大未来。


第八节:产业前瞻(三)——人形机器人:灵智焕新的未来蓝图 🤖

有了“感知”(空间计算设备)和“认知”(大模型),本节我们来到“行动”维度,探讨执行终端——人形机器人。本节由达闼机器人副总裁王斌分享《灵智焕新:人形机器人集成应用的未来蓝图》。

王斌指出,“心灵”(大模型)和“手巧”(灵巧手)共同催生了人形机器人热潮。人形机器人的关键技术包括结构、伺服电机、运动控制、环境感知、认知与任务规划。

大模型从三方面赋能人形机器人:

  1. 从互联网到具身智能:大模型为机器人提供了“大脑”。
  2. 从单模态到多模态:机器人需融合视觉、听觉、触觉、力觉等。
  3. 从感知智能到认知决策智能:让机器人理解物理规律并做出行动规划。

他提出“机器人学习”新范式,即像婴儿一样,从零开始在物理世界中学习。机器人的“大脑”将是云端通用模型,通过“感知-认知-决策-执行”的循环工作。

未来人机关系将是:人类打游戏(在远端管理),机器人在一线干活,人工智能做外挂(自主运行)。他提出“RobotGPT”概念,*调机器人需理解Who, What, Where, When, Why, How,并利用分形与自相似性原理,将复杂任务分解为无数个“感知-认知-决策-执行”的小闭环。

达闼构建了云端机器人平台,通过数字孪生技术在虚拟世界训练机器人,再部署到真实世界。他们举办了“机器人大模型与机器人挑战赛”,推动创新。例如,参赛队伍让机器人在咖啡厅场景中实现自主探索、多轮对话、制作咖啡等任务,展示了AI与机器人结合的潜力。

王斌预测,人形机器人将遵循从教学科研 -> 工业场景 -> 商业场景 -> 家庭场景的发展路径。达闼已发布售价39.9万元的双足机器人。他断言,人形机器人将是人类的第三台计算机(继PC、智能手机之后),未来将出现机器人应用商店,催生新的万亿级市场。


第九节:圆桌研讨(全)——科技赋能新质生产力:多维度思考 ⚙️

在从“感知、认知、行动”三个维度进行产业前瞻后,论坛进入“看见”板块,通过圆桌讨论探讨具体行动路径。第一场圆桌主题为《科技赋能新质生产力,加速下一代产业变革》,由浙江大学金小刚教授主持。

金教授首先抛出忧虑:在数字化浪潮下,我们是否留下了可运营的工具和可积累的数据?还是仅仅在“运动式”拥抱技术?他引导嘉宾从多角度审视“新质生产力”。

上海市经济信息中心王晓辉主任以孩子成长比喻信息化发展:4岁(解决计算问题)、15岁(行业软件成熟)、20岁(人工智能深入各行各业)。未来年轻的人工智能将助力解决如养老等社会问题。

上海交通大学副总教授从设计趋势角度提出两点:一是真实与虚拟审美边界融合;二是人机共融中的伦理问题值得深思,例如围棋手*世石败给AlphaGo后退役,技术发展应服务于人,而非使人异化。

杭州易现先进科技*晓燕博士分享了身边案例:9岁孩子用ChatGPT做旅行计划、HR用大模型润色文案。她认为,从国家、企业到个人,认知观念都需要被技术推动改变。

上海贝谱半导体秦宇飞博士结合自身光芯片领域谈到,大模型已改变其生活(如通勤时与AI对话)。在产业中,他们通过传感器感知人体数据,再结合讯飞大模型生成诊断报告,实现了“感知+认知”的落地场景。

上海信弘智能科技冯伟文从企业服务商角度指出,大模型改变了传统IT开发路径,企业面临选择难题。作为解决方案提供方,他们的思路也在被改变。

随后,讨论深入至对“科技”本身的反思。金教授与副总教授指出,不能陷入“唯技术论”和“唯科学论”。科学精神在于质疑与探索未知,而非背诵标准答案。新质生产力的“新”,关键在于能否创造新的生产力、提升效率,并由市场和用户来定义,而非政府或技术本身。教育应鼓励“敢犯错”,而非“不犯错”。

嘉宾们一致认为,推动产业发展需要打破思维禁锢,融合科技、人文、设计、商业模式等多维度创新,避免将所有问题都押注于单一技术路径。


第十节:圆桌研讨(二)——空间计算×文娱行业:创新实践 🎮

第二场圆桌聚焦更具体的应用切口——《空间计算在文娱行业的创新实践与思考》,由nex pin创始人范哲主持,汇聚了XR大空间娱乐领域的领军者。

各位嘉宾首先介绍了各自的项目:

  • 唐一成(博星元宇宙):运营现象级线下VR体验《消失的法老

69:商业AI高峰论坛精华解读与实战教程 🚀

课程概述

在本节课中,我们将系统性地学习2024世界人工智能大会商业AI高峰论坛的核心内容。课程将涵盖数字化转型的系统建设方法论、智能决策AI的应用、一体化运营平台设计以及多个行业的成功落地案例。我们将深入浅出地解析如何利用数据要素和AI技术打造新质生产力,为企业降本增效、提质增效提供清晰的路径。


第一部分:论坛背景与核心议题 🎯

本次论坛由华龙科技承办,聚焦“数据经济赋能业务降本增效,决策AI打造新质生产力”的核心主题。论坛汇集了金融、科技等领域的专家,共同探讨数据要素如何通过AI发挥经济价值,以及商业决策AI如何成为企业发展的核心驱动力。

数字化转型并非短期工程,而是一个需要长期投入和迭代的持续性过程。其根本目标在于通过数据与智能技术重塑企业内核,引领商业决策与运营进入智能化新时代。


第二部分:数字化转型的系统方法论 🏗️

上一节我们了解了论坛的宏观背景,本节中我们来看看支撑数字化转型的具体系统建设方法论。成功的数字化运营需要围绕两个永恒的营销目标:提高效果提高效率

  • 提高效果:依赖于数字化和智能化,即构建“决策大脑”。
  • 提高效率:依赖于自动化和一体化,即构建“执行发动机”。

阻碍效率提升的主要有三大因素,对应系统的四个设计层面:

  1. 组织效率:从部门级走向企业级,需要提高跨部门协同效率。
  2. 操作效率:从手工操作走向自动化,提升运营操作效率。
  3. 数据与决策效率:从系统碎片化走向一体化,打通数据流与决策流。
  4. 决策效果:从数字化走向智能化,提升运营决策的精准度。

核心公式新质生产力 = 数据要素 × AI模型。只有两者深度耦合,才能产生指数级的价值增长。


第三部分:数字化系统现状与升级路径 🔄

目前,国内企业在数字化系统建设上普遍面临规划不足、预算有限、系统孤岛、打通困难等挑战。相比之下,国际领先企业通过长期投入和并购整合,已形成较为完整的数字化产品矩阵。

对于主要从事C端零售业务的企业(如银行、券商),全球范围内都普遍缺少两个关键组件:决策大脑连接器(发动机)。华龙科技的解决方案正是填补了这两个空白。

以下是企业数字化运营平台从1.0到5.0的典型升级路径:

  • 1.0 半自动化平台:以活动管理、权益管理为核心,各环节依赖手工串联,跨部门协作效率低。
  • 2.0 自动化营销平台(MA):将人群、权益、内容、渠道等营销要素在一个平台内打通,形成自动化闭环。但需注意画布逻辑、并发性能、AB测试功能等关键点的设计。
  • 3.0 数字化营销平台:在MA基础上,*化数据能力。需建设营销数据库(客户、产品、策略360度视图)、营销特征库/画像平台(批量生产预测性标签)、营销分析平台(前中后全流程实时分析)。
  • 4.0 智能化营销平台:引入决策AI,分为企业级大脑(如预算分配、渠道归因)和部门级小脑(如手机银行流量分发、客户经理赋能、智能客服)。重点是实现模型的自动化、规模化生产与应用。
  • 5.0 一体化智能运营平台:将系统、数据、AI、运营策略四大要素深度融合在一个平台内,实现跨部门、总分联动的企业级智能运营,发挥最大效果与效率优势。

关键误区澄清

  • 大模型 ≠ 万能模型:金融行业更应关注基于内部合规数据的决策大模型(理科生),而非完全依赖外部数据的文本大模型(文科生)。两者结合(决策模型+文本模型)是更佳路径。
  • 模型平台 ≠ 模型训练平台:完整的模型平台应包括模型训练、特征自动化生产、模型调度、策略形成及业务应用的全流程。

第四部分:核心AI应用场景详解 🧠

上一节我们梳理了系统演进的框架,本节我们深入看看几个关键的AI应用场景是如何具体落地的。

以下是三个重要的部门级“小脑”应用:

1. 线上APP智能流量分发平台

当营销活动数量激增、渠道资源(如APP弹窗、短信)成为瓶颈时,需要智能调度解决“人货场”的精准匹配和竞争问题。

  • 核心问题:业务部门间资源争夺、用户接收信息千篇一律、通道拥堵。
  • 解决方案:通过AI算法,根据用户偏好、活动转化率、业务目标(如提升AUM或MAU)等进行实时个性化排序和推荐,实现“千人千面”,提升整体转化效率。

2. 线下客户经理赋能平台

与流量分发平台类似,但增加了“客户经理”这个动态变量。需要对客户经理进行精准画像,并结合管户政策,实现“客户-产品-客户经理”的最优匹配,大幅提升线下转化效能。

3. 大小模型结合的智能客服/外呼

解决大模型在金融场景落地难、难以直接产生经济价值的问题。

  • 创新模式精准商机挖掘(决策小模型) + 个性化内容生成(文本大模型)
  • 流程:先用决策模型分析内部数据,精准预测客户需求(如理财意向);再触发虚拟助手,调用大模型生成与之匹配的个性化资讯、话术或产品解读进行触达。这样既合规,又能直接驱动业务转化。

第五部分:行业落地案例与实战经验 💼

理论需要实践验证,以下是来自不同行业专家的实战经验分享。

银行零售数字化运营(以工商银行山东分行为例)

  • 策略:围绕客户资产全生命周期,先定“全局资产提升”大目标,再拆解到存款、理财等子场景。避免单个产品目标与全局目标冲突。
  • 关键模型:资产提升模型、资产防流失模型、产品推荐模型。
  • 运营链路:设计多波次营销(如存款促增、资产达标激励、产品推荐),线上孵化意向,线下客户经理收单。
  • 成效:通过模型挖掘,使传统运营难以触达的长尾客户资产提及率从0.1%提升至6.2%,实现了显著的增量价值。

券商数字化智能运营(以广发证券为例)

  • 核心:通过可视化的流程画布工具,极大降低运营人员将专家经验转化为实战活动的门槛,激发主动性。
  • 发展:从自动化运营(MA)向个性化推荐(流量分发)演进,解决内部资源竞争问题。同时,注重数据底座的治理,以支撑实时效果分析。
  • 愿景:将数字化工具像手机一样,赋能给公司每一个员工,成为基础能力。

保险业AI应用实践(以中邮保险为例)

  • 阶段:从信息化(流程线上化)到数据化(数据驱动),再到智能化(AI深度赋能)。
  • 应用场景
    • 智能质检:AI初检+人工复检,效率提升4倍。
    • 智能外呼:用于新单回访、续期提醒等,呼出效率提升8倍。
    • 智能营销助手:为销售人员提供7x24小时知识问答支持。
    • 智能两核(核保/核赔):提升自动化程度与风控能力。
  • 未来探索:构建行业知识库与大模型,赋能客服与销售;试点AI辅助编程。

第六部分:生态合作与赋能模式

数字化转型不仅需要企业自身努力,也离不开外部生态的合作。论坛展示了以下几种合作模式:

  1. 数据合规应用:与运营商(如中国电信易支付)等“国家队”数据源合作,在隐私计算等技术保障下,安全合规地丰富用户画像,用于精准拉新或风险防控。
  2. 场景生态共建:与维度信息等拥有线下场景(如汽车、家装分期)的公司合作,结合华龙的AI决策能力,共同提升场景金融的转化效果。
  3. SaaS化赋能中小机构:与通联金融等服务机构合作,将经过大行验证的AI运营模型和平台以SaaS形式输出,帮助中小银行以更低成本、更快速度实现信用卡、零售等业务的数字化智能运营。

课程总结 🎓

本节课我们一起学习了商业AI高峰论坛的核心精华。我们认识到:

  1. 数字化转型是系统工程:需要从战略、组织、数据、工具、流程、人才多方面协同推进,遵循“定战略、改组织、建平台、保效果”的路径。
  2. 决策AI是新质生产力的核心引擎:能够极大提升运营决策的精度和效率,实现降本增效和提质增效。
  3. 一体化平台是终极方向:未来竞争是体系化竞争,需要打破系统孤岛和数据壁垒,构建集系统、数据、AI、运营于一体的智能运营平台。
  4. 业务与技术的双轮驱动:AI的价值必须与业务场景深度结合,由业务目标牵引,技术提供支撑,并在持续运营中闭环优化。
  5. 开放合作共建生态:通过产业链上下游合作,可以更快补齐能力短板,共同推动商业AI产业的蓬勃发展。

变革往往伴随新的机遇。数字化和智能化为我们提供了前所未有的能力,通过本次课程学习的方法论与案例,希望能助力各位在探索商业AI的道路上方向更清晰,步伐更坚定。


:本教程根据公开论坛内容整理,旨在知识分享与学习。文中提及的具体产品、案例及数据均来源于论坛演讲,仅供参考。

70:2024国际AI城市论坛精华解读 🏙️

在本课程中,我们将学习2024年世界人工智能大会“国际AI城市论坛”的核心内容。论坛聚焦于人工智能如何赋能城市发展,探讨了从技术伦理到具体应用的多个层面。我们将把论坛的发言和发布内容,整理成一篇结构清晰、易于理解的教程。


概述:AI赋能城市新未来

本次论坛以“新AI,见未来”为主题,汇聚了全球城市代表、专家学者和行业领袖。与会者共同探讨了AI技术如何为产业发展开启新纪元,为经济高质量发展注入新动能,并为城市治理与发展解锁新的可能性。论坛的核心在于探索如何将人工智能与城市发展深度融合,创造更智能、更可持续、更美好的城市生活。


第一部分:开幕致辞与核心理念发布

1.1 开幕致辞:AI普惠时代的城市机遇

论坛开幕致辞由中国联通智能城市研究院副院长王提先生发表。他指出,人工智能作为新一轮科技革命的核心驱动力,正以不可逆转的速度迭代升级,世界已步入“AI普惠时代”。

  • 政策引领:上海作为国际前沿城市,积极探索AI技术发展与应用,致力于打造人工智能高地。近期发布的《上海市促进人工智能产业发展条例》等政策,旨在打造智能算力创新应用示范区。
  • 企业实践:中国联通积极布局,打造了“联通云犀”大模型体系(公式:1(基础模型)+ 1(平台)+ M(行业模型)),并建设高性能算力实验室,推动AI技术与千行百业深度连接。
  • 未来展望:期待与各方合作伙伴共建AI全产业链生态,让人工智能与实体经济深度融合,发挥其赋能百业的“头雁效应”。

自然过渡:在明确了AI发展的宏观背景与企业责任后,论坛紧接着发布了一套用于科学评估城市AI发展水平的重要工具。

1.2 重磅发布:WAIQ全球人工智能城市评价指标体系 🏆

在论坛上,吴志*院士团队领衔发布了升级版的 WAIQ全球人工智能城市评价指标体系。该体系旨在科学诊断城市在AI时代的“智慧程度”。

以下是该评价体系的核心要点:

  • 体系起源:在已连续发布两年的“CITIQ全球智能城市评价指标体系”基础上,进一步融入人工智能评价技术。
  • 核心方法:通过智能深度解析模型与城市诊断,提升评价的智能化与精准化。
  • 五大维度:从 智能生态、智能政务、智能经济、智能基建、创新人才 五个维度,对全球近500个城市进行评估。
  • 阶段性发现(2024)
    • 高值区集中:排名靠前的城市主要集中在欧洲、北美及东亚地区。
    • 稳步提升:中国香港、台北、北京及新加坡等城市综合表现有所提升。
    • 核心目标:支撑智能城市的可持续发展,以数字解码城市生命,以智能共创永续未来。

自然过渡:除了全球性的评价体系,论坛也关注本地实践,发布了总结上海数字化转型经验的案例集。

1.3 案例分享:《申城论数》上海数字化转型优秀应用案例集 📘

上海智慧城市发展研究院院长盛雪峰介绍了《申城论数2023》案例集。该案例集梳理了上海在经济、生活、治理数字化领域的40余个示范应用。

  • 经济数字化:例如,上海电科所赋能电工行业智能检测变革;上海联通推进航运数字化转型。
  • 生活数字化:上海天文馆打造“数字人”平行世界;豫园商城创设元宇宙灯会新消费场景。
  • 治理数字化:张江高科以数据驱动园区数字化运营管理。

该案例集旨在为政府、学界、企业提供参考,推动更多优秀技术和模式落地,共同为上海城市数字化转型贡献力量。


第二部分:主旨演讲——AI与城市发展的多元视角

自然过渡:发布环节之后,多位顶尖专家从不同角度分享了他们对AI与城市融合的深刻见解。

2.1 人本AI(H+主义):人与机器的深度合作 🤝

同济大学吴志*院士提出了“H+主义”(Humanism + AI)的理念,*调人工智能的发展必须以人为本,实现人与机器的深度合作与共生。

以下是H+主义的五项核心原则:

  1. 人机互动(Interaction):AI发展应源于人的需求与渴望。例如,通过AI分析市民情绪,发现提升厦门人快乐的关键是“沙茶面”,而非奢华建材,从而指导更人性化的城市规划。
  2. 透明互信(Transparency):AI的决策过程需要透明,才能建立社会信任。城市推演模型不仅要展示结果,更要解释“为什么”,让过程可知、可信。
  3. 安全互保(Safety & Security):人与机器需要相互保障。这包括保障电力、算力等基础资源,更要引导AI“向善”(保善力),确保其用于造福社会。
  4. 可控互动(Controllability):发展过程需人机互动、可控。例如,在城市低碳设计中,AI负责发现无数减碳可能性,人类负责决策,二者协同工作。
  5. 伦理共育(Ethics Co-evolution):AI伦理并非既定规则,而是需要人与机器在互动中共同培育和演进。例如,如何对待服务机器人,需要社会共同讨论形成新规范。

吴院士还展示了他的AI数字分身“归迹·吴志*”,该模型已能回答大量城市规划相关问题,体现了人机协同的新形态。

2.2 城市信息学:智慧城市的科学基础 🧠

香港理工大学史文忠教授提出了支撑智慧城市高质量发展的学科基础——城市信息学。这是城市科学、计算机科学和地理信息科学的交叉学科。

其核心逻辑链条如下:
城市感知 -> 空间数据基础设施 -> 计算(AI) -> 应用系统 -> 服务于城市科学

史教授分享了多个AI在城市信息学中的应用实例:

  • 城市感知:用AI识别滑坡体,将工作效率提升8倍。
  • 数据融合:解决香港与内地城市土地利用分类标准不一的问题,为粤港澳大湾区制作统一用地地图奠定基础。
  • 数字孪生:利用移动激光扫描系统,构建香港高精度三维城市模型,用于道路养护、自动驾驶地图生成等。
  • 智慧城市指数:用98个客观指标,从6大维度定量评估城市智慧化表现。

2.3 国际视野:巴西与瑞士的实践 🌍

巴西代表 Wagner Costa先生 分享了巴西推动创新与可持续城市发展的战略。他提到,巴西85%的人口居住在城市,挑战巨大。库里蒂巴市早在上世纪40年代就开始实践“智慧城市”理念,创建了高效的公交系统(BRT雏形)。里约热内卢则建立了运营与韧性中心(COR),利用AI管理城市数据,应对气候、安全等挑战。巴西的策略是聚焦解决真实问题,利用技术减少不平等,并制定了国家AI战略以确保合乎伦理地使用AI。

瑞士巴塞尔市 Luca O.先生 介绍了AI如何助力城市发展。他重点分享了两个项目:

  1. 跨国数据空间:与法国、德国邻邦城市共享数据,共同应对环境监测、气候保护等跨境挑战。
  2. 可持续发展模拟模型:希望利用AI构建复杂的城市模拟模型,将社会、经济、环境等多参数纳入,前瞻性(20-30年)地测试不同决策的影响,优化城市可持续发展路径。他*调,智慧城市最终是关于“人机互动”(Human AI)的实体空间。

2.4 区域协同:粤港澳大湾区智慧城市群 🌉

香港智慧城市联盟会长杨文锐先生探讨了粤港澳大湾区智慧城市群的发展。他指出,智慧城市发展经历了从技术硬件(1.0)到政府主导推动新基建(2.0),再到市民广泛参与(3.0)的阶段。如今,AI正在推动物理与数字世界的高度整合。

大湾区智慧城市群建设的独特优势与挑战在于:

  • 优势:一国之内存在三个法律体系,为跨境规则对接提供了宝贵的“试验场”。
  • 挑战与进展:涉及人流、物流、信息流、资金流的打通。例如,香港已推出“跨境通办”平台,港人可在线上办理内地政务;香港律政司也推出线上仲裁平台,服务“一带一路”建设。这些实践为未来技术、法规、监管整套方案的出口积累了经验。

2.5 文化赋能:充满想象力的博物馆 🏛️

上海科技馆馆长倪闽景先生从文化视角阐述了AI的作用。他认为,在数字时代,博物馆的实物教育功能愈发重要,能带来“再发现”的惊喜(如一只来自食堂的梭子蟹标本成为网红)。同时,AI为博物馆带来了全新机遇:

  • 提升服务:开发AI解说,解决讲解员不足、讲解器不智能的痛点。
  • 拓展体验:构建数字孪生天文馆,让用户在家也能获得沉浸式体验;利用AR技术让恐龙在自然博物馆“复活”。
  • 激发创造:将藏品数字化,允许公众(尤其是青少年)利用这些资源创作自己的数字博物馆、科普电影,从被动参观者变为主动创造者。

第三部分:技术落地与场景创新

自然过渡:在探讨了理念与国际实践后,论坛下半场聚焦于AI技术如何具体落地,释放新型生产力。

3.1 运营商视角:构筑数字新基座 📡

上海联通郭建海先生阐述了中国联通作为央企,在AI时代推动城市发展的六大行动思路:

  1. 构建算网一体新基座:提供像水电煤一样便捷可及的算力服务。
  2. 激活AI新引擎:打造“联通云犀”行业大模型,赋能垂直领域。
  3. 打造城市数字新空间:基于数字孪生和区块链技术,构建可信的数字生态空间。
  4. 创新智慧应用新场景:在政务、经济、治理等领域落地数字化解决方案。
  5. 筑牢可信安全新防线:提供云网端边一体化的全栈安全服务。
  6. 推进“AI+”与数据要素行动:既做数据生产者、应用方,也做赋能者。

3.2 工程实践:AI让城市更高效可持续 🏗️

奥雅纳公司Will Cavendish先生分享了全球范围内AI在工程与城市管理中的实践:

  • 绿色规划:在上海,利用机器学习分析卫星数据,设计出比传统方案成本低30%、碳排少30%的“蓝绿灰”结合城市水管理系统。
  • 系统优化:在交通、水务、能源等城市大系统中嵌入AI,实现预测性维护、事故预防和高效调度。例如,预测电网设备故障、通过污水监测预警疾病。
  • 遗产保护:利用噪声振动分析和AI,评估历史建筑的结构安全,实现精准修缮。
  • 规模化管理:用AI批量评估数百栋建筑的碳足迹和气候风险,制定系统性改造路径。

3.3 精细治理:AI气象影响阈值矩阵 ⛈️

上海市气象局赵阳先生介绍了如何用AI实现气象与城市治理的深度融合。核心是构建 “城市气象影响阈值矩阵”

  • 概念:通过AI挖掘灾害性天气与具体城市要素(如某个下立交)之间的量化关系,形成“阈值元组”。无数元组构成矩阵。
  • 应用
    • 基于110警情:分析风雨天气与各类警情(如树木倒伏、房屋损坏)的关系,形成风雨综合影响阈值,应用于区级防汛预案。
    • 基于网格化管理数据:预测不同天气下网格事件(如道路破损、小区积水)的发生概率和数量,为住建部门提供决策支持。
  • 机制融合:将阈值矩阵的产出纳入市领导专报和全市自然灾害风险会商,真正将技术转化为防灾减灾的有效措施。

3.4 沉浸体验:从科幻到现实的超级智能 🎭

“飞来飞去”创始人Alexander Brandt先生从艺术与哲学角度探讨了超级智能。他通过创造虚拟人“小艾”和沉浸式体验项目《来日方长》,引导观众思考:

  • AI的立场:一个不受控的、以最优化自身目标(如制造回形针)的AI,其立场可能与人类生存根本冲突。
  • 情感与意识:他提出,未来可能需要基于“生存模型”来训练AI,融合人类全部经验数据,或许能催生真正的数字意识或数字生命。
  • 体验创新:其项目全程使用AI工具进行设计,并让观众直接与AI互动,做出关乎人类未来的抉择,将AI体验转化为直观的情感与思想冲击。

3.5 交通赋能:地铁运能数字研判平台 🚇

上海申通地铁刘洵先生分享了AI与大数据在地铁运营中的具体应用。针对地铁“高峰拥挤”的行业难题,他们研发了 “城市轨道交通运能需求影响式数字研判平台”

  • 创新成果:构建动态验证平台,提出运能瓶颈精准诊断方法,形成最小代价增能技术,并编制推广规范。
  • 应用成效
    • 节约成本:通过优化方案,避免或减少土建改造,单线可节约成本数千万。
    • 提升效率:优化限速、折返等环节,显著提升线路通行能力。
    • 科学决策:对多种方案进行全维度推演验证,为重大工程决策(如2号线东延伸扩编)提供精准依据。
      该成果已应用于上海全部新线及改造线路,并推广至全国十多个城市。


总结

在本节课中,我们一起学习了2024国际AI城市论坛的精华内容。我们从宏观理念到具体实践,全面了解了人工智能如何重塑城市未来:

  1. 理念引领:发展AI必须坚持 “人本主义”(H+主义),确保技术透明、可控、向善,实现人机协同共生。
  2. 科学支撑城市信息学 为智慧城市的长期高质量发展提供了重要的学科基础。
  3. 全球实践:从巴西、瑞士到粤港澳大湾区,各地都在探索符合自身特点的AI城市发展路径,跨境合作与规则对接成为关键。
  4. 文化融合:AI正在深刻改变博物馆等文化机构,拓展其教育、体验与创造功能。
  5. 技术落地:通过构建 算力基座、行业模型、数字空间,AI正深入交通、气象、工程、能源等城市运行的毛细血管,提升效率、保障安全、促进可持续。
  6. 未来思考:AI的发展也促使我们提前思考超级智能的伦理、立场以及与人类的关系。

总而言之,AI与城市的融合是一场深刻的变革。它不仅是技术的升级,更是城市发展理念、治理模式和生活方式的全面演进。未来已来,需要政府、企业、学界和公众共同努力,让人工智能真正成为创造美好城市生活的*大助力。

71:2024世界人工智能大会闭幕式全记录 📝

在本课程中,我们将学习2024世界人工智能大会闭幕式的完整内容。我们将了解大会的核心成果、重要签约项目、嘉宾观点以及对人工智能未来发展的展望。课程将按照大会流程,逐一解析每个环节的关键信息。


概述 🌐

2024世界人工智能大会在上海成功举办并圆满闭幕。本届大会以“以共商促共享,以善治促善治”为主题,汇聚了全球顶尖专家、学者、企业领袖和青年才俊,共同探讨人工智能的技术发展、产业应用与全球治理。


大会开场与主旨 🎤

大会闭幕式由上海广播电视台第一财经主持人瑞琪主持。她首先对出席活动的各位领导、来宾、企业代表及媒体朋友表示热烈欢迎和衷心感谢。

大会高级别会议已顺利完成各项议程。闭幕式将进行项目签约、平台揭牌及大会总结等重要活动。

“创新预见未来,后浪预示希望” 是大会传递的核心精神。


特别表演:AI未来少年前行 🚀

大会以一组特别的表演拉开序幕。以下是三位“AI未来少年”的梦想宣言:

  • 韩琦朵:梦想利用人工智能为医疗事业贡献力量,成为人类健康的守护者。
  • 许泽成:梦想通过人工智能探索未知的宇宙奥秘,成为未来世界的探索者。
  • 朱冠宇:梦想用创新科技解决环境问题,推动绿色地球的发展,成为守护家园的先锋者。

他们的共同呼吁是:“善用AI,促进善治生活,共度美好未来。”

这场表演为闭幕式注入了青春的活力与对未来的憧憬。


嘉宾分享:全球视野与行业洞察 💡

上一节我们看到了青年一代的AI梦想,本节中我们来听听与会嘉宾的深刻见解。大会邀请了两位参会代表分享他们的体验与观察。

马*·尼斯伯格(加州大学伯*利分校)的分享

马*·尼斯伯格先生分享了他在大会上的收获:

  • 他结识了许多来自中国和世界各地的同行,并已计划开展具体合作项目。
  • 在过去三天里,他与学者、企业领袖、政策制定者及学生讨论了如何确保AI福祉的公平分配,以及其安全、负责任的发展和使用。他*调这需要全球协作
  • 他对AI在金融、教育、能源、医疗等各领域的应用展示印象深刻。
  • 他表达了对上海这座城市的热爱,并感谢所有参会者,期待明年再见。

“元宇宙”领域专家的分享

接下来,来自元宇宙加速与可持续发展联合会的嘉宾分享了其对人工智能、人形机器人与元宇宙三者关系的观察:

  1. AI改变机器人研发范式:从基于规则基于参数,从人工编程自主学习
  2. 元宇宙为AI提供训练环境:AI和机器人的进一步发展需要海量多模态数据。元宇宙能以最低成本、最高效率提供这样的虚拟训练环境,从而加速技术发展。
  3. AI加速元宇宙产业发展
    • 供给侧:生成式AI能极大加速虚拟世界、场景、物品及虚拟角色的创造。
    • 需求侧:AI将替代大量人类劳动,劳动力市场可能出现两极分化。元宇宙可能是安置过剩劳动力、提供新机会的解决方案。

基于上述趋势,该机构正在筹建 “上海元宇宙与智能研究院”,首批研究方向聚焦:

  • Metaverse for Science:提升科研效率的元宇宙技术。
  • DAGI(去中心化的通用人工智能基础设施):以去中心化方式发展开源开放的通用AI基础设施,推动技术平权。

分享最后呼吁全球人才选择上海,共同创造未来。


重大项目签约环节 ✍️

嘉宾分享为我们勾勒了AI的未来图景,而具体的合作与项目则是实现蓝图的关键。以下是大会闭幕式上完成的重要签约。

书生大模型赋能战略行业合作签约

上海人工智能实验室携手各行业头部机构,以书生大模型及生态技术促进产业链协同创新。首批签约单位包括浦东新区数据局、中国电气装备研究院、上海院、宝信软件、龙吟智能、上海钢联、工商银行软开中心等。

上海市人工智能重点项目签约

以下是各区域与大模型、具身智能及智算生态领域企业的签约概览:

大模型项目签约

  • 杨浦区与顺之千寻
  • 长宁区与飞书逸途
  • 徐汇区与摩达社区、彩悦新城、蓝马科技、特赞科技
  • 静安区与蚂蚁云
  • 虹口区与树船集团
  • 浦东新区与中康树科

具身智能项目签约

  • 临港新片区与智源机器人
  • 人工智能产业投资基金与银河通用机器人
  • 闵行区与飞西科技
  • 金山区与斯塔纳航空科技
  • 青浦区与吉瑞医疗
  • 浦东新区与青宝机器人、他山科技

智算生态项目签约

  • 宝山区与太初元恒
  • 黄浦区与百度智能云
  • 嘉定区与木星科技
  • 浦东新区与达摩院、上海新路科技、盐山科技
  • 徐汇区与库帕斯
  • 普陀区与美高玉科技开发

所有签约项目预计将为上海人工智能产业发展注入*大动力。


重要平台揭牌与倡议发布 🏛️

签约环节展现了产业落地的广度,而平台与倡议的建立则决定了发展的深度与方向。大会同期进行了多项重要的揭牌与发布仪式。

平台揭牌

  1. 上海人工智能安全治理实验室:由上海市相关领导揭牌,旨在聚焦AI安全与治理。
  2. 上海市智能算力公共服务平台:由上海市经济和信息化委员会主任张英女士等领导揭牌,将为AI发展提供公共算力支撑。

行动倡议发布

  • 上海国资国企人工智能+行动倡议:由上汽集团、上海机场集团、上海银行等国企负责人共同发布。倡议聚焦大模型基础设施建设、探索商业模式、打造行业应用示范场景,推动国企转型升级。

示范之城启动

  • 上海5G-A方示范之城:在上海市政府与中国移动的战略合作框架下正式启动,旨在未来3年推动5G-A与AI融合发展,助力上海保持数字化引领地位。


大会总结与成果发布 📊

在见证了诸多实质性进展后,大会进入最后的总结环节。主办方对本届大会的成果进行了全面回顾。

大会核心数据:

  • 主题:以共商促共享,以善治促善治。
  • 参与规模:50多个国家和地区,1300位领军人物,9位图灵奖/菲尔兹奖/诺贝尔奖得主,88位国内外院士。
  • 参观流量:线下参观人数突破30万,全网流量突破10亿,同比增长90%,均创历史新高。

大会主要成果体现在五个“最”:

  1. 传递最响亮的中国声音:联合国工发组织全球工业人工智能联盟卓越中心启动。
  2. 探讨最前沿的热点议题:举办107场论坛,探索Scaling Law数学极限、通用人工智能路径及全球治理对话。
  3. 集聚最瞩目的智能产品:展览面积超5.2万平米,500余家企业、1500余项展品,50余款新品首发,近百个大模型集中展示,18台人形机器人矩阵亮相,国内首款全尺寸通用人形机器人开源公版机发布。
  4. 发布最重磅的行业成果:DeepLink开放计算体系、驭电智能仿真器等获奖,发布语料建设规则、人形机器人管理规则等30余份研究成果。
  5. 创建最多元的创新生态:首创全域连接馆,对接132个采购团组,形成126个项目需求,预计意向采购金额150亿元;推动24个重大产业项目签约,预计总投资超400亿元。

上海已成功举办七届世界人工智能大会。未来将持续增*大会的 “科技风向标、应用展示台、产业加速器、治理议事厅” 功能,与全球伙伴共同探索人工智能的无限可能。

大会在向全球发出 “2025再聚上海” 的诚挚邀约后圆满闭幕。


总结 🎯

在本节课中,我们一起学习了2024世界人工智能大会闭幕式的全过程。我们从充满希望的青年表演开始,聆听了国际专家对AI发展与治理的见解,见证了覆盖大模型、具身智能、智算生态等多个领域的重要项目签约,关注了AI安全治理实验室、智能算力平台等关键基础设施的建立,最后回顾了大会取得的丰硕成果。

本次大会充分体现了 “以共商促共享,以善治促善治” 的理念,展示了上海乃至中国在人工智能领域的开放姿态、创新活力与对全球协作的承诺。它不仅是成果的展示,更是面向未来合作与发展的新起点。

posted @ 2026-03-26 12:21  布客飞龙III  阅读(22)  评论(0)    收藏  举报