大模型 - 第27页 - 网站分类

20个AI爱好者必听的顶级播客

20个AI 爱好者必听的顶级播客(含推荐单集)1. TWIML AI 播客The TWIML AI Podcast 深入探讨机器学习与人工智能，邀请业内顶尖专家进行访谈。内容涵盖 AI、机器学习、深度学习、自然语言处理与数据科学。无论你是行业专家、技术型商业领袖，还是科技爱好者，都会有所收获。主持人 ...

HRM(Hierarchical Reasoning Model)部署训练记录

前两天朋友刷到HRM这个27M模型的文章，想让我试着部署训练一下。此文用于记录部署过程前期准备克隆仓库 sapientinc/HRM 安装CUDA 我的CUDA是已经安装好的12.8版本，安装过程不再赘述安装torch torch版本如下 Version: 2.7.1+cu128 pip in ...

"When Large Language Models Confront Repository-Level Automatic Program Repair How Well They Done" 论文笔记

介绍 (1) 发表：ICSE'24 (2) 背景 APR 任务的这些模型的当前评估仅关注错误所在的单个功能或文件的有限上下文，从而忽略了存储库级上下文中的有价值信息。现有的数据集要么不是在存储库中构建的，例如 Quixbugs，要么无法准确恢复存储库级错误的方案，例如 Defects4J。本文研究了 ...

百度Comate的AI编程工具小试

背景百度Comate基于文心大模型（ERNIE-Code），结合百度内部编程大数据及GitHub优质开源数据训练，具备深度语义理解能力。支持100+编程语言（如Go、Java、Python、JavaScript等），兼容主流IDE（VS Code、JetBrains系列）。Zulu智能体提示词依然 ...

关于生成式AI对软件工程相关职业影响

背景论文《Working with AI: Measuring the Occupational Implications of Generative AI》。这篇由微软研究院团队撰写的论文，通过分析20万条用户与Microsoft Bing Copilot（现Microsoft Copilot） ...

GLM4.5在线版快速开发实践

背景1. GLM4.5 GLM（General Language Model，通用语言模型）是大语言模型（LLM）的一种技术路线，以支持多模态、长文本理解和复杂推理为特点。GLM4.5的代码生成能力基于对海量代码语料（如GitHub开源项目、技术文档、问答社区）的学习，支持主流编程语言（ ...

CodeGeeX体验GLM4.5模型与实践

背景各模型概要性能评估Ghost Comments看那些右箭头，就是动态注释，没有真实写入文件代码BUG修复总体一般，没有智能体的特色，只有CodeGeeX问答模式。增加注释速度快，但不生成方法头部的注释解释代码文字解释后，生成了流程图实战代码扩展性修改PK提示词@workspace #codeba ...

Git工作面试必知必会操作-命令行篇

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

清华大学软件学院长聘副教授龙明盛：Timer 3.0 已经成为了“满血版”的时序大模型

7 月 5 日，2025 时序数据库技术创新大会在北京成功举办，清华大学软件学院长聘副教授龙明盛在大会上做主题报告《Timer 3.0：新一代生成式时序大模型》，深入剖析当前时间序列分析领域面临的核心挑战，系统阐述了时序大模型的技术演进趋势与行业痛点，并重点分享清华团队自主研发的时序大模型 Time ...

AI营销应用与出海

反思脑图FAQ问：在复合的增长手段之下，如何确定哪一种手段更有效，是否存在数据安慰剂的问题？对于自杀式增长的现象，你们怎么看？答：这是一个有效的问题，我们现在面临的情况是，在复合增长手段中，很难判断哪一种手段更为有效，甚至可能存在数据安慰剂的现象。自杀式增长指的是投入后看到销售同步增长，但不确定这种 ...

cursor1.3 重大更新！复刻 claude code！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

cursor1.3 重大更新！复刻 claude code！

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

IT文档中总出现的 hooks 是什么钩子回调

本文已收录在Github，关注我，紧跟本系列专栏文章，咱们下篇再续！魔都架构师 | 全网30W技术追随者大厂分布式系统/数据中台实战专家主导交易系统百万级流量调优 & 车联网平台架构 AIGC应用开发先行者 | 区块链落地实践者以技术驱动创新，我们的征途是改变世 ...

【Datawhale AI夏令营--task2】科大讯飞AI大赛（大模型技术）

进入baseline2 开启python编码阶段啦感想：开始的晚了一些，准备环境花了好久哦，好在ai可以帮忙安装环境需要的各种包，并且运行的报错也可以解决。以及硅基流动的免费api超级慢TT，遍历数据花费的时间过长了。听到分享会上可以用阿里百炼的api，但在调用上还有些问题，接下来要再多试一 ...

CodeBuddy IDE小试-单元测试篇

CodeBuddy IDE内置模型单元测试unittest基于Claude4.0 Sonnet生成单元测试，目录与位置没有问题。但存在一些引用的问题，我们基于Qwen3-coder模型进行修复CodeBuddy帮助我生成了中文方法名，不确定是不是我切换中文语言， following:@Testvoi ...

CocoIndex实现AI数据语义检索

1.概述在AI场景中，数据的高效处理与实时更新是推动技术突破的关键基石，而高性能的数据转换框架则是连接数据与 AI 应用的重要桥梁。CocoIndex 作为一款适用于人工智能的超高性能实时数据转换框架，凭借其独特的增量处理功能，在数据处理领域展现出显著优势。它不仅能实现数据的实时转换，更在数据新鲜 ...

12 MCP Servers的介绍

12 MCP Servers的介绍 MCP（模型上下文协议）是一项开放标准，简化了AI模型（特别是大语言模型LLMs）与外部数据源、工具和服务之间的交互方式。MCP服务器充当这些AI模型与外部工具之间的桥梁。以下是一些主流的MCP服务器：文件系统MCP服务器允许大语言模型直接访问本地文件系统，进行读 ...

GAIA基准测试介绍

背景 GAIA 是一个针对通用 AI 助手的基准测试，由 466 个经人类设计和注释的问题组成，这些问题有时会附带文件（如图像或电子表格），涵盖日常个人任务、科学和常识等多种助手使用场景。论文在这儿数据集https://huggingface.co/datasets/gaia-benchmark/G ...

AI应用与教育行业

背景 1. 技术驱动变革智能教育（也称为人工智能教育）正通过人工智能技术优化教育过程，提高教育质量，成为行业新方向。个性化教育和教育信息化已成为当前主流发展趋势，教师职业素养也在不断提升。 2. 在线教育发展在信息科技和互联网技术的推动下，中国的在线教育行业正在经历深刻变革，这种新型教育方式已 ...

Visual Studio Copilot 全面升级：更智能的默认模型、多模型切换、更便捷的使用管理

作为全球最受欢迎的集成开发环境之一，Visual Studio 一直致力于为开发者提供高效、智能的开发体验。无论是构建现代 Web 应用、跨平台移动应用，还是进行企业级系统开发，Visual Studio 都凭借其强大的调试工具、智能代码提示、丰富插件生态和云端协作能力，成为众多开发者首选的生产力平 ...