刷新
文本生成任务评估指标

博主头像 PPL PPL 困惑度衡量的是语言模型对文本的不确定程度,困惑度越低说明模型越确定下一步要生成什么词,模型越好 \(ppl=\exp(-\frac{1}{N}\sum_{n=1}{N} P(w_n|w_{<n}))\) 其计算方法是计算句子每个 token 的平均对数似然,再过一个指数函数 BLEU ...

AI时代,人人都是算法思想工程师

博主头像 AI时代,程序员都应该是算法思想工程师 AI 编程时代,AI写的代码又快又好。但面对具体业务场景,如果不能清晰地描述需求和定义边界,并从算法角度理解和建模问题,那么AI也无所适从。因此,在 AI 时代,程序员既需要深入理解业务和确定技术架构,更需要熟练掌握核心算法思想,并用算法思想来指导AI替你干活 ...

读2025世界前沿技术发展报告04人工智能技术

博主头像 1. 人工智能技术 1.1. 人工智能是引领未来的新兴战略技术,是驱动新一轮科技革命和产业变革的重要力量 1.2. 2024年,语言大模型、多模态模型、智能体和具身智能等领域不断出现突破性创新,或推动人工智能迈向通用智能初始阶段 2. 大模型技术 2.1. AI大模型的缩放定律(Scaling La ...

Claude Code 完整上手指南

博主头像 一、Claude Code Claude Code 是 Anthropic 推出的 面向真实工程场景的 AI 编程助手。我们不能把 Claude Code 理解为聊天版的 AI, 它其实更接近于 能直接参与项目开发的工程师,它不只是回答“怎么写代码”,而是可以 理解整个代码仓库、跨文件修改代码、运行 ...

Vibe Coding 之我们距离 “贾维斯” 还有多远

博主头像 作者通过使用Vibe Coding和Claude Code等AI编程工具的实践经验,分享了与AI协作的方法和技巧。文章探讨了当前AI工具与理想中"贾维斯"智能助手的差距,包括缺少持续记忆、意图理解需反复对齐、决策点过于依赖人工等问题。作者提出了通过模板化常见场景、记录决策过程、优化沟通方式等方法来改... ...

ICLR2026 | 视频虚化新突破!Any-to-Bokeh 一键生成电影感连贯效果

博主头像 针对视频散景制作常面临操作复杂、效果不自然等问题,难以满足创作者高效出片需求等问题,我们提出 Any-to-Bokeh 一键式视频虚化工具,对应的论文已被 ICLR2026 接收!该工具无需复杂操作无需专业操作即可生成电影感虚化效果。为短视频创作者、影视从业者提供了高效易用的创作工具,也为相关领域科... ...

Windows系统安装OpenClaw并使用Qwen千问接入飞书教程

博主头像 Windows系统安装OpenClaw并使用Qwen千问接入飞书教程 免责声明 ⚠️ 本教程仅供学习和参考 purposes,作者不对使用本教程产生的任何后果承担责任。 使用风险: 读者应自行评估使用本教程的风险,因遵循本教程操作而导致的任何直接或间接损失(包括但不限于数据丢失、系统故障、账号 ...

读人工智能全球格局:未来趋势与中国位势18专家视角(下)

博主头像 1. 伦理研究 1.1. 刘哲 1.1.1. 北京大学哲学系副主任、长聘副教授 1.1.2. 《中国机器人标准化白皮书》 1.2. 法律规制具有一定的滞后性,当人工智能和机器人带来的现实问题还未出现的时候,是很难从法律方面进行监管的 1.3. 从英美这些国家的做法来看,它们意图把伦理价值融入人工智能 ...

AI渗透测试工具:从"脚本跑腿"到"Agent大脑"的范式革命

博主头像 渗透测试的战场正在发生根本性变化。 传统模式里,你是猎人,工具是猎狗。 你指挥它"扫这个IP"、"测这个端口"、"注入那个表单",它按你的指令执行,遇到问题停下来等你决策。 2026年的AI渗透测试,完全不是这回事。 Agent成了猎人,你成了顾问。 它们自主规划攻击路径、动态调整策略、相互协作攻破 ...

读人工智能全球格局:未来趋势与中国位势17专家视角(上)

博主头像 1. 加大对人工智能基础理论的探索 1.1. 刘海滨 1.1.1. 中国航天系统科学与工程研究院总工程师 1.2. 人工智能的发展不会一帆风顺,技术进展缓慢、伦理道德冲击、根技术储备不足、应用不满足实际需求等,都将给中国人工智能的发展带来挑战 1.2.1. 我国仍然是一个追随者,不完全是一个创新突破 ...

123···27>