导航

上一页 1 2 3 4 5 6 7 8 9 ··· 96 下一页

2025年1月20日

摘要: Meta AI 近期发表的一篇论文 "Memory Layers at Scale" 为我们提供了一个新的思路:为模型配备可学习的“记忆”模块,使其能够像人脑一样,选择性地存储和检索信息,从而在不显著增加计算成本的前提下,大幅提升模型的性能,尤其是在处理事实性知识方面。 https://ai.met 阅读全文

posted @ 2025-01-20 17:07 蝈蝈俊 阅读(245) 评论(0) 推荐(0)

摘要: 人工智能的飞速发展,在为我们描绘美好未来的同时,也引发了深刻的忧虑:AI是否会有一天凌驾于人类之上?我们辛勤的工作会不会被冰冷的机器取代? 面对这些疑问,1月15日,李飞飞接受海外播客 Possible 的访谈中给出了她的答案,并再次敲响警钟:“AI Agent的根本定位应该是工具而非主导者,是赋能 阅读全文

posted @ 2025-01-20 13:53 蝈蝈俊 阅读(194) 评论(0) 推荐(0)

2025年1月17日

摘要: DeepSeek-V3 采用的 DeepSeekMoE 架构,通过细粒度专家、共享专家和 Top-K 路由策略,实现了模型容量的高效扩展。 每个 MoE 层包含 1 个共享专家和 256 个路由专家,每个 Token 选择 8 个路由专家,最多路由至 4 个节点。这种稀疏激活的机制,使得 DeepS 阅读全文

posted @ 2025-01-17 13:57 蝈蝈俊 阅读(9740) 评论(0) 推荐(1)

2025年1月16日

摘要: 最近,关于“AI Agent 将取代 App”的观点甚嚣尘上,引发了科技圈的广泛讨论。 随着人工智能技术的飞速发展,我们似乎看到了一个更加智能、更加主动的未来。 那么,Agent 真的会像一些人预测的那样,彻底颠覆我们过去十几年习以为常的 App 生态吗? 今天,我们就来深入探讨一下这个充满想象力的 阅读全文

posted @ 2025-01-16 16:20 蝈蝈俊 阅读(334) 评论(0) 推荐(0)

2025年1月15日

摘要: 你是不是也有这种感觉?跟AI聊了半天,它给出的答案总是差强人意,甚至让你觉得它有点“人工智障”? 别急着给它下定义,很可能不是AI不够聪明,而是你和它沟通的方式出了问题! 想象一下,你买了一把瑞士军刀,结果只用来拧螺丝。它也能用,但明显浪费了它各种强大的功能! 跟AI的互动也是同样的道理。 现在,很 阅读全文

posted @ 2025-01-15 13:45 蝈蝈俊 阅读(289) 评论(0) 推荐(0)

摘要: 我们常常被情绪牵着鼻子走。 生气、焦虑、悲伤…… 这些情绪仿佛凭空出现,让我们措手不及。 我们习惯性地将情绪归咎于外界的事件,却忽视了隐藏在情绪背后的深层机制。 今天,我们将介绍一个更全面的情绪模型,帮助你解锁情绪密码,更好地掌控自己的生活。 情绪模型 传统的ABC模型(A-事件,B-认知,C-情绪 阅读全文

posted @ 2025-01-15 09:19 蝈蝈俊 阅读(116) 评论(0) 推荐(0)

2025年1月14日

摘要: 最近发布的《Agent白皮书》引发了广泛关注。 https://www.kaggle.com/whitepaper-agents 中文版 https://arthurchiao.art/blog/ai-agent-white-paper-zh/ 这份报告深入探讨了AI智能体(Agent)的概念、能力 阅读全文

posted @ 2025-01-14 10:39 蝈蝈俊 阅读(347) 评论(0) 推荐(0)

摘要: 今天,深入到 GPT 的“思考引擎”内部,聚焦最核心的两个部件:多头因果自注意力和前馈神经网络,看看它们是如何精妙配合,赋予 AI 理解上下文、预测未来的强大能力。 依然以 “The cat sat on the” 这个例句为例,模型需要预测下一个词。在将这句话转化为“数字暗号”并穿上“小马甲”(词 阅读全文

posted @ 2025-01-14 09:06 蝈蝈俊 阅读(136) 评论(0) 推荐(0)

2025年1月13日

摘要: 大语言模型的预训练,就像让模型玩一个“填空”游戏,模型需要预测句子中下一个会出现的词,并通过不断学习来提高预测的准确率。 picoGPT:GPT 的“迷你版”,麻雀虽小五脏俱全,一个用纯 Python 实现的极简 GPT 模型 虽然没有演示这个预训练,但是演示了推理过程,即如何基于GPT2的模型参数 阅读全文

posted @ 2025-01-13 17:18 蝈蝈俊 阅读(75) 评论(0) 推荐(0)

摘要: 相信不少朋友都有过这样的经历:线上告警突如其来,团队成员立刻紧张起来,争分夺秒地排查问题、快速止损。在稳定性保障这条道路上,谁来主导,至关重要。 我曾身处美团金融团队,深知在应对大流量冲击、快速止损方面的运维主导模式的威力。那种对系统运行状态的精准把握,对预案执行的果断高效,至今历历在目。然而,最近 阅读全文

posted @ 2025-01-13 11:03 蝈蝈俊 阅读(83) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 7 8 9 ··· 96 下一页