上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 20 下一页
摘要: Dario Amodei(Anthropic 首席执行官)最近与 Lex Fridman 进行了播客。 Anthropic 是 Claude 背后的公司,Claude 是目前领先且最有效的商业大语言模型之一。 他谈到了几个话题,但今天我们将重点讨论一个——AI的未来会是什么样子? 我们将首先探讨我们 阅读全文
posted @ 2024-12-20 09:04 果冻人工智能 阅读(181) 评论(0) 推荐(0)
摘要: 上一篇:《用人工智能模型预测股市和加密货币的K线图》 序言:预测时间序列,乍听之下似乎离我们普通人很遥远,甚至有些晦涩难懂。其实该技术早已渗透进了我们的日常生活。天气预报每天提醒你是否带伞、股市的波动影响你的投资决策、电力公司的负荷管理让你享受稳定的电网服务……这些无不依赖时间序列分析的强大力量。本 阅读全文
posted @ 2024-12-19 11:29 果冻人工智能 阅读(173) 评论(0) 推荐(0)
摘要: 人类是骄傲的生物。最近,关于AI是否具备推理能力的争论愈演愈烈。几个月前发布的OpenAI的o1模型引发了各种反应,有人认为它“不过是些障眼法”,也有人称之为“AI的新范式”。 AI的推理能力(或者缺乏推理能力)似乎触动了我们许多人敏感的神经。我怀疑,承认AI会“推理”被视为对人类自尊的打击,因为推 阅读全文
posted @ 2024-12-18 09:12 果冻人工智能 阅读(214) 评论(0) 推荐(0)
摘要: 上一篇:《人工智能规模法则的起源、分析、内幕以及对齐方法》 (18)《人工智能的宪法:用AI的反馈来确保AI的无害性》(2022年),作者:Yuntao、Saurav、Sandipan、Amanda、Jackson、Jones、Chen、Anna、Mirhoseini、McKinnon、Chen、O 阅读全文
posted @ 2024-12-17 09:28 果冻人工智能 阅读(63) 评论(0) 推荐(0)
摘要: 人工智能规模法则的起源、分析、内幕以及对齐方法 上一篇:《人工智能大语言模型起源篇,低秩微调(LoRA)》 (14)Rae 和同事(包括78位合著者!)于2022年发表的《Scaling Language Models: Methods, Analysis & Insights from Training Gopher》,https://arxi 阅读全文
posted @ 2024-12-16 09:27 果冻人工智能 阅读(223) 评论(0) 推荐(0)
摘要: 上一篇: 《规模法则(Scaling Law)与参数效率的提高》 序言:您在找工作时会不会经常听到LoRA微调,这项技术的来源就是这里了。 (12)Hu、Shen、Wallis、Allen-Zhu、Li、L Wang、S Wang 和 Chen 于2021年发表的《LoRA: Low-Rank Ad 阅读全文
posted @ 2024-12-15 10:37 果冻人工智能 阅读(228) 评论(0) 推荐(0)
摘要: 上一篇:《人工智能大语言模型起源篇(三),模型规模与参数效率》 规模法则与效率提高 如果你想了解更多关于提高变换器效率的各种技术,我推荐阅读2020年的《Efficient Transformers: A Survey》https://arxiv.org/abs/2009.06732论文,接着是20 阅读全文
posted @ 2024-12-14 10:12 果冻人工智能 阅读(102) 评论(0) 推荐(0)
摘要: 上一篇:《人工智能大语言模型起源篇(一),从哪里开始》 (5)Howard 和 Ruder 于2018年发表的《Universal Language Model Fine-tuning for Text Classification》,https://arxiv.org/abs/1801.06146 阅读全文
posted @ 2024-12-13 10:16 果冻人工智能 阅读(321) 评论(0) 推荐(1)
摘要: 序言:许多人最初接触人工智能都是在ChatGPT火热之际,并且大多停留在应用层面。对于希望了解其技术根源的人来说,往往难以找到方向。因此,我们编写了《人工智能大语言模型起源篇》,旨在帮助读者找到正确的学习路径,了解大型语言模型的大致起源。本文将分为三个部分,介绍当前主流的大型语言模型架构Transf 阅读全文
posted @ 2024-12-12 09:33 果冻人工智能 阅读(491) 评论(0) 推荐(1)
摘要: 前一篇:《从爱尔兰歌曲到莎士比亚:LSTM文本生成模型的优化之旅》 前言:加密货币市场昨日大幅下跌,一天内市值蒸发逾70亿 人民币。有人可能会问,如果使用人工智能模型预测市场的涨跌,是否能避免损失?作者在此指出,加密货币市场和股市具有高度的主观性,受人为因素、情绪波动和外界干预的显著影响,而非单纯依 阅读全文
posted @ 2024-12-11 10:28 果冻人工智能 阅读(404) 评论(0) 推荐(0)
上一页 1 ··· 10 11 12 13 14 15 16 17 18 ··· 20 下一页