ExplorerMan - 博客园

谷歌 DeepMind 推出 OPRO 技术，可优化 ChatGPT 提示

摘要：据站长之家 11 月 21 日报道，在最新的 AI 研究报道中，Google DeepMind 推出了一项名为“优化通过提示（OPRO）”的技术，将大型语言模型（LLM）作为其自身提示的优化器。该方法旨在通过自然语言描述问题，指导 LLM 生成和改进解决方案，从而提高提示性能。 DeepMind 的阅读全文

posted @ 2025-02-18 14:17 ExplorerMan 阅读(181) 评论(0) 推荐(0)

PromptWizard：微软开源 AI 提示词自动化优化框架

摘要： ‌PromptWizard‌是一个由微软研究院开发的自动化提示词优化框架，旨在改进大型语言模型（LLMs）在特定任务中的表现。该框架通过自我演变和自我适应机制，利用反馈驱动的批评和合成过程，迭代优化提示指令和上下文示例，从而提高模型的准确性和效率‌12。主要功能和技术原理 PromptWizard 阅读全文

posted @ 2025-02-18 11:40 ExplorerMan 阅读(742) 评论(0) 推荐(0)

Flow-DPO通过在线多Agent学习提升LLM的数学推理能力

摘要： ‌Flow-DPO‌是一种通过在线多智能体学习来提升LLM（大型语言模型）数学推理能力的新方法。Flow-DPO结合了在线学习流（Flow）和直接偏好优化（DPO），通过两个独立的语言模型互相协作，纠正对方的错误，从而生成更加准确和详细的推理轨迹‌12。工作原理 Flow-DPO的核心在于构建两个阅读全文

posted @ 2025-02-18 11:27 ExplorerMan 阅读(126) 评论(0) 推荐(0)

2024年大模型对比

摘要：自OpenAI在2022年12月发布GPT-3.5模型驱动的ChatGPT以来，生成式AI就如火如荼地展开了一场声势浩大的「军备竞赛」。而仅仅不到两年，多个实验室就都已经赶上了OpenAI的GPT-4，甚至出现了第一批超越GPT-4o智能水平的模型。例如：Claude 3.5 Sonnet，Gem 阅读全文

posted @ 2025-02-17 20:54 ExplorerMan 阅读(187) 评论(0) 推荐(0)

谷歌新一代大模型Gemini 2.0

摘要：继量子芯片之后，谷歌又来抢“OpenAI双12直播”的流量了！就在刚刚，谷歌新一代大模型Gemini 2.0突然登场，再次由谷歌CEO皮猜亲自官宣。新一代模型专为AI Agent而打造，谷歌表示目前已经将2.0版本提供给了一些开发者内测，正在迅速将其集成在Gemini和搜索等产品线中。好消息是阅读全文

posted @ 2025-02-17 20:47 ExplorerMan 阅读(193) 评论(0) 推荐(0)

大模型在陌陌的推理与应用

摘要：导读本文将分享陌陌如何利用大模型技术革新其业务与研发流程。主要内容包括以下几个部分： 1. AI 应用范式更新 2. 大模型高效推理 3. 大模型应用平台 4. 未来展望 5. 总结 6. Q&A 分享嘉宾｜陈玉祥挚文集团算法工程专家编辑整理｜王文海内容校对｜李瑶出品社区｜DataFu 阅读全文

posted @ 2025-02-17 20:19 ExplorerMan 阅读(163) 评论(0) 推荐(0)

2024年大模型推理优化论文精选

摘要： OSDI (USENIX Symposium on Operating Systems Design and Implementation) 和SOSP (ACM Symposium on Operating Systems Principles) 是计算机操作系统领域最重要的两大国际会议，在国际上阅读全文

posted @ 2025-02-17 20:17 ExplorerMan 阅读(912) 评论(0) 推荐(0)

DeepSeek-R 与 DeepSeek-V 区别

摘要： DeepSeek-R1和DeepSeek-V3是深度求索推出的两款大模型，它们在设计目标、架构、训练方法、性能表现和应用场景等方面存在显著差异，以下是具体对比： 1. 模型定位与核心能力 DeepSeek-V3：通用型自然语言处理模型，专注于多语言生成、知识问答、内容创作等任务，优势在于高效的多模态阅读全文

posted @ 2025-02-14 16:48 ExplorerMan 阅读(2479) 评论(0) 推荐(0)

深度学习中常用的开源数据集

摘要： Kaggle（https://www.kaggle.com/datasets）：Kaggle 是一个著名的数据科学竞赛平台，也提供了大量的开放数据集供用户下载和使用。UCI Machine Learning Repository（https://archive.ics.uci.edu/dataset 阅读全文

posted @ 2025-02-13 14:39 ExplorerMan 阅读(1425) 评论(0) 推荐(0)

LLM时代，数据为王，19个开源数据集下载网站汇总

摘要：大模型时代，数据为王，在哪里寻找开源数据集，是一个比较头疼的问题。经过调研整理，下面列出了目前可以寻找开源大模型数据集的网站清单。 1、HuggingFace开源数据集链接：https://huggingface.co/datasets 镜像：https://hf-mirror.com/datas 阅读全文

posted @ 2025-02-13 14:36 ExplorerMan 阅读(4904) 评论(0) 推荐(0)