AI
刷新
对 LLM 工具使用进行统一

博主头像 我们为 LLM 确立了一个跨模型的 统一工具调用 API。有了它,你就可以在不同的模型上使用相同的代码,在 Mistral、Cohere、NousResearch 或 Llama 等模型间自由切换,而无需或很少需要根据模型更改工具调用相关的代码。此外,我们还在 transformers 中新增了一些 ...

使用AI进行需求分析的案例研究

博主头像 生成式 AI 的潜在应用场景似乎无穷无尽。虽然这令人兴奋,但也可能让人不知所措。因此,团队在使用这项技术时需要有明确的目标:关键是要明确生成式 AI 在团队工作中能产生哪些实质性影响。 在软件工程中,一个引人注目的应用场景是需求分析。这是一个常常被忽视但充满挑战的环节,如果处理不当,可能会带来许多负 ...

从零开始学机器学习——了解回归

博主头像 在本文中,我们探讨了回归分析在统计学和数据分析中的重要性和应用。线性回归和逻辑回归作为两种主要的回归分析方法,分别适用于不同类型的数据建模和预测需求。通过数学建模,它们能够揭示变量之间的关系,并且在实际应用中展现了强大的预测能力。 ...

大模型应用曙光 - 10X压缩技术

博主头像 关注TechLead,复旦AI博士,分享AI领域全维度知识与研究。拥有10+年AI领域研究经验、复旦机器人智能实验室成员,国家级大学生赛事评审专家,发表多篇SCI核心期刊学术论文,上亿营收AI产品研发负责人。 如何在不牺牲性能的情况下将大型语言模型缩小十倍 虽然LLM的巨大规模赋予了它们在各种用例中 ...

深入理解LLM的可观测性

博主头像 特定 的 ChatLanguageModel 和 StreamingChatLanguageModel 实现(请参见“可观测性”列)允许配置 ChatModelListener,用于监听以下事件: 对 LLM 的请求 LLM 的响应 错误 这些事件包含的属性包括OpenTelemetry 生成 AI ...

Cursor AI应用一些建议

博主头像 使用Cursor一些建议和注意事项,以避免错误和提高效率背景 Cursor AI是一款集成了人工智能技术的代码编辑器,由Anysphere公司开发,是微软开源代码编辑器VS Code的一个分支。它旨在通过先进的人工智能模型(如GPT-4)来提高开发者的编程效率,为现代开发者提供远不止源代码补全的功能 ...

详解Diffusion扩散模型:理论、架构与实现

博主头像 本文深入探讨了Diffusion扩散模型的概念、架构设计与算法实现,详细解析了模型的前向与逆向过程、编码器与解码器的设计、网络结构与训练过程,结合PyTorch代码示例,提供全面的技术指导。 关注TechLead,复旦AI博士,分享AI领域全维度知识与研究。拥有10+年AI领域研究经验、复旦机器人智 ...

民营公司招聘流程不专业的现象与分析

博主头像 民营公司招聘流程不专业的现象与分析试用期不为员工买保险法律风险:根据劳动法规,员工在试用期也应享有社会保险等权益。公司不购买保险可能面临法律诉讼和罚款的风险。 员工福利缺失:保险是员工基本福利之一,不购买保险会降低员工对公司的归属感和满意度,影响员工留存率和工作积极性。 管理不规范:这一行为可能表明 ...

Hugging Face 论文平台 Daily Papers 功能全解析

博主头像 文/ Adeena, 在快速发展的研究领域,保持对最新进展的关注至关重要。为了帮助开发者和研究人员跟踪 AI 领域的前沿动态,Hugging Face 推出了 Daily Papers 页面。自发布以来,Daily Papers 已展示了由 AK 和社区研究人员精心挑选的高质量研究。在过去一年里,已 ...

OpenAI o1模型揭秘:通过LLMs学习推理能力

博主头像 OpenAI推出了o1,这是一种通过强化学习训练的大型语言模型,专门用于进行复杂的推理任务。o1在回答问题之前会“思考”,能够在响应用户之前生成一条长的内部思维链。 在编程竞赛问题(Codeforces)中,OpenAI o1的排名在89%分位,位列美国数学奥林匹克预选赛(AIME)前500名学生之 ...

使用LangChain4J实现Agent与Tool调用

博主头像 一些LLM除了生成文本,还可触发操作。 所有支持tools的LLMs可在此处找到(参见“Tools”栏)。 有一个被称为“工具(tools)”或“函数调用(function calling)”的概念。它允许LLM在必要时调用一或多个由开发者定义的工具。工具可以是任何东西:网页搜索、外部API调用、或 ...

大型语言模型(Large Language Models)的介绍

博主头像 背景大型语言模型(Large Language Models,简称LLMs)是一类先进的人工智能模型,它们通过深度学习技术,特别是神经网络,来理解和生成自然语言。这些模型在自然语言处理(NLP)领域中扮演着越来越重要的角色。以下是大型语言模型的一些关键特点和应用:1. 定义和工作原理定义:大型语言模 ...

123···50>