会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
alexa2077
博客园
首页
新随笔
联系
订阅
管理
2025年11月12日
大模型API调用价格
摘要: 2025年11月最佳AI大模型排行 这是一份AI大模型评测报告,提供多个行业流行的测试基准评分, 测试基准详见:Chatbot Arena 、MMLU(5-shot)、 Arena-Hard-Auto。 见大模型性能榜单表格。 1 Openai 全球领先的人工智能公司,其 GPT 系列模型具备强大的
阅读全文
posted @ 2025-11-12 23:39 不负如来不负卿x
阅读(1)
评论(0)
推荐(0)
2025年11月11日
大模型基准测试(Benchmark)调研
摘要: 与传统认为 Benchmark 仅包含评测数据集不同,大模型基准测试体系包括关键四要素:测试指标体系、测试数据集、测试方法和测试工具。指标体系定义了“测什么?”,测试方法决定“如何测?”,测试数据集确定“用什么测?”,测试工具决定“如何执行?”。 大模型基准测试(Benchmark)的目标是通过设计
阅读全文
posted @ 2025-11-11 21:43 不负如来不负卿x
阅读(14)
评论(0)
推荐(0)
2025年10月12日
开源VLM模型一览
摘要: 0 概述 **VLM可以做的任务类型** 视觉定位/物体检测(Visual grounding) 图像和视频总结(image caption) 视觉问答(visual question answering) 图像-文本对比学习 生成式任务 对齐式任务文本解析和手写文档 图像分类 语义分割 图像文本检
阅读全文
posted @ 2025-10-12 18:57 不负如来不负卿x
阅读(40)
评论(0)
推荐(0)
2025年10月10日
《Agentic Retrieval-Augmented Generation_ A Survey on Agentic RAG》论文阅读
摘要: 论文标题:Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG 文章导图: 1 Introduction LLMs 由于依赖静态的预训练数据而面临重大限制。这种依赖通常导致信息过时、虚构的回答,以及无法适应动态的现实场景。这些
阅读全文
posted @ 2025-10-10 23:44 不负如来不负卿x
阅读(12)
评论(0)
推荐(0)
2025年9月24日
RAG 实践(三)-基于Langchain的RAG demo
摘要: 通常来说基于LangChain实现一个RAG的原理如下: 加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。 核心流程包括: 数
阅读全文
posted @ 2025-09-24 23:19 不负如来不负卿x
阅读(23)
评论(0)
推荐(0)
RAG 基础知识 (一)
摘要: 1 Retrieval Augmented Generation 检索增强生成 **Why RAG?** 当我们将大模型应用于实际业务场景时会发现,通用的基础大模型基本无法满足实际业务需求,主要有以下几方面原因: 知识的局限性:大模型自身的知识完全源于训练数据,而现有的主流大模型(deepseek、
阅读全文
posted @ 2025-09-24 19:06 不负如来不负卿x
阅读(13)
评论(0)
推荐(0)
2025年9月22日
12-factor-agents
摘要: https://github.com/humanlayer/12-factor-agents 传统agent的困境: 这种方法的问题在于: 控制流不可预测:完全依赖LLM决策 错误处理困难:缺乏结构化的异常处理 状态管理混乱:执行状态与业务状态混合 可观测性差:难以调试和监控 真正优秀的Agent不
阅读全文
posted @ 2025-09-22 22:02 不负如来不负卿x
阅读(24)
评论(0)
推荐(0)
2025年9月21日
基于LangChain的Ai Agent (1)
摘要: OpenAI Functions Agent 概述 现有的大模型可以检测何时应该调用特定的函数,并应该将该函数的正确输入进行响应。在API调用中,您可以描述想要调用的函数,然后让模型智能地选择输出包含调用这些函数所需参数的JSON对象。 在LangChain中,create_openai_funct
阅读全文
posted @ 2025-09-21 22:59 不负如来不负卿x
阅读(21)
评论(0)
推荐(0)
2025年1月13日
常见半监督学习范式的优缺点:
摘要: 半监督学习是一种介于监督学习和无监督学习之间的机器学习方法,它利用大量的未标记数据和少量的标记数据来进行模型训练。以下是几种常见的半监督学习方法: 自训练(Self-training): 方法:自训练方法先使用标记数据训练一个初始模型,然后用该模型来预测未标记数据的标签。接着,将置信度较高的预测结果
阅读全文
posted @ 2025-01-13 16:44 不负如来不负卿x
阅读(12)
评论(0)
推荐(0)
2024年7月22日
Python collections模块之defaultdict()详解
摘要: collections模块常用类型有: 默认字典(defaultdict) dict的子类,可以调用提供默认值的函数 双向队列(deque) 类似于list的容器,可以快速的在队列头部和尾部添加、删除元素 计数器(Counter) dict的子类,计算可hash的对象 有序字典(OrderedDic
阅读全文
posted @ 2024-07-22 00:12 不负如来不负卿x
阅读(12)
评论(0)
推荐(0)
下一页
公告