不负如来不负卿x

2025年11月12日

摘要： 2025年11月最佳AI大模型排行这是一份AI大模型评测报告，提供多个行业流行的测试基准评分，测试基准详见：Chatbot Arena 、MMLU(5-shot)、 Arena-Hard-Auto。见大模型性能榜单表格。 1 Openai 全球领先的人工智能公司，其 GPT 系列模型具备强大的阅读全文

posted @ 2025-11-12 23:39 不负如来不负卿x 阅读(1) 评论(0) 推荐(0)

2025年11月11日

大模型基准测试（Benchmark）调研

摘要：与传统认为 Benchmark 仅包含评测数据集不同，大模型基准测试体系包括关键四要素：测试指标体系、测试数据集、测试方法和测试工具。指标体系定义了“测什么？”，测试方法决定“如何测？”，测试数据集确定“用什么测？”，测试工具决定“如何执行？”。大模型基准测试（Benchmark）的目标是通过设计阅读全文

posted @ 2025-11-11 21:43 不负如来不负卿x 阅读(14) 评论(0) 推荐(0)

2025年10月12日

开源VLM模型一览

摘要： 0 概述 **VLM可以做的任务类型** 视觉定位/物体检测（Visual grounding）图像和视频总结（image caption）视觉问答（visual question answering）图像-文本对比学习生成式任务对齐式任务文本解析和手写文档图像分类语义分割图像文本检阅读全文

posted @ 2025-10-12 18:57 不负如来不负卿x 阅读(40) 评论(0) 推荐(0)

2025年10月10日

《Agentic Retrieval-Augmented Generation_ A Survey on Agentic RAG》论文阅读

摘要：论文标题：Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG 文章导图： 1 Introduction LLMs 由于依赖静态的预训练数据而面临重大限制。这种依赖通常导致信息过时、虚构的回答，以及无法适应动态的现实场景。这些阅读全文

posted @ 2025-10-10 23:44 不负如来不负卿x 阅读(12) 评论(0) 推荐(0)

2025年9月24日

RAG 实践（三）-基于Langchain的RAG demo

摘要：通常来说基于LangChain实现一个RAG的原理如下：加载文件 -> 读取文本 -> 文本分割 -> 文本向量化 -> 问句向量化 -> 在文本向量中匹配出与问句向量最相似的top k个 -> 匹配出的文本作为上下文和问题一起添加到prompt中 -> 提交给LLM生成回答。核心流程包括：数阅读全文

posted @ 2025-09-24 23:19 不负如来不负卿x 阅读(23) 评论(0) 推荐(0)

RAG 基础知识（一）

摘要： 1 Retrieval Augmented Generation 检索增强生成 **Why RAG？** 当我们将大模型应用于实际业务场景时会发现，通用的基础大模型基本无法满足实际业务需求，主要有以下几方面原因：知识的局限性：大模型自身的知识完全源于训练数据，而现有的主流大模型（deepseek、阅读全文

posted @ 2025-09-24 19:06 不负如来不负卿x 阅读(13) 评论(0) 推荐(0)

2025年9月22日

12-factor-agents

摘要： https://github.com/humanlayer/12-factor-agents 传统agent的困境：这种方法的问题在于：控制流不可预测：完全依赖LLM决策错误处理困难：缺乏结构化的异常处理状态管理混乱：执行状态与业务状态混合可观测性差：难以调试和监控真正优秀的Agent不阅读全文

posted @ 2025-09-22 22:02 不负如来不负卿x 阅读(24) 评论(0) 推荐(0)

2025年9月21日

基于LangChain的Ai Agent （1）

摘要： OpenAI Functions Agent 概述现有的大模型可以检测何时应该调用特定的函数,并应该将该函数的正确输入进行响应。在API调用中，您可以描述想要调用的函数，然后让模型智能地选择输出包含调用这些函数所需参数的JSON对象。在LangChain中，create_openai_funct 阅读全文

posted @ 2025-09-21 22:59 不负如来不负卿x 阅读(21) 评论(0) 推荐(0)

2025年1月13日

常见半监督学习范式的优缺点：

摘要：半监督学习是一种介于监督学习和无监督学习之间的机器学习方法，它利用大量的未标记数据和少量的标记数据来进行模型训练。以下是几种常见的半监督学习方法：自训练（Self-training）：方法：自训练方法先使用标记数据训练一个初始模型，然后用该模型来预测未标记数据的标签。接着，将置信度较高的预测结果阅读全文

posted @ 2025-01-13 16:44 不负如来不负卿x 阅读(12) 评论(0) 推荐(0)

2024年7月22日

Python collections模块之defaultdict()详解

摘要： collections模块常用类型有：默认字典（defaultdict） dict的子类，可以调用提供默认值的函数双向队列（deque）类似于list的容器，可以快速的在队列头部和尾部添加、删除元素计数器（Counter） dict的子类，计算可hash的对象有序字典（OrderedDic 阅读全文

posted @ 2024-07-22 00:12 不负如来不负卿x 阅读(12) 评论(0) 推荐(0)

alexa2077

公告