随笔分类 - MachineLearning
MachineLearning
摘要:现在无论是数码产品手机、电脑、CPU、GPU等或是大模型跑分是一个永恒不变的流程,虽然现在不少厂商针对跑分进行了专门的“优化”,但跑分目前还是相对客观评价一个硬件产品或是软件产品的手段。 不服? 来跑个分。 跑分的专业术语是评测、评估。大模型评估对通用大模型很重要,对垂直模型一样很重要,一个垂直模型
阅读全文
摘要:深度研究是各大AI平台都比较比较常见的智能体,无论是国外的OpenAI、Google或是国内的Kimi、阿里等都提供了此功能。只需要通过输入想要研究探索的主题该智能体就会自动通过网络检索、调用工具等抓取与用户关心的该主题的相关内容,然后输出该主题的报告/文章。 对于DeepResearch这种比较常
阅读全文
摘要:AI能改变什么,这或许又是一个Agent能带来巨大改变的业务逻辑,网课有多种形式常见的有如视频网课、图文网课。 网络课程从十几二十年前就开始流行,各行各业都有自己的网络课程,从中小学、职业教育、证书考试、继续教育等。但网课的制作并不容易,需要耗费大量的人力物力,视频课程还需要专门的录制设备,录制室。
阅读全文
摘要:合同审查是每个公司和个人经常会遇见的,虽然对个人来说有些合同你审查可能并没有卵用,你不得不签。大公司都会法务岗位合同审查这也是法务的主要工作之一。很多小公司并不会存在专门的法务或合作律所,合同也只是大概看下关键条款。对公司而言合同审查至关重要,一旦签了问题合同就可能会对公司带来灾难性影响。 随着大模
阅读全文
摘要:在智能体爆发的浪潮中,信息的获取与处理效率无论是对企业亦或是个人都是保持竞争力的关键。面对日益分散和爆炸式增长的信息源,常常极易使人沉迷其中,陷入碎片化消耗陷阱,时间萧然流失。本文将深度剖析一个智能体的构建的全自动 AI 资讯简报智能体,从架构设计、技术实现和应用价值三个层面,揭示如何打造一个可扩展
阅读全文
摘要:AI正改变着各行各业,从内容创作到客户服务、知识问答等AI的应用日益广泛。为了更有效的利用AI,通常需要构建智能体或其初级形式的workflow。但在目前阶段无论是智能体亦或许Workflow都无法保证其自动运行能达到100%的可靠性,根源在于大模型存在着下面的一些问题:幻觉问题、工具调用的可靠性、
阅读全文
摘要:去年底开始基于ESP32开发DIY的各种AI语音智能助手层出不穷,AI智能玩偶也比较火热。目前市面上也都有比较成熟的开发板集成了各种模块麦克风、OLED、功放、摄像头等几乎是开箱即用,普通开发者买了折腾一通总能搞点什么出来,当然对于批量推出市场的使用这种开发板成本比较高,通常比较少人这么用。 目前市
阅读全文
摘要:这里简单通过2019年到2023年这五年的城区面积、建成区面积、城市人口密度、征用土地情况、城市规划建设用地情况几个指标简单看看海南各市县发展。 海南各市县规模差别巨大,最大与最小的无论是城市规模或是人口规模都不是一个数量级,但由于海南省直辖县的特性县和地市通常也是放在一个图表中,也是可以进行比较的
阅读全文
摘要:DeepSeek-V2.5的时就有听说过,直到 V3出来时开始使用已经体验了一个多月,说实话效果没那么惊艳会莫名从中文会话突然吐出英文。用的官方Web网页稍微多点,Api接口也有在使用其性价比比较高,价格性能相对于其他模型比较便宜,目前注册就送十块钱使用额度。 V3推出时就已经因为其开源、性能、低成
阅读全文
摘要:MCP(Model Context Protocol) Anthropic推出的一种开放协议,旨在统一LLM应用于外部数据源之间的通讯协议使之无缝集成,MCP提供了标准化协议使得LLM与所需要的上下文无缝衔接。使用MCP可以插件式为LLM的集成各种外部数据源。 MCP概念 上图为MCP官方所描述的M
阅读全文
摘要:语言大模型是通过大规模数据集训练而来可以帮我们进行文本生成、内容总结,但对于一些小众知识、内部数据模型不一定知道怎么回答,这时候可能会胡言乱语。目前要想在特定领域小众知识或私密数据时模型能够表现出比较好的水平目前主要有两种方式可以实现:模型微调、外挂知识库也就是RAG模式,RAG模式之前我们有介绍过
阅读全文
摘要:现在很多语音助手比如小爱同学、小度等都有支持方言语音识别,开源模型也有不少中文的ASR(自动语音识别)预训练模型可做到开箱即用。方言的ASR模型比较少特别是海南话ASR模型更是没有。这几篇文章主要是基于Transformer从0开始训练一个海南话语音识别模型,当然效果可能不会特别好,这也是方言语音识
阅读全文
摘要:上篇文章介绍了使用大模型构建生成知识图谱,其实也可不用大模型用其他方式构建生成知识图谱,但RAG要结合知识图谱使用关键还是怎么把图谱的内容查询出来;简单来说可以先查出Chunk集在关联查出每个Chunk所关联的实体Entity再查询出实体之间的的关系集;这里说的RAG结合知识图谱和微软开源的Grap
阅读全文
摘要:在现有的朴素RAG应用中其只是简单的对文档进行分块后存储的向量库中,然后在使用是根据 提问问题 从查询向量库中查询相识度较高的文档快作为问题上下文提交到LLM让其根据上下文去回答用户所提问的问题。对于小文本可以直接将整个文档作为上下文或使用上篇文章所提到的多表示索引(Multi-representa
阅读全文
摘要:在朴素RAG中通常会对文档、文本进行分块后进行文档嵌入,对所有文件、文本都没有经过采用Chunk方法可能有时候效果不是和好,尽管有着各种分块策略有针对大文件的、针对小文件的策略,但都难免可能会造成上下文语义丢失。 分块通常有两个非常重要的参数chunk_size、chunk_overlap,分别代表
阅读全文
摘要:上篇文件介绍了RAG优化与评估的基本概念,以及使用TruLens-Eval在没有Ground-truth的情况下评估RAG应用。本篇文件主要是使用Ragas对RAG应用进行评估; 使用了Gagas生成合成测试数据集,在只有知识库文档并没有Ground-truth(真实答案)的情况下让想评估该知识库文
阅读全文
摘要:在开发基于LLM的RAG应用并准备将其上线应用时,都会比较关注RAG的性能、质量、可靠性其回答的结果准确性到底如何,甚至可以说RAG的质量可靠性其重要性要大于性能,RAG“调好了”看上去效果不错,有没有什么方法去量化度量RAG应用的质量也至关重要,下图为RAG应用度量质量指标分布图。 何为RAG 由
阅读全文
摘要:micrograd为一个自动梯度引擎,其实现了反向传播算法,用于学习理解深度学习中的自动求导原理。自动求导无论再传统的机器学习中还是深度学习或是目前非常热门的大语言模型GPT中其都是非常重要基础部分。 反向传播算法可以高效计算出神经网络中损失函数关于训练权重的梯度,使得可通过快速迭代调整权重已得到损
阅读全文
摘要:Ray一个开源的通用分布式计算框架,支持传统的并行任务并支持AI模型的分布式训练,分布式任务包括有状态与无状态任务,Ray能够快速的构建分布式系统,支持按需申请CPU或GPU;Ray提供了统一的接口提供了基于任务的并行计算与基于行动器的计算,前者通常用于无状态的任务后者用于有状态的任务;Ray为一个
阅读全文
摘要:OpenAI的Karpathy利用周末搞了一个迷你Llama2项目llama2.c用500行C语言实现无任何依赖项的推理程序,此项目在github发布以来衍生出了基于各种语言的迷你Llama推理实现llama2.go、llama2.java、llama2.py等等; 但该项目原本的模型并不支持中文,
阅读全文
浙公网安备 33010602011771号