AiFly - 博客园

2025年3月17日

摘要：这里简单通过2019年到2023年这五年的城区面积、建成区面积、城市人口密度、征用土地情况、城市规划建设用地情况几个指标简单看看海南各市县发展。海南各市县规模差别巨大，最大与最小的无论是城市规模或是人口规模都不是一个数量级，但由于海南省直辖县的特性县和地市通常也是放在一个图表中，也是可以进行比较的阅读全文

posted @ 2025-03-17 08:43 AiFly 阅读(340) 评论(0) 推荐(0)

2025年2月1日

浅看浅谈浅体验DeepSeek-R1模型

摘要： DeepSeek-V2.5的时就有听说过，直到 V3出来时开始使用已经体验了一个多月，说实话效果没那么惊艳会莫名从中文会话突然吐出英文。用的官方Web网页稍微多点，Api接口也有在使用其性价比比较高，价格性能相对于其他模型比较便宜，目前注册就送十块钱使用额度。 V3推出时就已经因为其开源、性能、低成阅读全文

posted @ 2025-02-01 17:19 AiFly 阅读(1663) 评论(0) 推荐(0)

2025年1月14日

AI Agents(智能体)是什么能做什么

摘要： Agents从去年大模型火后就开始爆发，特别是今年2025又被称为Agents元年，像是要无处不存在Agents似的。Agent是什么，直译过来就是代理，但在国内人工智能领域通常被译为智能体。从智能体这个名字可以大概想象出这个Agents可能与智能相关，此概念出现已经有相当长时间了。随着大模型的爆发阅读全文

posted @ 2025-01-14 08:40 AiFly 阅读(727) 评论(0) 推荐(0)

2024年12月24日

模型上下文协议MCP

摘要： MCP(Model Context Protocol) Anthropic推出的一种开放协议，旨在统一LLM应用于外部数据源之间的通讯协议使之无缝集成，MCP提供了标准化协议使得LLM与所需要的上下文无缝衔接。使用MCP可以插件式为LLM的集成各种外部数据源。 MCP概念上图为MCP官方所描述的M 阅读全文

posted @ 2024-12-24 08:39 AiFly 阅读(5411) 评论(1) 推荐(2)

2024年11月26日

大模型微调—海南小百科(一)

摘要：语言大模型是通过大规模数据集训练而来可以帮我们进行文本生成、内容总结，但对于一些小众知识、内部数据模型不一定知道怎么回答，这时候可能会胡言乱语。目前要想在特定领域小众知识或私密数据时模型能够表现出比较好的水平目前主要有两种方式可以实现：模型微调、外挂知识库也就是RAG模式，RAG模式之前我们有介绍过阅读全文

posted @ 2024-11-26 08:42 AiFly 阅读(272) 评论(0) 推荐(0)

2024年11月2日

海南话语音识别模型——模型训练(一)

摘要：上篇文章已经介绍了语料数据的预处理，对数据集中的音频数据分别做了重采样、静音切除、降噪以及在Fbank和MFCC中特征提取方式中选择了Fbank对音频数据进行特征提取的方法；在经过上面的处理后已经可以将提取出的音频数据Fbank丢到Transformer中进行训练，但还漏了一个比较重要的数据预处理，阅读全文

posted @ 2024-11-02 22:37 AiFly 阅读(365) 评论(0) 推荐(0)

2024年9月18日

海南话语音识别模型——数据预处理

摘要：现在很多语音助手比如小爱同学、小度等都有支持方言语音识别，开源模型也有不少中文的ASR(自动语音识别)预训练模型可做到开箱即用。方言的ASR模型比较少特别是海南话ASR模型更是没有。这几篇文章主要是基于Transformer从0开始训练一个海南话语音识别模型，当然效果可能不会特别好，这也是方言语音识阅读全文

posted @ 2024-09-18 08:40 AiFly 阅读(653) 评论(1) 推荐(0)

2024年9月3日

RAG知识库之知识库图谱应用

摘要：上篇文章介绍了使用大模型构建生成知识图谱，其实也可不用大模型用其他方式构建生成知识图谱，但RAG要结合知识图谱使用关键还是怎么把图谱的内容查询出来；简单来说可以先查出Chunk集在关联查出每个Chunk所关联的实体Entity再查询出实体之间的的关系集；这里说的RAG结合知识图谱和微软开源的Grap 阅读全文

posted @ 2024-09-03 08:42 AiFly 阅读(585) 评论(0) 推荐(0)

2024年8月12日

RAG知识库之构建知识库图谱

摘要：前面几篇文章谈了多种针对RAG的优化如多表示索引（Multi-representation indexing）、Raptor等但其都是存储在向量库中的，这里将介绍一种新的存储模式，图数据库，适合存储数据高度相关的数据。其存储实体与实体间的关系，存储着丰富的关系类型数据，能给RAG知识库带来更精准的上阅读全文

posted @ 2024-08-12 08:40 AiFly 阅读(1512) 评论(0) 推荐(0)

2024年8月5日

RAG知识库之针对长文档的Raptor索引

摘要：在现有的朴素RAG应用中其只是简单的对文档进行分块后存储的向量库中，然后在使用是根据提问问题从查询向量库中查询相识度较高的文档快作为问题上下文提交到LLM让其根据上下文去回答用户所提问的问题。对于小文本可以直接将整个文档作为上下文或使用上篇文章所提到的多表示索引（Multi-representa 阅读全文

posted @ 2024-08-05 08:39 AiFly 阅读(340) 评论(0) 推荐(0)