随笔分类 -  AI智能

摘要:项目介绍 Dify一键离线安装包,集成安装了全部插件、模板,并集成了dify全部插件所需的依赖组件。方便你在内网、安可环境等离线状态下使用。 Dify是一个开源的LLM应用开发平台。其直观的界面结合了AI工作流、RAG管道、Agent、模型管理、可观测性功能等,让您可以快速从原型到生产。 当前对应D 阅读全文
posted @ 2025-07-13 14:21 邓草 阅读(2737) 评论(5) 推荐(3)
摘要:rag的时候,Embedding如何选,一般情况都是能力+成本的综合评估,我一般选择,看排行榜(重点关注的哪项能力),然后再看部署成本。一般看mteb的评估即可。https://huggingface.co/spaces/mteb/leaderboard MTEB 评估(Massive Text E 阅读全文
posted @ 2025-06-10 09:30 邓草 阅读(1586) 评论(0) 推荐(0)
摘要:​ 昨天阿里开源家族迎来两个新成员——Qwen3-Embedding和Qwen3-Reranker,专为文本表征、检索和排序任务设计,都基于Qwen3模型构建。 看了测评,Qwen3-Embedding-8B目前是 MTEB 多语言排行榜榜首,我最期待的是Qwen3-Embedding-0.6B,模 阅读全文
posted @ 2025-06-08 14:53 邓草 阅读(3320) 评论(0) 推荐(0)
摘要:第一步,安装Ollama。打开官网下载:https://ollama.com/download 可以选择Download for Windows来下载。然后双击OllamaSetup.exe按提示安装完成。 第二步,打开Windows PowerShell,或者CMD命令。 如下载Qwen3-Emb 阅读全文
posted @ 2025-06-08 14:40 邓草 阅读(5445) 评论(0) 推荐(0)
摘要:Qwen3 Embedding 是基于 Qwen3 基础模型训练的文本嵌入模型系列,能够将离散的、高维的符号(如文字、图片、声音等)转化为低维、连续的数字向量(Vector)的转化技术。通过捕捉不同数据点在嵌入空间中的距离远近,它能挖掘出它们之间隐藏的语义关系。 这样,模型就可以在不真正“理解”语言 阅读全文
posted @ 2025-06-08 14:32 邓草 阅读(3651) 评论(0) 推荐(1)
摘要:​现在做大模型,还有靠谱且免费的 API 接口吗? 靠谱的不免费,免费的不靠谱,鱼和熊掌不可兼得? 非也! 对于简单的指令而言,绝大部分免费的 LLM API 还是能打的,本文就给大家介绍几款,猴哥亲测好用的免费的 API 接口! 免费 LLM API 汇总(持续更新中) 大模型 免费版本 免费限制 阅读全文
posted @ 2024-10-11 13:42 邓草 阅读(5808) 评论(0) 推荐(0)