深度学习机器

2025年2月1日

摘要：模型更新简述几天前，通义千问更新了最新的多模态大模型Qwen2.5-VL，拥有包含 3B、7B 和 72B 在内的 3 个模型尺寸，同时完全开源，可在huggingface和modelscope下载到所有模型权重。 1. 更灵活的时空维度处理 ● 空间维度上，动态地将不同尺寸的图像转换为不同长度的阅读全文

posted @ 2025-02-01 11:11 深度学习机器阅读(4613) 评论(0) 推荐(0)

2025年1月28日

DeepSeek-R1：开源Top推理模型的实现细节、使用与复现

摘要：核心观点 ● 直接用强化学习就可以让模型获得显著的推理能力，说明并不一定需要SFT才行。 ● 强化学习并不一定需要复杂的奖励模型，使用简单的规则反而取得意想不到的效果。 ● 通过知识蒸馏让小模型一定程度上也有推理能力，甚至在某些场景下的表现超过了Top模型，比直接在小模型上进行强化学习更好。 Dee 阅读全文

posted @ 2025-01-28 10:42 深度学习机器阅读(4592) 评论(0) 推荐(0)

2025年1月26日

AI实现个人阅读网页插件

摘要：背景日常工作中经常需要浏览各种Github项目或者一些网页，逐字逐句看总觉得不够效率，如果在每次打开一个新的页面时就能够掌握大概的内容，然后再决定是否深入阅读就方便多了。有了这样的念头后，总想自己开发一款简单的浏览器插件，但是始终没有提上日程。目前随着AI编程工具越来越强大和普及，使用AI进行辅助阅读全文

posted @ 2025-01-26 14:38 深度学习机器阅读(293) 评论(0) 推荐(0)

2025年1月16日

热门开源Ai搜索引擎对比分析

摘要：汇总 lepton ● 项目地址：https://github.com/leptonai/search_with_lepton ● 简介：比较早期的Ai Search，由贾扬清团队项目开源，整个项目含前后端在内仅需不到500行代码。 ● 搜索引擎：支持两种默认搜索引擎：Bing和Google。 ● 阅读全文

posted @ 2025-01-16 22:43 深度学习机器阅读(2077) 评论(0) 推荐(0)

2025年1月13日

仅需一个插件让关系型数据库实现图数据存储与检索

摘要：简介 Apache AGE是一个PostgreSQL数据库的扩展插件，使得在关系型数据库中也可以使用openCypher查询语言进行图查询。有了该插件，可以在PostgreSQL数据库中同时实现关键字检索、向量检索、图检索，仅需一个数据库即可实现复杂RAG的各种存储和检索需求。安装 Docker安阅读全文

posted @ 2025-01-13 22:31 深度学习机器阅读(555) 评论(0) 推荐(0)

2024年12月30日

GitHub Copilot免费上线！快速上手指南与功能解析

摘要： GitHub Copilot在12月宣布免费订阅，不再限制学生和开源项目的维护者了，对于习惯白嫖的开发者来说无疑多了一个选择。价格和功能免费版目前可以选择Claude 3.5 Sonnet或GPT-4o模型，每月可以调用 2000 次生成和补全代码，以及 50 次聊天信息。快速开始注册一个G 阅读全文

posted @ 2024-12-30 20:18 深度学习机器阅读(547) 评论(0) 推荐(0)

2024年12月25日

LangGraph：基于图结构的大模型智能体开发框架

摘要： LangGraph 是LangChainAI开发的一个工具库，用于创建代理和多代理智能体工作流。它提供了以下核心优势：周期、可控性和持久性，对于Agent智能体开发者来说无疑减少了许多工作量。以下篇幅仅从本人角度阐述LangGraph在开发过程中的亮点以及使用方法。基本介绍 LangGraph的S 阅读全文

posted @ 2024-12-25 21:56 深度学习机器阅读(10827) 评论(0) 推荐(0)

2024年12月17日

轻量高效的知识图谱RAG系统：LightRAG

摘要： LightRAG是港大Data Lab提出一种基于知识图谱结构的RAG方案，相比GraphRAG具有更快更经济的特点。架构 1 索引阶段：对文档进行切分处理，提取其中的实体和边分别进行向量化处理，存放在向量知识库 2 检索阶段：对用于输入分别提取局部和全局关键词，分别用于检索向量知识库中的实体和边阅读全文

posted @ 2024-12-17 22:30 深度学习机器阅读(2560) 评论(0) 推荐(0)

2024年11月24日

PostgreSQL 数据库向量化的核心：pgvector

摘要： pgvector介绍 pgvector是一款开源的向量搜索引擎，除了具备所有Postgres数据库的特性外，最主要的特点是能在Postgres数据库存储和检索向量数据，支持向量的精确检索和模糊检索。向量格式除了传统embedding模型的单精度浮点数外，还支持半精度浮点数，二元向量或者稀疏向量。安阅读全文

posted @ 2024-11-24 10:11 深度学习机器阅读(3152) 评论(0) 推荐(0)

2024年11月18日

Chunkr: 在线PDF文档解析与OCR工具

摘要：介绍 1 版面分割模型这部分属于另一个项目（pdf-document-layout-analysis）的内容，可以移步查看具体模型的介绍和训练过程。 1.1 机器学习模型基于LIGHTGBM算法，并且只需要使用CPU资源，因此对硬件要求不高，速度快，但是只能处理文字类型的PDF。 1.2 VGT 阅读全文

posted @ 2024-11-18 21:55 深度学习机器阅读(425) 评论(0) 推荐(0)

deeplearningmachine

公告