交个朋友吧

随笔分类 -  人工智能

摘要:转载:清华等团队推出 UltraRAG 框架全家桶,让大模型读懂善用知识库! 引言 RAG 系统的搭建与优化是一项庞大且复杂的系统工程,通常需要兼顾测试制定、检索调优、模型调优等关键环节,繁琐的工作流程往往让人无从下手。 近日,针对以上痛点,清华大学 THUNLP 团队联合东北大学 NEUIR 、面 阅读全文
posted @ 2025-02-27 23:18 PamShao 阅读(231) 评论(0) 推荐(0)
摘要:转载:如何构建多模态AI知识库? 摘要 在科技飞速发展的当下,人工智能(AI)已成为推动各行业变革的关键力量。其中,多模态 AI 知识库作为 AI 领域的重要创新,正引领我们迈向一个全新的智能时代。它打破了传统数据处理的单一模式,融合文本、图像、音频、视频等多种数据模态,为我们提供了更加全面、深入的 阅读全文
posted @ 2025-02-27 22:58 PamShao 阅读(949) 评论(0) 推荐(0)
摘要:转载:加快建设人工智能高质量数据集 一、国家重视人工智能发展 当前人工智能处在快速发展的关键时期,正在重塑经济社会发展模式。2024年中央经济工作会议指出,开展“人工智能+“行动,培育未来产业。 二、数据是人工智能的核心 数据作为人工智能发展的三大核心要素之一,是人工智能模型训练的基础要素,也是人工 阅读全文
posted @ 2025-02-11 21:20 PamShao 阅读(238) 评论(0) 推荐(0)
摘要:论文:一种基于安全多方计算的快速Transformer安全推理方案-刘伟欣 摘要 数据隐私泄露问题:当前Transformer推理应用中用户的数据会被泄露给模型提供方 安全推理方法:基于MPC实现Transformer模型的安全推理 问题:巨大的计算和通信开销 文本贡献:一是针对开销比较的Softm 阅读全文
posted @ 2025-01-19 15:07 PamShao 阅读(725) 评论(0) 推荐(2)
摘要:来源:论文 摘要 这篇论文探讨了如何通过微调大型语言模型来实现法律领域的智能化服务。作者指出,以往的智慧法律系统需要为每个特定的任务设计专门的算法或模型,面临着研发成本高、集成难度大的困难。而现在,通过微调大型语言模型,可以同时处理多种法律任务,从而提高法律从业者的效率和准确性。此外,作者还介绍了一 阅读全文
posted @ 2024-10-10 20:19 PamShao 阅读(730) 评论(0) 推荐(0)
摘要:参考: https://denizhalil.com/2023/12/28/machine-learning-cybersecurity-intersection/ https://denizhalil.com/2024/02/19/machine-learning-cybersecurity-ne 阅读全文
posted @ 2024-10-09 13:55 PamShao 阅读(240) 评论(0) 推荐(0)
摘要:当前国家发布的关于人工智能生成合成内容标识的法律法规有:《中华人民共和国网络安全法》、《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂定办法》等。 征求意见稿 2024年9月14日,国家网信办发布关于《人工智能生成合成内容标识办法(征求 意见稿)》公 阅读全文
posted @ 2024-09-17 17:08 PamShao 阅读(96) 评论(0) 推荐(0)
摘要:参考:RAG效果优化:高质量文档解析详解 知识库 RAG的核心之一就是知识库的离线存储,如何将非结构化文档存储是非常重要的。 PDF和Word文件结构 word文件解析 pdf文件解析 Papermage介绍 总结 阿里云上的文件解析方法 示例 准确率 参考 阅读全文
posted @ 2024-08-29 11:12 PamShao 阅读(159) 评论(0) 推荐(0)
摘要:链接:https://mp.weixin.qq.com/s/PCVHPxCwuciTR2BQCsAl4Q 原文:https://arxiv.org/abs/2408.05212 阅读全文
posted @ 2024-08-16 14:59 PamShao 阅读(191) 评论(0) 推荐(0)
摘要:了解GraphRAG 转载:从零实现大模型-GraphRAG,构建LLM中的关系数据库 开源地址:https://github.com/microsoft/graphrag 论文:From Local to Global: A Graph RAG Approach to Query-Focused 阅读全文
posted @ 2024-07-30 23:43 PamShao 阅读(778) 评论(0) 推荐(0)
摘要:转载:【极简综述第二期08】生成式大模型隐私保护技术 作者: 中山大学的操晓春教授和中科院信工所的李京知副教授 引言 生成式大模型的出现催生了各个领域的技术创新和应用变革,对大众的生活、工作和互动方式产生了深远的影响。例如,近两年备受瞩目的ChatGPT [1]和SORA [2],ChatGPT在人 阅读全文
posted @ 2024-07-30 23:16 PamShao 阅读(1425) 评论(0) 推荐(0)
摘要:推荐 Ollama 本地运行大模型(LLM)完全指南 Ollama中文学习 应用 查看可支持的模型:https://ollama.com/library 查看运行中的模型 ollama ps 停止模型 方法1: kill -9 端口号 方法2: 关闭ollama的窗口 API调用模型 启动模型 单次 阅读全文
posted @ 2024-07-25 22:41 PamShao 阅读(1551) 评论(0) 推荐(0)
摘要:大模型微调需要多少GPU显存? 如:微调 1B 模型,16bit = 2byte 全量微调 显存占用分为: model weight(参数本身):10亿(bit) = 20亿(byte)约等于2GB 训练模型时,通过一系列反向传播的方法,来更新模型参数,涉及以下gradient​和optimizer 阅读全文
posted @ 2024-06-21 00:11 PamShao 阅读(3254) 评论(0) 推荐(0)
摘要:转载:大模型与安全专题 引言 2022年底以来,以ChatGPT为代表的大模型飞速发展,正在成为#驱动新质生产力发展#​的新动能、人类探索未知的新工具. 在显著提升人工智能(artificial intelligence, AI)模型通用理解和生成能力的同时,也带来了前所未有的安全风险. 大模型的能 阅读全文
posted @ 2024-06-12 00:03 PamShao 阅读(1804) 评论(0) 推荐(0)
摘要:从零开始认识显卡 硬件 ROG Strix RTX 4080为例: 供电接口:8pin接口,单个提供225w供电,高功耗可使用多个 ​ 该4080提供6个供电接口: ​ 还有背插显卡,无需外接供电,需搭载特定主板和转接头使用: ​ 散热模组由:风扇、鳍片、热管、均热板组成 ​ 热管利用汽热转换传递热 阅读全文
posted @ 2024-05-19 11:16 PamShao 阅读(205) 评论(0) 推荐(0)
摘要:本地接入 百川 langchain调用 参考:https://github.com/datawhalechina/self-llm/blob/master/BaiChuan/03-Baichuan2-7B-chat接入LangChain框架.md 需从LangChain.llms.base.LLM 阅读全文
posted @ 2024-04-02 10:54 PamShao 阅读(3868) 评论(5) 推荐(0)
摘要:Agent 参考:LangChain 实战:Agent思维 大模型是被训练出来的,知识是有时间限制的,所以当进行问答时,可以结合本地知识库和调用搜索或在线API来增强自身能力,这些不属于大模型的内部数据,成为外部工具。 LangChain提供了Agent(代理)模块,大模型以此可以调用外部工具。 A 阅读全文
posted @ 2024-03-03 17:12 PamShao 阅读(1146) 评论(2) 推荐(0)
摘要:参考:姜子牙大模型系列 | 写作模型ziya-writing开源!开箱即用,快来认领专属你的写作小助手吧 封神榜:https://github.com/IDEA-CCNL/Fengshenbang-LM 姜子牙大模型:https://huggingface.co/IDEA-CCNL/Ziya-LLa 阅读全文
posted @ 2024-01-18 09:38 PamShao 阅读(608) 评论(0) 推荐(0)
摘要:转载:小白看得懂的 Transformer (图解) 引言 谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果,引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。谷歌的Transformer模型最早是用于机器翻译任务,当时达到了SOTA效果。 Trans 阅读全文
posted @ 2024-01-16 14:11 PamShao 阅读(4959) 评论(0) 推荐(1)
摘要:转载:大模型正在“记住”与“说出” 引言 「大模型」引领的创新变革正在发生身处技术爆炸时代,高光与隐忧共存。安全风险已成为发展中无法忽视的话题。 LLM在使用过程中包含敏感机密的数据或信息,可能会导致未授权的数据访问、隐私侵犯、安全漏洞等风险,随之造成敏感信息泄露。 2023年8月,全球开放应用软件 阅读全文
posted @ 2024-01-06 20:10 PamShao 阅读(524) 评论(0) 推荐(0)