人工智能 - 随笔分类(第3页) - PamShao

UltraRAG 框架全家桶

摘要：转载：清华等团队推出 UltraRAG 框架全家桶，让大模型读懂善用知识库！引言 RAG 系统的搭建与优化是一项庞大且复杂的系统工程，通常需要兼顾测试制定、检索调优、模型调优等关键环节，繁琐的工作流程往往让人无从下手。近日，针对以上痛点，清华大学 THUNLP 团队联合东北大学 NEUIR 、面阅读全文

posted @ 2025-02-27 23:18 PamShao 阅读(231) 评论(0) 推荐(0)

如何构建多模态AI知识库？

摘要：转载：如何构建多模态AI知识库？摘要在科技飞速发展的当下，人工智能（AI）已成为推动各行业变革的关键力量。其中，多模态 AI 知识库作为 AI 领域的重要创新，正引领我们迈向一个全新的智能时代。它打破了传统数据处理的单一模式，融合文本、图像、音频、视频等多种数据模态，为我们提供了更加全面、深入的阅读全文

posted @ 2025-02-27 22:58 PamShao 阅读(949) 评论(0) 推荐(0)

人工智能高质量数据集现状

摘要：转载：加快建设人工智能高质量数据集一、国家重视人工智能发展当前人工智能处在快速发展的关键时期，正在重塑经济社会发展模式。2024年中央经济工作会议指出，开展“人工智能+“行动，培育未来产业。二、数据是人工智能的核心数据作为人工智能发展的三大核心要素之一，是人工智能模型训练的基础要素，也是人工阅读全文

posted @ 2025-02-11 21:20 PamShao 阅读(238) 评论(0) 推荐(0)

基于MPC的快速transformer安全推理框架

摘要：论文：一种基于安全多方计算的快速Transformer安全推理方案-刘伟欣摘要数据隐私泄露问题：当前Transformer推理应用中用户的数据会被泄露给模型提供方安全推理方法：基于MPC实现Transformer模型的安全推理问题：巨大的计算和通信开销文本贡献：一是针对开销比较的Softm 阅读全文

posted @ 2025-01-19 15:07 PamShao 阅读(725) 评论(0) 推荐(2)

面向法律领域的大模型微调与应用

摘要：来源：论文摘要这篇论文探讨了如何通过微调大型语言模型来实现法律领域的智能化服务。作者指出，以往的智慧法律系统需要为每个特定的任务设计专门的算法或模型，面临着研发成本高、集成难度大的困难。而现在，通过微调大型语言模型，可以同时处理多种法律任务，从而提高法律从业者的效率和准确性。此外，作者还介绍了一阅读全文

posted @ 2024-10-10 20:19 PamShao 阅读(730) 评论(0) 推荐(0)

机器学习在网安中的应用

摘要：参考： https://denizhalil.com/2023/12/28/machine-learning-cybersecurity-intersection/ https://denizhalil.com/2024/02/19/machine-learning-cybersecurity-ne 阅读全文

posted @ 2024-10-09 13:55 PamShao 阅读(240) 评论(0) 推荐(0)

人工智能生成合成内容标识办法(征求意见稿)发布

摘要：当前国家发布的关于人工智能生成合成内容标识的法律法规有：《中华人民共和国网络安全法》、《互联网信息服务算法推荐管理规定》、《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂定办法》等。征求意见稿 2024年9月14日，国家网信办发布关于《人工智能生成合成内容标识办法(征求意见稿)》公阅读全文

posted @ 2024-09-17 17:08 PamShao 阅读(96) 评论(0) 推荐(0)

非结构化文档解析

摘要：参考：RAG效果优化：高质量文档解析详解知识库 RAG的核心之一就是知识库的离线存储，如何将非结构化文档存储是非常重要的。 PDF和Word文件结构 word文件解析 pdf文件解析 Papermage介绍总结阿里云上的文件解析方法示例准确率参考阅读全文

posted @ 2024-08-29 11:12 PamShao 阅读(159) 评论(0) 推荐(0)

大语言模型（LLMs）隐私保护技术综述学习

摘要：链接：https://mp.weixin.qq.com/s/PCVHPxCwuciTR2BQCsAl4Q 原文：https://arxiv.org/abs/2408.05212 阅读全文

posted @ 2024-08-16 14:59 PamShao 阅读(191) 评论(0) 推荐(0)

了解GraphRAG

摘要：了解GraphRAG 转载：从零实现大模型-GraphRAG，构建LLM中的关系数据库开源地址：https://github.com/microsoft/graphrag 论文：From Local to Global: A Graph RAG Approach to Query-Focused 阅读全文

posted @ 2024-07-30 23:43 PamShao 阅读(778) 评论(0) 推荐(0)

学习-生成式大模型隐私保护技术

摘要：转载：【极简综述第二期08】生成式大模型隐私保护技术作者：中山大学的操晓春教授和中科院信工所的李京知副教授引言生成式大模型的出现催生了各个领域的技术创新和应用变革，对大众的生活、工作和互动方式产生了深远的影响。例如，近两年备受瞩目的ChatGPT [1]和SORA [2]，ChatGPT在人阅读全文

posted @ 2024-07-30 23:16 PamShao 阅读(1425) 评论(0) 推荐(0)

使用Ollama

摘要：推荐 Ollama 本地运行大模型(LLM)完全指南 Ollama中文学习应用查看可支持的模型：https://ollama.com/library 查看运行中的模型 ollama ps 停止模型方法1: kill -9 端口号方法2: 关闭ollama的窗口 API调用模型启动模型单次阅读全文

posted @ 2024-07-25 22:41 PamShao 阅读(1551) 评论(0) 推荐(0)

大模型显存计算

摘要：大模型微调需要多少GPU显存？如：微调 1B 模型，16bit = 2byte 全量微调显存占用分为： model weight（参数本身）：10亿（bit） = 20亿（byte）约等于2GB 训练模型时，通过一系列反向传播的方法，来更新模型参数，涉及以下gradient和optimizer 阅读全文

posted @ 2024-06-21 00:11 PamShao 阅读(3254) 评论(0) 推荐(0)

大模型安全概述

摘要：转载：大模型与安全专题引言 2022年底以来，以ChatGPT为代表的大模型飞速发展，正在成为#驱动新质生产力发展#的新动能、人类探索未知的新工具. 在显著提升人工智能(artificial intelligence, AI)模型通用理解和生成能力的同时，也带来了前所未有的安全风险. 大模型的能阅读全文

posted @ 2024-06-12 00:03 PamShao 阅读(1804) 评论(0) 推荐(0)

了解显卡

摘要：从零开始认识显卡硬件 ROG Strix RTX 4080为例：供电接口：8pin接口，单个提供225w供电，高功耗可使用多个该4080提供6个供电接口：还有背插显卡，无需外接供电，需搭载特定主板和转接头使用：散热模组由：风扇、鳍片、热管、均热板组成热管利用汽热转换传递热阅读全文

posted @ 2024-05-19 11:16 PamShao 阅读(205) 评论(0) 推荐(0)

langchain-知识库问答

摘要：本地接入百川 langchain调用参考：https://github.com/datawhalechina/self-llm/blob/master/BaiChuan/03-Baichuan2-7B-chat接入LangChain框架.md 需从LangChain.llms.base.LLM 阅读全文

posted @ 2024-04-02 10:54 PamShao 阅读(3868) 评论(5) 推荐(0)

langchain-agent

摘要：Agent 参考：LangChain 实战：Agent思维大模型是被训练出来的，知识是有时间限制的，所以当进行问答时，可以结合本地知识库和调用搜索或在线API来增强自身能力，这些不属于大模型的内部数据，成为外部工具。 LangChain提供了Agent（代理）模块，大模型以此可以调用外部工具。 A 阅读全文

posted @ 2024-03-03 17:12 PamShao 阅读(1146) 评论(2) 推荐(0)

测试【子牙-writing】大模型

摘要：参考：姜子牙大模型系列 | 写作模型ziya-writing开源！开箱即用，快来认领专属你的写作小助手吧封神榜：https://github.com/IDEA-CCNL/Fengshenbang-LM 姜子牙大模型：https://huggingface.co/IDEA-CCNL/Ziya-LLa 阅读全文

posted @ 2024-01-18 09:38 PamShao 阅读(608) 评论(0) 推荐(0)

Transformer 原理图解

摘要：转载：小白看得懂的 Transformer (图解) 引言谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果，引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。谷歌的Transformer模型最早是用于机器翻译任务，当时达到了SOTA效果。 Trans 阅读全文

posted @ 2024-01-16 14:11 PamShao 阅读(4959) 评论(0) 推荐(1)

大模型安全｜绿盟

摘要：转载：大模型正在“记住”与“说出” 引言「大模型」引领的创新变革正在发生身处技术爆炸时代，高光与隐忧共存。安全风险已成为发展中无法忽视的话题。 LLM在使用过程中包含敏感机密的数据或信息，可能会导致未授权的数据访问、隐私侵犯、安全漏洞等风险，随之造成敏感信息泄露。 2023年8月，全球开放应用软件阅读全文

posted @ 2024-01-06 20:10 PamShao 阅读(524) 评论(0) 推荐(0)

Pam

Hang Shao

随笔分类 - 人工智能

公告