交个朋友吧

随笔分类 -  人工智能

摘要:转载文章:大模型所需 GPU 内存笔记 引言 在运行大型模型时,不仅需要考虑计算能力,还需要关注所用内存和 GPU 的适配情况。这不仅影响 GPU 推理大型模型的能力,还决定了在训练集群中总可用的 GPU 内存,从而影响能够训练的模型规模。 大模型推理的内存计算只需考虑模型权重即可。 大模型训练的内 阅读全文
posted @ 2024-01-03 10:07 PamShao 阅读(3741) 评论(0) 推荐(1)
摘要:引言 我们知道,ChatGPT回答的数据来自于训练的数据(如现在是截止到2022年的数据),不能使用其他数据,但需要大模型根据特定的数据源来回答时问题时,该怎么办呢? 根据“大模型可以根据输入的上下文信息,针对问题生成相应的回答”,这个特性,可以将数据和问题一起输入,如下面形式: 但存在问题: 但数 阅读全文
posted @ 2023-11-30 22:04 PamShao 阅读(4291) 评论(0) 推荐(1)
摘要:学习以下文章: 揭密Transformer:大模型背后的硬核技术 人人都需要掌握的Prompt Engineering技巧 通俗解读大模型微调(Fine Tuning) 大模型时代的应用创新范式 如何理解大模型中的参数? 大模型可以看作是数据转换问题,即输入\(X\)序列,输出\(Y\)序列,其中\ 阅读全文
posted @ 2023-11-23 18:46 PamShao 阅读(2913) 评论(0) 推荐(0)
摘要:GPU发展 ​ PC时代随着图形操作系统的出现,大量需要 3D 图形运算的工具软件和游戏对于浮点运算的要求急剧升高,传统的 X86 CPU 处理器并不擅长这类任务,于是诞生了更擅长浮点运算的 GPU。在这类应用中,系统会把图形渲染等任务 offload 到 GPU 上去。 ​ 随着神经网络研究和应用 阅读全文
posted @ 2023-10-17 16:12 PamShao 阅读(280) 评论(0) 推荐(0)
摘要:转载:图灵奖得主姚期智领衔提出大模型「思维」框架!逻辑推理正确率达98%,思考方式更像人类了 前言 近日我国图灵奖得主姚期智院士团队发表首篇大语言模型论文,主要解决“让大模型像人一样思考”的问题,不仅要让大模型一步步推理,还要让它们学会“步步为营”,记住推理中间的所有正确过程。具体来说,这篇新论文提 阅读全文
posted @ 2023-10-13 10:00 PamShao 阅读(446) 评论(0) 推荐(0)
摘要:环境: 内网,以下安装均为离线安装 系统:Linux cdh12 3.10.0-1160.e17.x86_64 内存(377G)、GPU(P40-25G)*8) 安装Anaconda 参考: linux离线环境下安装anaconda anaconda python 版本对应关系 在回车接收许可时,可 阅读全文
posted @ 2023-09-26 13:26 PamShao 阅读(1104) 评论(0) 推荐(0)
摘要:转载:大模型研发核心:数据工程、自动化评估及与知识图谱的结合 本文将介绍大模型研发中数据工程,包括数据以及自动化相关的内容,并介绍在当前的情况下,知识图谱的定位以及如何融入到大模型的整个研发当中。 分享将会围绕下面四个方面展开: 大模型研发中的数据工程,起底当前一些大模型的数据构造以及360的构造方 阅读全文
posted @ 2023-09-13 22:55 PamShao 阅读(2638) 评论(0) 推荐(0)
摘要:文章学习:外滩大会 | 金智塔科技首席科学家郑小林教授出席大会探讨金融大模型落地新挑战 大模型的构建非常依赖算料、算力,对高校而言,从模型合规性、隐私保护的角度去做研究是很好的切入点。依托浙大科研团队,金智塔科技在大模型的研究中发现绝大多数的数据都分布在客户手中,比如金融机构场景建设需要用到政务数据 阅读全文
posted @ 2023-09-12 20:13 PamShao 阅读(50) 评论(0) 推荐(0)
摘要:嬗变:大语言模型带来的人工智能新纪元 | CCCF精选 盖茨说:大语言模型创新的影响力可以与20世纪60年代的微处理器、80年代的个人电脑、90年代的互联网和21世纪初的苹果手机媲美。 大模型的创新 大语言模型是人工智能领域自然语言处理的一部分。在大语言模型出现之前,自然语言处理主要依赖循环神经网络 阅读全文
posted @ 2023-08-26 12:59 PamShao 阅读(268) 评论(0) 推荐(0)
摘要:大模型材料收集 360安全大模型 推动大模型 B 端落地,360 想怎么做? 企业安全智控系统 安全问答 安全运营 通用大模型 数据安全问问题 专业知识缺乏 成本控制难 专业大模型 垂直专业性 安全合规性 使用成本 知识确权 B端:面向消费者 C端:面向商家 小米大模型 雷军:小米手机已跑通大模型, 阅读全文
posted @ 2023-08-15 09:55 PamShao 阅读(303) 评论(0) 推荐(0)
摘要:表情识别研究 学习文章:https://zhuanlan.zhihu.com/p/40572244 参考:人脸表情识别技术研究综述-2022 表情识别(FER,facialexpression recognition)是人脸识别(FR,face recognition)技术中的重要组成部分。 人脸表 阅读全文
posted @ 2022-09-10 16:17 PamShao 阅读(363) 评论(0) 推荐(0)
摘要:本文学习Jupyter的使用。(环境:Mac) Jupyter是基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和展示结果。 Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示的程序。如在 阅读全文
posted @ 2022-05-22 13:26 PamShao 阅读(433) 评论(0) 推荐(0)
摘要:本文了解下一些机器学习的常用工具。 Anconda Anaconda 是一个集成各类Python工具的集成平台(例如:conda、Python等软件包,numpy,pandas(数据分析),scipy等科学计算包),它本身不是一个开发工具,它只是将很多第三方的开发环境集成到一起。 Anaconda 阅读全文
posted @ 2022-05-22 12:51 PamShao 阅读(686) 评论(0) 推荐(0)
摘要:1、打开Anaconda Prompt 2、搭建TensorFlow的环境: conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --set show_ch 阅读全文
posted @ 2020-01-30 00:49 PamShao 阅读(7509) 评论(0) 推荐(0)
摘要:1、官方下载:https://www.anaconda.com/distribution/#download-section (最新版直接下即可) 或者国内镜像下载:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ (清华镜像源)推荐 2、 阅读全文
posted @ 2020-01-29 00:21 PamShao 阅读(741) 评论(0) 推荐(0)