感知机 基本形式 感知机是一种线性分类模型,同时也为判别模型。其形式如下: \begin{equation} f(x) = \mathrm{sign}(w \cdot x + b) \end{equation} 其中\(\mathrm{sign}\)为符号函数满足下式: \[\begin{equat ...
原作:伊格纳西奥·德格雷戈里奥 引言:语言时代的终结? 昨天,AI 领域的另一个关键参与者 Anthropic 宣布了生成式 AI 王座的新竞争者,即 Claude 的最新版本 Claude 3。 它展示了三种模型Opus、Sonnet 和 Haiku ,每种模型都适用于特定的场景,一些初步结果显示 ...
最近用到百度飞桨的 PaddleOCR,研究了一下PaddleOCR的服务化部署,简单记录一些部署过程和碰到的问题。 基础环境 paddlepaddle 2.5.2 python 3.7 paddlehub 2.1.0 PaddleOCR 2.6 pip 20 #查看 python 版本 pytho ...
基于动态规划的强化学习算法 学习「强化学习」(基于这本教材,强烈推荐)时的一些总结,在此记录一下。 在马尔可夫决策过程 环境模型已知(也就是状态转移函数P、奖励函数r已知)的情况下,我们可以通过 「动态规划」 求得马尔可夫决策过程的最优策略 \(\pi^*\) 。 1. 动态规划 对于做过算法题目的 ...
背景 Mixup(混合) 定义 对于一个样本\((x_i,y_i)\),将其与另一个样本\((x_j,y_j)\)混合: \[\begin{aligned} \tilde{x}_i &= \lambda x_i + (1-\lambda)x_j, \\ \tilde{y}_i &= \lambda ...
本文分享自华为云社区《爆圈Sora横空出世,AGI通用人工智能时代真的要来了吗?一键Run带你体验扩散模型的魅力!》,作者: 码上开花_Lancer。 Sora这几天的爆炸性新闻,让所有人工智能相关从业者及对应用感兴趣的人群都感到沸腾,震撼到央视也在进行相关的讨论,简直可以和2023年初ChatGP ...
国内外AI大模型层出不穷,训练数据复杂程度更是呈指数级增加。如今,在万亿级参数时代,单个资源池已无法满足大模型训练场景中动辄PB级的数据存储量,对于企业来说,启用多个资源池构成的分布式存储势在必行。 ...
FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力,它背后依赖OneApi开源项目来访问各种大语言模型提供的能力。各大语言模型提供的访问接口规范不尽相同,为此OneApi项目提供了统一的API接口去对接各种大语言模型。FastGPT的部署架构如图所 ...
基于SWIFT和Qwen1.5-14B-Chat进行大模型LoRA微调测试 环境准备 基础环境 操作系统:Ubuntu 18.04.5 LTS (GNU/Linux 3.10.0-1127.el7.x86_64 x86_64) Anaconda3:Anaconda3-2023.03-1-Linux- ...
1. 基本信息 人工不智能:计算机如何误解世界笔记 Artificial Unintelligence: How Computers Misunderstand the World [美]梅瑞狄斯·布鲁萨德 著 著 中信出版社,2021年5月出版 1.1. 读薄率 书籍总字数218千字,笔记总字数2 ...
Sealos 经过 23 年一年的迭代,获得了用户的广泛好评,注册用户已破十万,应用数量也突破一万,24 年的工作重心会放在价格上,在我们不死掉的情况下尽可能为用户谋福利! 好消息是 Sealos 与各大云厂商深度合作,加上 Sealos 本身的多租户云版拼多多的业务模式,终于能把价格打下来了! 本 ...
RAG实战3-如何追踪哪些文档片段被用于检索增强生成 本文是RAG实战2-如何使用LlamaIndex存储和读取embedding向量的续集,在阅读本文之前请先阅读前篇。 在前篇中,我们介绍了如何使用LlamaIndex存储和读取embedding向量。在本文中,我们将介绍在LlamaIndex中如 ...
LLAMA介绍 LLaMA是由Facebook的母公司Meta AI设计的一个新的大型语言模型。LLaMA拥有70亿到650亿个参数的模型集合,是目前最全面的语言模型之一。 Llama是目前唯一一个可以进行本地部署和本地训练的大型模型,对各种提问有非常好的处理能力。非常适合个人和中小型企业,构建自己 ...
RAG实战2-如何使用LlamaIndex存储和读取embedding向量 本文是检索增强生成(Retrieval-augmented Generation,RAG)实战1-基于LlamaIndex构建第一个RAG应用的续集,在阅读本文之前请先阅读前篇。 在前篇中,我们介绍了如何使用LlamaInd ...
部门缺人,前端后端测试岗,base深圳/西安/北京:jinshuju.net/f/o38ijj 前一段时间,国外一位小哥哥在推特上发布了一条消息,声称GPT-4拯救了自家狗狗的性命。 这是怎么一回事呢? 这个小哥哥养了一只两岁的边境牧羊犬,这只牧羊犬被诊断出患有蜱传疾病,这属于一种细菌性传染病。 虽 ...
基于SWIFT和Qwen1.5-14B-Chat进行大模型全参微调测试 环境准备 基础环境 操作系统:Ubuntu 18.04.5 LTS (GNU/Linux 3.10.0-1127.el7.x86_64 x86_64) Anaconda3:Anaconda3-2023.03-1-Linux-x8 ...
Gemini介绍;Gemini与ChatGPT-4对比;Gemini与ChatGPT-4问题互答 1. 画图能力目前Gemini不具备,GPT-4游刃有余略胜一筹 2. 初中数学题解答情况半斤八两,不相上下 3. 解释成语,Gemini能根据成语联想故事,GPT-4中规中矩,Gemini略胜一... ...
不用AI的程序员,失业潮真的快来临了。 一张订单履约的流程图,我花了10分钟才完成,而ChatGPT绘图过程只用了10秒钟,基本可以达到同样的水平,通过ChatGPT可以显著提高画流程图的效率。 订单履约流程是一系列精细协作的流程,从客户在销售平台下单开始,至商品交付用户手中结束。此过程跨越多个环节 ...
马尔可夫决策过程 个人在学习「马尔可夫过程」时(基于这本教材,强烈推荐),做了些总结,并将遇到了一些感到困惑自我解答了,在此整理并记录一下。 1. 马尔可夫性质 简单的一句话:当前状态 只取决于上一时刻 的状态。这个视频很生动地解释了这一性质。 2. 马尔可夫过程 「马尔可夫过程」也叫「马尔可夫链」 ...
1. 加载数据集 MNIST from torchvision import datasets, transforms transform = transforms.Compose([ transforms.ToTensor(), # value of pixel: [0, 255] -> [0, ...