AI
刷新
读天才与算法:人脑与AI的数学思维笔记03_AlphaGo

博主头像 1. 国际象棋 1.1. 1997年计算机“深蓝”(Deep Blue)击败了顶尖国际象棋手,但机器取代数学研究机构还言之尚早 1.2. 下国际象棋与数学的形式化证明颇有相似之处,但学者认为中国围棋的思维方式更能够体现数学家思考的创造性和直觉力 1.3. 国际象棋与围棋相比,则是随着棋子一个个被吃掉 ...

云主机AI服务的性能测试和优化

博主头像 在云计算的时代,越来越多的人选择将AI模型部署在云主机上,以便利用云服务提供商的弹性和可扩展性。然而,仅仅将AI模型部署到云主机上并不足以保证其性能和效率。本文将介绍云主机AI服务的性能测试和优化的具体操作过程,以帮助您充分发挥云计算平台的优势。 ...

笔记本电脑上的聊天机器人: 在英特尔 Meteor Lake 上运行 Phi-2

博主头像 对应于其强大的能力,大语言模型 (LLM) 需要强大的算力支撑,而个人计算机上很难满足这一需求。因此,我们别无选择,只能将它们部署至由本地或云端托管的性能强大的定制 AI 服务器上。 为何需要将 LLM 推理本地化 如果我们可以在典配个人计算机上运行最先进的开源 LLM 会如何?好处简直太多了: 增 ...

深度学习基本概念简介

博主头像 一、Linear Models' Bias 上篇学习机器学习一文中,所构造的 $y = b + wx_0$ 函数是一个linear model亦即线性模型,但是linear models有缺陷的——它过于简单了。实际应用中,我们所面临的不会只是一个简单的linear model,因此我们需要更复杂的 ...

RAG算法优化+新增代码仓库支持,CodeGeeX的@repo功能效果提升

CodeGeeX在升级到第三代模型时,就引入了RAG检索增强生成的能力。即模型会根据检索到的相关背景知识生成回答,大幅减轻生成内容的幻觉性。在CodeGeeX插件中,是通过侧边栏对话框中输入“@repo”触发 RAG 技术。用户可以对开源代码仓库进行提问,更准确地获得指定开源代码库相关的内容检索和生 ...

聊聊大模型的屏蔽词工程

博主头像 转载请备注出处:https://www.cnblogs.com/zhiyong-ITNote 概述 在做微调训练时,鉴于业务场景的需要,可能会存在微调数据集中含有敏感词汇,譬如:自杀、跳楼等。而开源模型可能没有做敏感词汇的屏蔽工程。因此可能就会出现不可预控的现象,而我遇到的是,当我输入敏感词汇时,模 ...

读天才与算法:人脑与AI的数学思维笔记01_洛夫莱斯测试

博主头像 1. 创造力 1.1. 创造力是一种原动力,它驱使人们产生新的、令人惊讶的、有价值的想法,并积极地将这些想法付诸实践 1.2. 创造出在表面上看似新的东西相对容易 1.3. 在遇到偶然间的创造性行为时,都会表现得异常兴奋、急迫和匆忙 1.4. 价值是相对的 1.4.1. 我写的诗或画的画,在我看来是 ...

向量数据库之Lancedb学习记录

博主头像 简介 Lancedb是一个用于人工智能的开源矢量数据库,旨在存储、管理、查询和检索大规模多模式数据的嵌入。Lancedb的核心是用Rust编写的,并构建在Lance之上,专为高性能 ML 工作负载和快速随机访问而设计。 快速开始 安装 pip install lancedb 目前0.6.8需要pya ...

Pytorch DistributedDataParallel(DDP)教程二:快速入门实践篇

博主头像 一、简要回顾DDP 在上一篇文章中,简单介绍了Pytorch分布式训练的一些基础原理和基本概念。简要回顾如下: 1,DDP采用Ring-All-Reduce架构,其核心思想为:所有的GPU设备安排在一个逻辑环中,每个GPU应该有一个左邻和一个右邻,设备从它的左邻居接收数据,并将数据汇总后发送给右邻。 ...

机器学习基本概念简介

博主头像 说明:本人正在跟随台大李宏毅老师的课程学习,为了加强学习效果,特写成blog来记录,所有博客中的图片均截取自李宏毅老师的PPT。 一、机器学习是在干什么? 以中学时代所学的函数为例,做应用题时我们都会建立相应的正比例函数、二次函数等来解决,给定一个自变量x都能得到唯一的因变量y。现在我想找到一个函数 ...

Pytorch DistributedDataParallel(DDP)教程一:快速入门理论篇

博主头像 一、 写在前面 随着深度学习技术的不断发展,模型的训练成本也越来越高。训练一个高效的通用模型,需要大量的训练数据和算力。在很多非大模型相关的常规任务上,往往也需要使用多卡来进行并行训练。在多卡训练中,最为常用的就是分布式数据并行(DistributedDataParallel, DDP)。但是现有的 ...

读所罗门的密码笔记20_更好的自己

博主头像 1. 民营部门 1.1. 障碍最大的一步,与履行协议所需要的人才和技能有关 1.2. 多样性很好,不要过分依赖任何一种资源,因为政府会出于政治原因淡化问题,不尊重科学,甚至退出协议 1.2.1. 民营部门和非政府组织的强大联盟可能在这方面发挥至关重要的作用 1.2.2. 由于不少美国商界领袖支持《巴 ...

GPT连问工具随想

近来以为,使用GPT的一个方便之处就是,问题往往是自己主动问的(不论是临时受到的刺激还是长期依赖的困惑)。 在这种条件下,主动问的东西,得到了相当量(且在一些情况下还是有质的保证的)的回应的时候,难免就会在头脑中碰撞出更多的问题。 最近在学习一些东西(虽然初级但是面较广)的时候,就时常能感觉到,问题 ...

读所罗门的密码笔记19_治理模式

博主头像 1. 解决方案 1.1. 全球人工智能的环境错综复杂,它严重依赖于价值观,且关系重大 1.2. 即使是与大家同仇敌忾的问题做斗争,也往往无法在国际社会中取得最佳效果 1.3. OPCW(禁止化学武器组织)已经帮助限制了化学武器的开发和部署,但没有协议是百分百奏效的 1.4. 如果《核不扩散条约》有完 ...

向量数据库Chroma学习记录

博主头像 一 简介 Chroma是一款AI开源向量数据库,用于快速构建基于LLM的应用,支持Python和Javascript语言。具备轻量化、快速安装等特点,可与Langchain、LlamaIndex等知名LLM框架组合使用。 二 基本用法 1 安装 安装方式非常简单,只需要一行命令 pip instak ...

读所罗门的密码笔记18_大宪章

博主头像 1. 大宪章 1.1. 1215年会议开启了一个艰难的谈判过程,充满了紧张和对权力与道德权威的争夺 1.1.1. 这部宪章会赋予各方一系列的权力,对国王的自由裁量权进行制衡 1.2. 《大宪章》还需要300多年的时间和多次迭代,才能成为财产权、公平税收、司法程序和政府最高法律的参考文件 1.3. 当 ...

<1···91011···50>