阿里开源的32B大模型到底强在哪里?

博主头像 阿里巴巴最近开源了一个320亿参数的大语言模型Qwen1.5-32B,网上都说很强很强,那么它到底强在哪里呢? 更高的性价比 Qwen1.5-32B中的B是billion的意思,也就是10亿,32B就代表320亿参数量。 阿里之前还开源过一个大模型Qwen-1.5-72B,72B就代表720亿参数量 ...

Quanto: PyTorch 量化工具包

博主头像 量化技术通过用低精度数据类型 (如 8 位整型 (int8)) 来表示深度学习模型的权重和激活,以减少传统深度学习模型使用 32 位浮点 (float32) 表示权重和激活所带来的计算和内存开销。 减少位宽意味着模型的内存占用更低,这对在消费设备上部署大语言模型至关重要。量化技术也使得我们可以针对较 ...

BiLSTM算法(一)

博主头像 原理分析: BiLSTM(双向长短期记忆网络) 是一种循环神经网络(RNN)的变体,它在自然语言处理任务中非常有效,其中包括给定一个长句子预测下一个单词。 这种效果的主要原因包括以下几点: 长短期记忆网络(LSTM)结构:LSTM 是一种特殊的 RNN,专门设计用于解决长序列依赖问题。相比于普通的 ...

《痞子衡嵌入式半月刊》 第 97 期

博主头像 痞子衡嵌入式半月刊: 第 97 期 这里分享嵌入式领域有用有趣的项目/工具以及一些热点新闻,农历年分二十四节气,希望在每个交节之日准时发布一期。 本期刊是开源项目(GitHub: JayHeng/pzh-mcu-bi-weekly),欢迎提交 issue,投稿或推荐你知道的嵌入式那些事儿。 上期回顾 ...

你真会判断DataGuard的延迟吗?

博主头像 这是一个比较细节的知识点,但必须要理解这个才能准确判断Oracle ADG的延迟情况。 以前做运维工作时,记得是要同时重点关注v$dataguard_stats视图中的几个字段的值,分别是:NAME、VALUE、TIME_COMPUTED、DATUM_TIME。 本文先不考虑v$dataguard_ ...

consul:啥?我被优化没了?AgileConfig+Yarp替代Ocelot+Consul实现服务发现和自动网关配置

博主头像 现在软件就业环境不景气,各行各业都忙着裁员优化。作为一个小开发,咱也不能光等着别人来优化咱,也得想办法优化下自己。就拿手头上的工作来说吧,我发现我的微服务应用里,既有AgileConfig这个配置中心组件,又有一个Consul 服务发现组件。本来吧他俩也没啥事,各干个的。但是,我在操作AgileCo ...

学习 XSLT:XML文档转换的关键

博主头像 XSL(eXtensible Stylesheet Language)是一种用于 XML 的样式语言。 XSL(T) 语言 XSLT 是一种用于转换 XML 文档的语言。 XPath 是一种用于在 XML 文档中导航的语言。 XQuery 是一种用于查询 XML 文档的语言。 它始于 XSL XSL ...

通过termux tailscale huggingface 来手把手一步一步在手机上部署LLAMA2-7b和LLAMA2-70b大模型

博主头像 前言 首先截图一下我的小米手机的配置 我这个配置其实一般,当时主要为了存储空间大,而我对配置要求又不高,买的。 在手机上安装termux app,然后在termux上就可以使用各种命令进行安装和使用,就像在linux操作系统上一样了。 再通过termux安装上openssh,这样你就可以在windo ...

Web Audio API 第4章 音调与频域

博主头像 音调与频域 此章中如果对音乐部分不感兴趣,可忽略 代码部分也没有更多的新 api ,重要的还是相关的物理与声音的相关知识 到目前为止我们已经学过了声音的基础属性:定时与音量。为了能处理更复杂的的情况,例如声音的均衡(比如,增加低音和降低高音),我们需要更复杂的工具。此章节将介绍一些用于更有趣的转换工 ...

决策树模型(4)Cart算法

博主头像 Cart算法 Cart是Classification and regression tree的缩写,即分类回归树。它和前面的ID3, C4.5等算法思想一致都是通过对输入空间进行递归划分并确定每个单元上预测的概率分布,进而进行回归和分类任务。只不过由于任务的不同, 所以回归树和分类树的划分准则并不相 ...

Rome反序列化链分析

博主头像 环境搭建 <dependencies> <dependency> <groupId>junit</groupId> <artifactId>junit</artifactId> <version>4.11</version> <scope>test</scope> </dependency> <de ...

C#使用PaddleOCR进行图片文字识别✨

博主头像 PaddlePaddle介绍✨ PaddlePaddle(飞桨)是百度开发的深度学习平台,旨在为开发者提供全面、灵活的工具集,用于构建、训练和部署各种深度学习模型。它具有开放源代码、高度灵活性、可扩展性和分布式训练等特点。PaddlePaddle支持端到端的部署,可以将模型轻松应用于服务器、移动设备 ...

MindSpore自动微分小技巧

博主头像 不同于符号微分和手动微分,基于链式法则的自动微分不仅有极高的速度,还不需要去手动推导微分,在深度学习领域有非常广泛的应用。本文主要通过几个案例,分别介绍了一下在MindSpore深度学习框架中,如何使用grad函数和GradOperation类,分别对函数和类进行自动微分计算。 ...

模拟SQLserver死锁现象

博主头像 SQL Server死锁是指两个或多个事务相互等待对方持有的资源而无法继续执行的情况。当两个或多个事务都持有一些资源并且试图获取其他事务持有的资源时,可能会发生死锁。这种情况下,每个事务都在等待另一个事务释放其所需的资源,导致所有涉及的事务都无法继续执行,形成了死锁。 死锁通常涉及数据库中的多个表或 ...

爬虫记录——第三方钱包加密参数逆向

新的抢单模式,导致曾经实现简单地对平台商品进行锁单的功能,不再满足对平台商品进行抢购的要求,需要实现下单后的余额支付功能。1):获取支付链接(得到请求参数uuid与mer_cust_id)。 2):确定所需请求。3):逆向请求中的加密参数。 ...

鸿蒙HarmonyOS实战-ArkUI组件(Video)

博主头像 一、Video 视频组件是用于应用程序中嵌入视频的一种方法。它可以让用户在网站上观看视频并与其进行交互。通常,视频组件将一个视频文件嵌入应用程序中,并提供一组控件,这些控件允许用户播放、暂停、跳过、音量调整和全屏等。通过使用视频组件,开发者可以更容易地将视频嵌入应用程序,使其更易于管理和控制。 ...

<1···151617···100>