会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
61
62
63
64
65
66
67
68
69
···
139
下一页
2023年12月23日
论文推荐:大型语言模型能自我解释吗?
摘要: 这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法,一种是做出预测,然后解释它,另一种是产生解释,然后用它来做出预测。 最近的研究发现,即使LLM是在特定数据上训练的,也不能认识到训练的知识与推理上下文之间的联系。 因此一些人认为之为“X链”的方法非常重要。因为要求LLM
阅读全文
posted @ 2023-12-23 10:27 deephub
阅读(18)
评论(0)
推荐(0)
2023年12月22日
神经网络可视化新工具:TorchExplorer
摘要: TorchExplorer是一个交互式探索神经网络的可视化工具,他的主要功能如下: TorchExplorer是一款创新的人工智能工具,专为使用非常规神经网络架构的研究人员设计。可以在本地或者wandb中生成交互式Vega自定义图表,提供网络结构的模块级可视化。在左边的面板可以模块级方式展现神经网络
阅读全文
posted @ 2023-12-22 10:06 deephub
阅读(105)
评论(0)
推荐(0)
2023年12月21日
MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试
摘要: 如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。 最近在PyTorch 1.12中引入MPS后端已经是一个大胆的步骤,但随着MLX的宣布,苹果还想在开源深度学习方面有更大的发展。 在本文中,
阅读全文
posted @ 2023-12-21 10:07 deephub
阅读(294)
评论(0)
推荐(0)
2023年12月20日
高维向量压缩方法IVFPQ :通过创建索引加速矢量搜索
摘要: 向量相似性搜索是从特定嵌入空间中的给定向量列表中找到相似的向量。它能有效地从大型数据集中检索相关信息,在各个领域和应用中发挥着至关重要的作用。 向量相似性搜索需要大量的内存资源来实现高效搜索,特别是在处理密集的向量数据集时。而压缩的主要作用是压缩高维向量来优化内存存储。 IVFPQ 是一种用于数据检
阅读全文
posted @ 2023-12-20 11:03 deephub
阅读(143)
评论(0)
推荐(0)
2023年12月19日
从头开始实现LoRA以及一些实用技巧
摘要: LoRA是Low-Rank Adaptation或Low-Rank Adaptors的缩写,它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。 LoRA的主要优点之一是它的效率。通过使用更少的参数,lora显著降低了计算复杂度和内存使用。这使我们能够在消费级gpu上训练大型模型,并将
阅读全文
posted @ 2023-12-19 10:49 deephub
阅读(183)
评论(0)
推荐(0)
2023年12月18日
2023年12月 论文推荐
摘要: 12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。 https://avoid.overfit.cn/post/4a878fde9a3f4cf3a29de4e742580d6b
阅读全文
posted @ 2023-12-18 10:00 deephub
阅读(16)
评论(0)
推荐(0)
2023年12月17日
使用LM Studio在本地运行LLM完整教程
摘要: GPT-4被普遍认为是最好的生成式AI聊天机器人,但开源模型一直在变得越来越好,并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中出于以下的原因,你可能会考虑过在本地计算机上本地运行LLM : 脱机:不需要互联网连接。 模型访问:在本地运行模型,可以尝试开源模型(Llama 2、Vicun
阅读全文
posted @ 2023-12-17 10:06 deephub
阅读(1232)
评论(0)
推荐(0)
2023年12月16日
https://avoid.overfit.cn/post/979f42aebee34d8cab04bf591e58d782
摘要: 在本文中,我将介绍matplotlib一个非常有价值的用于管理子图的函数——subplot_mosaic()。如果你想处理多个图的,那么subplot_mosaic()将成为最佳解决方案。我们将用四个不同的图实现不同的布局。 首先使用Import matplotlib行导入必要的库。 https:/
阅读全文
posted @ 2023-12-16 10:00 deephub
阅读(22)
评论(0)
推荐(0)
2023年12月15日
一种用于心音分类的轻量级1D-CNN+DWT网络
摘要: 这是由National Institute of Technology Rourkela, Central University of Rajasthan发布在2022 ICETCI的论文,利用离散小波变换(DWT)得到的多分辨率域特征对1D-CNN模型进行心音分类训练。 https://avoid
阅读全文
posted @ 2023-12-15 09:21 deephub
阅读(61)
评论(0)
推荐(0)
2023年12月14日
使用GAN进行异常检测
摘要: 自从基于Stable Diffusion的生成模型大火以后,基于GAN的研究越来越少了,但是这并不能说明他就没有用了。异常检测是多个研究领域面临的重要问题,包括金融、医疗保健和网络安全。检测和正确分类未见的异常是一个具有挑战性的问题,多年来已经以许多不同的方式解决了这个问题。而今天我们要介绍一种基于
阅读全文
posted @ 2023-12-14 09:52 deephub
阅读(248)
评论(0)
推荐(0)
上一页
1
···
61
62
63
64
65
66
67
68
69
···
139
下一页
公告