会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
74
75
76
77
78
79
80
81
82
···
144
下一页
2023年9月24日
快速找到离群值的三种方法
摘要: 本文将介绍3个在数据集中查找离群值的Python方法 离群值(Outliers)是指在数据集中与其他数据点明显不同或者异常的数据点。这些数据点可能比其他数据点要远离数据集的中心,或者具有异常的数值。离群值可能是由于数据采集错误、异常事件、测量误差或者其他未知因素引起的。 离群值的存在可以对数据分析和
阅读全文
posted @ 2023-09-24 09:27 deephub
阅读(80)
评论(0)
推荐(0)
2023年9月23日
在Python中创建相关系数矩阵的6种方法
摘要: 相关系数矩阵(Correlation matrix)是数据分析的基本工具。它们让我们了解不同的变量是如何相互关联的。在Python中,有很多个方法可以计算相关系数矩阵,今天我们来对这些方法进行一个总结 Pandas Pandas的DataFrame对象可以使用corr方法直接创建相关矩阵。由于数据科
阅读全文
posted @ 2023-09-23 09:13 deephub
阅读(159)
评论(0)
推荐(0)
2023年9月21日
使用QLoRA对Llama 2进行微调的详细笔记
摘要: 使用QLoRA对Llama 2进行微调是我们常用的一个方法,但是在微调时会遇到各种各样的问题,所以在本文中,将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的,大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 https://avoid.overfit.cn/post/
阅读全文
posted @ 2023-09-21 11:22 deephub
阅读(168)
评论(0)
推荐(0)
2023年9月20日
ChatGPT可以取代搜索引擎吗?
摘要: ChatGPT对于一些简单的问题,可以完美的完成任务。但是我让它写一篇完整的文章,看看它能否代替我进行写作地的时候,我确定它不能完全取代人类。 但是我们可以使用更多的指导来让AI在日常工作流程为我们工作,所以本文将讨论如何有效利用ChatGPT。这个想法是从简单的日常用例开始,然后进入更复杂的阶段。
阅读全文
posted @ 2023-09-20 09:55 deephub
阅读(33)
评论(0)
推荐(0)
2023年9月19日
时间序列的重采样和pandas的resample方法介绍
摘要: 重采样是时间序列分析中处理时序数据的一项基本技术。它是关于将时间序列数据从一个频率转换到另一个频率,它可以更改数据的时间间隔,通过上采样增加粒度,或通过下采样减少粒度。在本文中,我们将深入研究Pandas中重新采样的关键问题。 为什么重采样很重要? 时间序列数据到达时通常带有可能与所需的分析间隔不匹
阅读全文
posted @ 2023-09-19 09:41 deephub
阅读(124)
评论(0)
推荐(0)
2023年9月18日
Stability AI发布基于稳定扩散的音频生成模型Stable Audio
摘要: 近日Stability AI推出了一款名为Stable Audio的尖端生成模型,该模型可以根据用户提供的文本提示来创建音乐。在NVIDIA A100 GPU上Stable Audio可以在一秒钟内以44.1 kHz的采样率产生95秒的立体声音频,与原始录音相比,该模型处理时间的大幅减少归因于它对压
阅读全文
posted @ 2023-09-18 09:31 deephub
阅读(34)
评论(0)
推荐(0)
2023年9月16日
Python中进行特征重要性分析的9个常用方法
摘要: 特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。 为什么特征重要性分析很重要? 如果有一个包含数十个甚至数百个特征的数据集,每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一
阅读全文
posted @ 2023-09-16 09:12 deephub
阅读(574)
评论(0)
推荐(0)
2023年9月15日
Recognize Anything:一个强大的图像标记模型
摘要: Recognize Anything是一种新的图像标记基础模型,与传统模型不同,它不依赖于手动注释进行训练;相反,它利用大规模的图像-文本对。RAM的开发过程包括四个关键阶段: 通过自动文本语义解析获得大规模的无标注图像标签。 结合标题和标注任务,训练一个自动标注的初步模型。该模型由原始文本和解析后
阅读全文
posted @ 2023-09-15 09:42 deephub
阅读(92)
评论(0)
推荐(0)
2023年9月14日
向量数据库简介和5个常用的开源项目介绍
摘要: 在人工智能领域,有大量的数据需要有效的处理。随着我们对人工智能应用,如图像识别、语音搜索或推荐引擎的深入研究,数据的性质变得更加复杂。这就是向量数据库发挥作用的地方。与存储标量值的传统数据库不同,向量数据库专门设计用于处理多维数据点(通常称为向量)。这些向量表示多个维度的数据,可以被认为是指向空间中
阅读全文
posted @ 2023-09-14 09:36 deephub
阅读(206)
评论(0)
推荐(0)
2023年9月13日
Llama-2 推理和微调的硬件要求总结:RTX 3080 就可以微调最小模型
摘要: 大语言模型微调是指对已经预训练的大型语言模型(例如Llama-2,Falcon等)进行额外的训练,以使其适应特定任务或领域的需求。微调通常需要大量的计算资源,但是通过量化和Lora等方法,我们也可以在消费级的GPU上来微调测试,但是消费级GPU也无法承载比较大的模型,经过我的测试,7B的模型可以在3
阅读全文
posted @ 2023-09-13 10:12 deephub
阅读(217)
评论(0)
推荐(0)
上一页
1
···
74
75
76
77
78
79
80
81
82
···
144
下一页
公告