deephub

2023年12月2日

摘要：高斯混合模型(gmm)是将数据表示为高斯(正态)分布的混合的统计模型。这些模型可用于识别数据集中的组，并捕获数据分布的复杂、多模态结构。 gmm可用于各种机器学习应用，包括聚类、密度估计和模式识别。在本文中，将首先探讨混合模型，重点是高斯混合模型及其基本原理。然后将研究如何使用一种称为期望最大化( 阅读全文

posted @ 2023-12-02 11:04 deephub 阅读(116) 评论(0) 推荐(0)

2023年12月1日

简化版Transformer ：Simplifying Transformer Block论文详解

摘要：在这篇文章中我将深入探讨来自苏黎世联邦理工学院计算机科学系的Bobby He和Thomas Hofmann在他们的论文“Simplifying Transformer Blocks”中介绍的Transformer技术的进化步骤。这是自Transformer 开始以来，我看到的最好的改进。大型语言模阅读全文

posted @ 2023-12-01 11:30 deephub 阅读(155) 评论(0) 推荐(0)

2023年11月30日

Pandas中选择和过滤数据的终极指南

摘要： Python pandas库提供了几种选择和过滤数据的方法，如loc、iloc、[]括号操作符、query、isin、between等等本文将介绍使用pandas进行数据选择和过滤的基本技术和函数。无论是需要提取特定的行或列，还是需要应用条件过滤，pandas都可以满足需求。 https://av 阅读全文

posted @ 2023-11-30 09:56 deephub 阅读(78) 评论(0) 推荐(0)

2023年11月29日

使用Accelerate库在多GPU上进行LLM推理

摘要：大型语言模型(llm)已经彻底改变了自然语言处理领域。随着这些模型在规模和复杂性上的增长，推理的计算需求也显著增加。为了应对这一挑战利用多个gpu变得至关重要。所以本文将在多个gpu上并行执行推理，主要包括：Accelerate库介绍，简单的方法与工作代码示例和使用多个gpu的性能基准测试。本文阅读全文

posted @ 2023-11-29 10:07 deephub 阅读(227) 评论(0) 推荐(0)

2023年11月28日

三种常用的风险价值(VaR)计算方法总结

摘要：风险价值(VaR)是金融领域广泛使用的风险度量，它量化了在特定时间范围内和给定置信度水平下投资或投资组合的潜在损失。它提供了一个单一的数字，代表投资者在正常市场条件下可能经历的最大损失。VaR是风险管理、投资组合优化和法规遵从的重要工具。在本文中我们将介绍VaR的概念，并使用Python计算它，然阅读全文

posted @ 2023-11-28 10:00 deephub 阅读(517) 评论(0) 推荐(0)

2023年11月27日

PubMedBERT:生物医学自然语言处理领域的特定预训练模型

摘要：今年大语言模型的快速发展导致像BERT这样的模型都可以称作“小”模型了。Kaggle LLM比赛LLM Science Exam 的第四名就只用了deberta，这可以说是一个非常好的成绩了。所以说在特定的领域或者需求中，大语言模型并不一定就是最优的解决方案，“小”模型也有一定的用武之地，所以今天我阅读全文

posted @ 2023-11-27 09:37 deephub 阅读(184) 评论(0) 推荐(0)

2023年11月26日

使用skforecast进行时间序列预测

摘要：时间序列预测是数据科学和商业分析中基于历史数据预测未来价值的一项重要技术。它有着广泛的应用，从需求规划、销售预测到计量经济分析。由于Python的多功能性和专业库的可用性，它已经成为一种流行的预测编程语言。其中一个为时间序列预测任务量身定制的库是skforecast。在本文中，将介绍skforec 阅读全文

posted @ 2023-11-26 09:22 deephub 阅读(103) 评论(0) 推荐(0)

2023年11月25日

LLMLingua:集成LlamaIndex，对提示进行压缩，提供大语言模型的高效推理

摘要：大型语言模型(llm)的出现刺激了多个领域的创新。但是在思维链(CoT)提示和情境学习(ICL)等策略的驱动下，提示的复杂性不断增加，这给计算带来了挑战。这些冗长的提示需要大量的资源来进行推理，因此需要高效的解决方案，本文将介绍LLMLingua与专有的LlamaIndex的进行集成执行高效推理。阅读全文

posted @ 2023-11-25 10:16 deephub 阅读(189) 评论(0) 推荐(0)

2023年11月24日

https://avoid.overfit.cn/post/161e4abfe1fa4e1a98ddf8511c16f2c6

摘要：评估聚类结果的有效性，即聚类评估或验证，对于聚类应用程序的成功至关重要。它可以确保聚类算法在数据中识别出有意义的聚类，还可以用来确定哪种聚类算法最适合特定的数据集和任务，并调优这些算法的超参数(例如k-means中的聚类数量，或DBSCAN中的密度参数)。虽然监督学习技术有明确的性能指标，如准确性阅读全文

posted @ 2023-11-24 11:32 deephub 阅读(79) 评论(0) 推荐(0)

2023年11月23日

斯坦福大学引入FlashFFTConv来优化机器学习中长序列的FFT卷积

摘要：斯坦福大学的FlashFFTConv优化了扩展序列的快速傅里叶变换(FFT)卷积。该方法引入Monarch分解，在FLOP和I/O成本之间取得平衡，提高模型质量和效率。并且优于PyTorch和FlashAttention-v2。它可以处理更长的序列，并在人工智能应用程序中打开新的可能性。处理长序列阅读全文

posted @ 2023-11-23 10:17 deephub 阅读(65) 评论(0) 推荐(0)

overfit深度学习

公告