deephub

2023年7月17日

摘要：本文将介绍使用LoRa在本地机器上微调Alpaca和LLaMA，我们将介绍在特定数据集上对Alpaca LoRa进行微调的整个过程，本文将涵盖数据处理、模型训练和使用流行的自然语言处理库(如Transformers和hugs Face)进行评估。此外还将介绍如何使用grado应用程序部署和测试模型。阅读全文

posted @ 2023-07-17 10:11 deephub 阅读(164) 评论(0) 推荐(0)

2023年7月16日

使用CatBoost和SHAP进行多分类完整代码示例

摘要： CatBoost是顶尖的机器学习模型之一。凭借其梯度增强技术以及内置函数，可以在不做太多工作的情况下生成一些非常好的模型。SHAP (SHapley Additive exPlanation)是旨在解释具有独特视觉效果和性能价值的机器学习模型的输出。CatBoost和SHAP结合在一起构成了一个强大阅读全文

posted @ 2023-07-16 09:58 deephub 阅读(340) 评论(0) 推荐(0)

2023年7月14日

7个有用的Prompt参数

摘要： ChatGPT和Midjournal使得生成式人工智能的应用程序激增。当涉及到生成式AI时，"prompt"通常指的是作为输入给模型的初始提示或指示。它是一个短语、问题、句子或段落，用来引导模型生成相关的响应或文本。在使用生成式AI模型时，提供一个清晰、具体的prompt非常重要，因为它会直接影响阅读全文

posted @ 2023-07-14 09:17 deephub 阅读(117) 评论(0) 推荐(0)

2023年7月13日

注意力机制中的掩码详解

摘要：注意力机制的掩码允许我们发送不同长度的批次数据一次性的发送到transformer中。在代码中是通过将所有序列填充到相同的长度，然后使用“attention_mask”张量来识别哪些令牌是填充的来做到这一点，本文将详细介绍这个掩码的原理和机制。我们先介绍下如果不使用掩码，是如何运行的。这里用GPT 阅读全文

posted @ 2023-07-13 10:08 deephub 阅读(573) 评论(0) 推荐(0)

2023年7月8日

并行计算框架Polars、Dask的数据处理性能对比

摘要：在Pandas 2.0发布以后，我们发布过一些评测的文章，这次我们看看，除了Pandas以外，常用的两个都是为了大数据处理的并行数据框架的对比测试。本文我们使用两个类似的脚本来执行提取、转换和加载(ETL)过程。测试内容这两个脚本主要功能包括: 从两个parquet 文件中提取数据，对于小型数阅读全文

posted @ 2023-07-08 10:29 deephub 阅读(124) 评论(0) 推荐(0)

2023年7月7日

使用Streamlit和OpenAI API构建视频摘要

摘要：本文提供了使用Streamlit和OpenAI创建的视频摘要应用程序的概述。该程序为视频的每个片段创建简洁的摘要，并总结视频的完整内容。要运行应用程序，需要安装以下依赖项: Python(3.7或更高版本) Streamlit OpenAI API密钥 llama_index youtube_tr 阅读全文

posted @ 2023-07-07 09:48 deephub 阅读(103) 评论(0) 推荐(0)

2023年7月6日

矢量数据库对比和选择指南

摘要：矢量数据库是为实现高维矢量数据的高效存储、检索和相似性搜索而设计的。使用一种称为嵌入的过程，将向量数据表示为一个连续的、有意义的高维向量。本文将研究存储/检索向量数据和执行相似性搜索的实用方法，在我们深入研究之前，首先先介绍矢量数据库的两个关键功能： https://avoid.overfit.c 阅读全文

posted @ 2023-07-06 10:43 deephub 阅读(224) 评论(0) 推荐(0)

2023年7月5日

WideNet:让网络更宽而不是更深

摘要：这是新加坡国立大学在2022 aaai发布的一篇论文。WideNet是一种参数有效的框架，它的方向是更宽而不是更深。通过混合专家(MoE)代替前馈网络(FFN)，使模型沿宽度缩放。使用单独LN用于转换各种语义表示，而不是共享权重。 https://avoid.overfit.cn/post/fd66 阅读全文

posted @ 2023-07-05 10:11 deephub 阅读(66) 评论(0) 推荐(0)

2023年7月4日

LeViT-UNet：transformer 编码器和CNN解码器的有效整合

摘要： levi - unet[2]是一种新的医学图像分割架构，它使用transformer 作为编码器，这使得它能够更有效地学习远程依赖关系。levi - unet[2]比传统的U-Nets更快，同时仍然实现了最先进的分割性能。 levi - unet[2]在几个具有挑战性的医学图像分割基准上取得了比其他阅读全文

posted @ 2023-07-04 10:36 deephub 阅读(123) 评论(0) 推荐(0)

2023年7月3日

基于声音信号的工业设备异常检测

摘要：异常检测主要目标是将异常事件与正常事件区分开来，因此才有了“异常”一词。本文将介绍基于声音信号的工业机械异常检测，使用的数据集是MIMII声音数据集，该数据集很容易在网上获得。异常检测的任务可以通过多种方式实现。其中最简单的一种方法是将问题作为监督学习任务，并对正常和异常声音训练分类器。这种方法的阅读全文

posted @ 2023-07-03 09:43 deephub 阅读(295) 评论(0) 推荐(0)

overfit深度学习

公告