deephub

2024年3月4日

摘要： 2017年推出《Attention is All You Need》以来，transformers 已经成为自然语言处理(NLP)的最新技术。2021年，《An Image is Worth 16x16 Words》，成功地将transformers 用于计算机视觉任务。从那时起，许多基于trans 阅读全文

posted @ 2024-03-04 10:42 deephub 阅读(79) 评论(0) 推荐(0)

2024年3月3日

使用TensorRT-LLM进行生产环境的部署指南

摘要： TensorRT-LLM是一个由Nvidia设计的开源框架，用于在生产环境中提高大型语言模型的性能。该框架是基于 TensorRT 深度学习编译框架来构建、编译并执行计算图，并借鉴了许多 FastTransformer 中高效的 Kernels 实现，并且可以利用 NCCL 完成设备之间的通讯。虽阅读全文

posted @ 2024-03-03 10:08 deephub 阅读(195) 评论(0) 推荐(0)

2024年3月2日

Pytorch中张量的高级选择操作

摘要：在某些情况下，我们需要用Pytorch做一些高级的索引/选择，所以在这篇文章中，我们将介绍这类任务的三种最常见的方法：torch.index_select, torch.gather and torch.take 我们首先从一个2D示例开始，并将选择结果可视化，然后延申到3D和更复杂场景。最后以表格阅读全文

posted @ 2024-03-02 13:55 deephub 阅读(52) 评论(0) 推荐(0)

2024年3月1日

可视化FAISS矢量空间并调整RAG参数提高结果精度

摘要：随着开源大型语言模型的性能不断提高，编写和分析代码、推荐、文本摘要和问答(QA)对的性能都有了很大的提高。但是当涉及到QA时，LLM通常会在未训练数据的相关的问题上有所欠缺，很多内部文件都保存在公司内部，以确保合规性、商业秘密或隐私。当查询这些文件时，会使得LLM产生幻觉，产生不相关、捏造或不一致的阅读全文

posted @ 2024-03-01 10:25 deephub 阅读(110) 评论(0) 推荐(0)

2024年2月29日

谷歌Gemma介绍、微调、量化和推理

摘要：谷歌的最新的Gemma模型是第一个使用与Gemini模型相同的研究和技术构建的开源LLM。这个系列的模型目前有两种尺寸，2B和7B，并且提供了聊天的基本版和指令版。用一句话来总结Gemma就是：学习了Llama 2和Mistral 7B的优点，使用了更多的Token和单词进行了训练了一个更好的7B 阅读全文

posted @ 2024-02-29 10:54 deephub 阅读(281) 评论(0) 推荐(0)

2024年2月28日

2024年2月深度学习的论文推荐

摘要：我们这篇文章将推荐2月份发布的10篇深度学习的论文 Beyond A*: Better Planning with Transformers via Search Dynamics Bootstrapping. https://arxiv.org/abs/2402.14083 Searchforme 阅读全文

posted @ 2024-02-28 10:48 deephub 阅读(148) 评论(0) 推荐(0)

2024年2月27日

PyTimeTK: 一个简单有效的时间序列分析库

摘要：时间序列分析是数据科学的重要组成部分，特别是在金融、经济、天气预报等领域。它包括分析随时间收集或索引的数据点，以确定趋势、周期或季节变化。由于时间序列数据的复杂性所以分析时间序列需要复杂统计方法，我最近在Github上发现了一个刚刚发布不久的Python时间工具包PyTimeTK ，它可以帮我们简化阅读全文

posted @ 2024-02-27 09:39 deephub 阅读(82) 评论(0) 推荐(0)

2024年2月26日

选择最适合数据的嵌入模型：OpenAI 和开源多语言嵌入的对比测试

摘要： OpenAI最近发布了他们的新一代嵌入模型embedding v3，他们将其描述为性能最好的嵌入模型，具有更高的多语言性能。这些模型分为两类:较小的称为text- embeddings -3-small，较大且功能更强大的称为text- embeddings -3-large。这些模型的设计和训练阅读全文

posted @ 2024-02-26 10:22 deephub 阅读(233) 评论(0) 推荐(0)

2024年2月25日

PHATGOOSE：使用LoRA Experts创建低成本混合专家模型实现零样本泛化

摘要：这篇2月的新论文介绍了Post-Hoc Adaptive Tokenwise Gating Over an Ocean of Specialized Experts (PHATGOOSE)，这是一种通过利用一组专门的PEFT模块(如LoRA)实现零样本泛化的新方法这个方法冻结整个模型，包括PEFT 阅读全文

posted @ 2024-02-25 20:17 deephub 阅读(89) 评论(0) 推荐(0)

2024年2月24日

20个改善编码的Python异常处理技巧，让你的代码更高效

摘要：异常处理是写好代码的一个重要的方面，虽然许多开发人员都熟悉基本的try-except块，但是有很多更深入的知识可以使异常处理更高效、更可读和更python化。所以本文将介绍关于Python异常的20个可以显著改善编码的Python异常处理技巧，这些技巧可以让你熟练的掌握Python的异常处理。 Py 阅读全文

posted @ 2024-02-24 10:26 deephub 阅读(70) 评论(0) 推荐(0)

overfit深度学习

公告