deephub

2023年5月27日

摘要：我们以前介绍过Pandas和ChaGPT整合，这样可以不了解Pandas的情况下对DataFrame进行操作。现在又有人开源了Scikit-LLM，它结合了强大的语言模型，如ChatGPT和scikit-learn。但这个并不是让我们自动化scikit-learn，而是将scikit-learn和语阅读全文

posted @ 2023-05-27 10:06 deephub 阅读(74) 评论(0) 推荐(0)

2023年5月26日

PyTorch-Forecasting一个新的时间序列预测库

摘要：时间序列预测在金融、天气预报、销售预测和需求预测等各个领域发挥着至关重要的作用。PyTorch- forecasting是一个建立在PyTorch之上的开源Python包，专门用于简化和增强时间序列的工作。在本文中我们介绍PyTorch-Forecasting的特性和功能，并进行示例代码演示。完整阅读全文

posted @ 2023-05-26 10:04 deephub 阅读(303) 评论(0) 推荐(0)

2023年5月25日

Meta 开源语音 AI 模型支持 1,100 多种语言

摘要：自从ChatGPT火爆以来，各种通用的大型模型层出不穷，GPT4、SAM等等，本周一Meta 又开源了新的语音模型MMS，这个模型号称支持4000多种语言，并且发布了支持1100种语言的预训练模型权重，最主要的是这个模型不仅支持ASR，还支持TTS，也就是说不仅可以语音转文字，还可以文字转语音。因阅读全文

posted @ 2023-05-25 10:24 deephub 阅读(80) 评论(0) 推荐(0)

2023年5月24日

Jupyter Notebook 10个提升体验的高级技巧

摘要： Jupyter 笔记本是数据科学家和分析师用于交互式计算、数据可视化和协作的工具。Jupyter 笔记本的基本功能大家都已经很熟悉了，但还有一些鲜为人知的技巧可以大大提高生产力和效率。在这篇文章中，我将介绍10个可以提升体验的高级技巧。完整文章： https://avoid.overfit.cn/ 阅读全文

posted @ 2023-05-24 10:08 deephub 阅读(94) 评论(0) 推荐(0)

2023年5月23日

升级到PyTorch 2.0的技巧总结

摘要： PyTorch 2.0 发布也有一段时间了，大家是不是已经开始用了呢？ PyTorch 2.0 通过引入 torch.compile，可以显着提高训练和推理速度。与 eagerly 模式相反，编译 API 将模型转换为中间计算图（FX graph），然后以某种方式将其编译为低级计算内核，这样可以提阅读全文

posted @ 2023-05-23 10:42 deephub 阅读(129) 评论(0) 推荐(0)

2023年5月22日

计算GMAC和GFLOPS

摘要： GMAC 代表“Giga Multiply-Add Operations per Second”（每秒千兆乘法累加运算），是用于衡量深度学习模型计算效率的指标。它表示每秒在模型中执行的乘法累加运算的数量，以每秒十亿 (giga) 表示。乘法累加 (MAC) 运算是许多数学计算中的基本运算，包括矩阵阅读全文

posted @ 2023-05-22 09:57 deephub 阅读(360) 评论(0) 推荐(0)

2023年5月21日

NSFW 图片分类

摘要： NSFW指的是不适宜工作场所（"Not Safe (or Suitable) For Work;"）。在本文中，将介绍如何创建一个检测NSFW图像的图像分类模型。完整文章 https://avoid.overfit.cn/post/8f681841d02e4a8db7bcf77926e123f1 阅读全文

posted @ 2023-05-21 10:03 deephub 阅读(903) 评论(0) 推荐(0)

2023年5月20日

常用的视频帧提取工具和方法总结

摘要：视频理解任务最基础也是最主要的预处理任务是图像帧的提取。因为在视频理解任务中，视频可以看作是由一系列连续的图像帧组成的。因此，要对视频进行理解和分析，首先需要从视频中提取出每一帧的图像。图像帧的提取是视频理解任务的基础，因为后续的处理和分析都是基于单独的图像帧进行的。每一帧都代表了视频中的一个时间阅读全文

posted @ 2023-05-20 09:50 deephub 阅读(314) 评论(0) 推荐(0)

2023年5月19日

使用大语言模型集成工具 LangChain 创建自己的论文汇总和查询工具

摘要： Langchain可以帮助开发人员构建由大型语言模型(llm)支持的应用程序。它提供一个框架将LLM与其他数据源(如互联网或个人文件)连接起来。这允许开发人员将多个命令链接在一起，以创建更复杂的应用程序。包括最近比较火爆的AutoGPT等都是使用了Langchain框架进行开发的。所以本文将介绍如何阅读全文

posted @ 2023-05-19 10:10 deephub 阅读(233) 评论(0) 推荐(0)

2023年5月18日

LoRA:大模型的低秩自适应微调模型

摘要：对于大型模型来说，重新训练所有模型参数的全微调变得不可行。比如GPT-3 175B，模型包含175B个参数吗，无论是微调训练和模型部署，都是不可能的事。所以Microsoft 提出了低秩自适应(Low-Rank Adaptation, LoRA)，它冻结了预先训练好的模型权重，并将可训练的秩的分解矩阅读全文

posted @ 2023-05-18 09:53 deephub 阅读(256) 评论(0) 推荐(0)

overfit深度学习

公告