会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
31
32
33
34
35
36
37
38
39
···
154
下一页
2025年4月11日
18个常用的强化学习算法整理:从基础方法到高级模型的理论技术与代码实现
摘要: 本文系统讲解从基本强化学习方法到高级技术(如PPO、A3C、PlaNet等)的实现原理与编码过程,旨在通过理论结合代码的方式,构建对强化学习算法的全面理解。 为确保内容易于理解和实践,全部代码均在Jupyter Notebook环境中实现,仅依赖基础库进行算法构建。 代码库组织结构如下: ├── 1
阅读全文
posted @ 2025-04-11 09:59 deephub
阅读(182)
评论(0)
推荐(0)
2025年4月10日
PyTorch CUDA内存管理优化:深度理解GPU资源分配与缓存机制
摘要: 在深度学习工程实践中,当训练大型模型或处理大规模数据集时,上述错误信息对许多开发者而言已不陌生。这是众所周知的 CUDA out of memory 错误——当GPU尝试为张量分配空间而内存不足时发生。这种情况尤为令人沮丧,特别是在已投入大量时间优化模型和代码后遭遇此类问题。 torch.cuda.
阅读全文
posted @ 2025-04-10 11:04 deephub
阅读(148)
评论(0)
推荐(0)
2025年4月9日
LangChain RAG入门教程:构建基于私有文档的智能问答助手
摘要: 本文详述了如何通过检索增强生成(RAG)技术构建一个能够利用特定文档集合回答问题的AI系统。通过LangChain框架,可以实现超越预训练模型知识范围的定制化问答能力,适用于专业领域的精准信息检索与生成。 https://avoid.overfit.cn/post/4c0590a63b77428f9
阅读全文
posted @ 2025-04-09 10:09 deephub
阅读(131)
评论(0)
推荐(0)
2025年4月8日
基于LlamaIndex实现CodeAct Agent:代码执行工作流的技术架构与原理
摘要: CodeAct作为AI辅助系统的一种先进范式,实现了自然语言处理与代码执行能力的深度融合。通过构建自定义代码执行代理,开发者能够精确控制应用程序中代码的生成、执行及管理流程。本文将详细阐述如何利用LlamaIndex框架从底层构建CodeAct Agent,深入剖析其内部工作机制,以及如何在预构建解
阅读全文
posted @ 2025-04-08 10:06 deephub
阅读(242)
评论(0)
推荐(0)
2025年4月7日
频率派与贝叶斯统计在营销组合建模中的应用比较:隐私优先时代的方法选择
摘要: 在营销分析领域的持续演进过程中,营销组合建模(Marketing Mix Modeling, MMM)作为一种核心分析技术,已经经受住了时间的考验。从财富500强企业到新兴的数字化初创公司,MMM始终是一种强大的分析工具,用于量化不同营销渠道对销售量、用户注册率或收入等关键业务指标的贡献程度。 随着
阅读全文
posted @ 2025-04-07 10:17 deephub
阅读(31)
评论(0)
推荐(0)
2025年4月6日
基于Transformer架构的时间序列数据去噪技术研究
摘要: Transformer是一种专为处理序列数据而设计的高效神经网络架构。自2017年问世以来,Transformer已在自然语言处理(NLP)领域取得显著成就,并成为现代人工智能平台的核心组件,如OpenAI的ChatGPT[1]、Anthropic的Claude[2]以及Google的Gemini[
阅读全文
posted @ 2025-04-06 17:48 deephub
阅读(127)
评论(0)
推荐(0)
2025年4月5日
英伟达新一代GPU架构(50系列显卡)PyTorch兼容性解决方案
摘要: 随着NVIDIA不断推出基于新架构的GPU产品,机器学习框架需要相应地更新以支持这些硬件。本文记录了在RTX 5070 Ti上运行PyTorch时遇到的CUDA兼容性问题,并详细分析了问题根源及其解决方案,以期为遇到类似情况的开发者提供参考。 在Anaconda虚拟环境("development")
阅读全文
posted @ 2025-04-05 19:58 deephub
阅读(854)
评论(0)
推荐(0)
2025年4月4日
FlashTokenizer: 基于C++的高性能分词引擎,速度可以提升8-15倍
摘要: 随着大型语言模型(LLMs)和基于人工智能的应用程序在各行业的广泛部署,对自然语言处理(NLP)工具性能的要求日益提高。分词处理作为NLP流程中的基础环节,对整体推理性能有着决定性影响。分词过程的计算效率直接关系到模型处理文本的速度和资源消耗。在此技术背景下出现了FlashTokenizer,这是一
阅读全文
posted @ 2025-04-04 19:18 deephub
阅读(28)
评论(0)
推荐(0)
2025年4月3日
计算加速技术比较分析:GPU、FPGA、ASIC、TPU与NPU的技术特性、应用场景及产业生态
摘要: 在计算技术快速迭代的今天,传统通用处理器(CPU)正逐步被专用硬件加速器补充或替代,尤其在特定计算领域。这些加速器通过针对性设计,在功耗效率、计算吞吐量(FLOPS)和内存带宽方面实现了显著优化。截至2025年4月,加速器市场需求呈指数级增长,主要驱动因素来自人工智能(AI)、机器学习(ML)、高性
阅读全文
posted @ 2025-04-03 09:58 deephub
阅读(181)
评论(0)
推荐(0)
2025年4月2日
标签噪声下的模型评估:如何准确评估AI模型的真实性能,提高模型性能测量的可信度
摘要: 真实标签的不完美性是机器学习领域一个不可避免的挑战。从科学测量数据到深度学习模型训练中的人工标注,真实标签总是包含一定比例的错误。即使像ImageNet这样精心策划的图像数据集,其人工标注的错误率仍达0.3%。在这种情况下,如何准确评估预测模型的性能就成为一个关键问题。本文将深入探讨如何在考虑测试数
阅读全文
posted @ 2025-04-02 12:12 deephub
阅读(56)
评论(0)
推荐(0)
上一页
1
···
31
32
33
34
35
36
37
38
39
···
154
下一页
公告