会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
13
14
15
16
17
18
19
20
21
···
144
下一页
2025年7月6日
Python 3.14七大新特性总结:从t-string模板到GIL并发优化
摘要: Python 3.14已进入测试阶段,根据PEP 745发布计划,该版本已停止引入新功能,也就是说新特征就应该已经固定下来了。所以本文基于当前最新的beta 2版本,深入分析了Python 3.14中的七项核心新特性。 无论从事Web应用开发、数据处理管道构建,还是复杂系统调试工作,这些新特性都将对
阅读全文
posted @ 2025-07-06 10:38 deephub
阅读(85)
评论(0)
推荐(0)
2025年7月5日
量化交易隐藏模式识别方法:用潜在高斯混合模型识别交易机会
摘要: 在SPY股票数据分析过程中,虽然能够有效识别日线价格趋势,但挖掘数据中的潜在模式仍然面临重大挑战。市场数据普遍存在高噪声特征,传统分析工具难以识别稳定的行为模式。移动平均线等常规技术指标虽然能够平滑数据,但往往掩盖了数据的内在结构信息。潜在高斯混合模型(Latent Gaussian Mixture
阅读全文
posted @ 2025-07-05 11:51 deephub
阅读(47)
评论(0)
推荐(0)
2025年7月4日
掌握这10个Jupyter魔法命令,让你的数据分析效率提升3倍
摘要: 作为数据科学从业者,我们经常需要在 Jupyter 笔记本环境中进行数据处理、模型构建和结果可视化等工作。然而,许多开发者并未充分利用 Jupyter 笔记本的内置功能——魔法命令(Magic Commands)。 魔法命令是 Jupyter 笔记本中的特殊指令,通过 % 或 %% 前缀标识,能够显
阅读全文
posted @ 2025-07-04 15:56 deephub
阅读(30)
评论(0)
推荐(0)
2025年7月3日
大语言模型也可以进行图像分割:使用Gemini实现工业异物检测完整代码示例
摘要: Gemini模型在大语言模型市场中展现出独特的优势,特别是在计算机视觉领域具有显著的技术潜力。与其他主流大语言模型相比,Gemini在目标检测和图像分割方面具备原生支持能力。较大规模的Gemini模型经过专门训练,能够直接输出边界框坐标和分割掩码,这一特性在当前的大语言模型生态中较为罕见。虽然Qwe
阅读全文
posted @ 2025-07-03 13:11 deephub
阅读(34)
评论(0)
推荐(0)
2025年7月2日
CUDA性能优化实战:7个步骤让并行归约算法提升10倍效率
摘要: 本文深入探讨了一个经典的并行计算算法——并行归约(Parallel Reduction)的性能优化过程,通过七个渐进式的优化步骤,展示了如何将算法性能提升至极致。这项研究基于Mark Harris在NVIDIA网络研讨会中提出的优化方法,在重现这些优化技术的同时,进一步简化了概念阐述以便于理解。配套
阅读全文
posted @ 2025-07-02 10:43 deephub
阅读(35)
评论(0)
推荐(0)
2025年7月1日
Python时间序列平滑技术完全指南:6种主流方法原理与实战应用
摘要: 在时间序列数据分析中,噪声问题是不可避免的挑战。即使在信号质量良好的情况下,原始数据仍可能包含各种干扰因素。这些噪声可能来源于传感器硬件缺陷、人工测量过程中的随机误差,或者数据本身固有的统计波动特性,这些因素都会对有效趋势信息的提取造成显著影响。 数据平滑技术为解决这一问题提供了有效途径,能够显著改
阅读全文
posted @ 2025-07-01 10:57 deephub
阅读(18)
评论(0)
推荐(0)
2025年6月30日
Python AutoML框架选型攻略:7个工具性能对比与应用指南
摘要: 机器学习模型的构建过程历来需要大量的手动调参工作,包括超参数优化、算法选择和特征工程等环节,往往需要数周的时间投入。尽管这种传统的开发模式仍然存在,但AutoML技术的发展已经显著简化了这一过程。 经过多年的AutoML库实践经验,这些工具已经深刻改变了机器学习项目的开发方式。无论是在项目周期紧张的
阅读全文
posted @ 2025-06-30 10:22 deephub
阅读(32)
评论(0)
推荐(0)
2025年6月29日
大数据集特征工程实践:将54万样本预测误差降低68%的技术路径与代码实现详解
摘要: 特征工程作为机器学习流程中的关键环节,在模型训练之前执行,其质量直接影响模型性能。虽然深度学习模型在图像和文本等非结构化数据的特征自动学习方面表现优异,但对于表格数据集而言,显式特征工程仍然是不可替代的核心技术。本文通过实际案例演示特征工程在回归任务中的应用效果,重点分析包含数值型、分类型和时间序列
阅读全文
posted @ 2025-06-29 11:37 deephub
阅读(24)
评论(0)
推荐(0)
2025年6月28日
Arctic长序列训练技术:百万级Token序列的可扩展高效训练方法
摘要: 在现实应用场景中,许多AI系统需要处理超过数十万token的长文本序列,例如密集文档分析、长对话理解以及检索增强生成(RAG)管道等。当前大多数语言模型仅在相对较短的文本片段上进行训练。这种训练与应用需求的不匹配,类似于要求模型仅通过阅读小说的一页内容就能完成整本书的总结任务。虽然模型可能捕获到文本
阅读全文
posted @ 2025-06-28 11:27 deephub
阅读(30)
评论(0)
推荐(0)
2025年6月27日
小模型当老师效果更好:借助RLTs方法7B参数击败671B,训练成本暴降99%
摘要: Sakana AI提出的强化学习教师模型(Reinforcement-Learned Teachers, RLTs)代表了一种全新的训练范式。该方法颠覆了传统强化学习需要模型从零开始通过稀疏奖励信号解决问题的训练方式,转而从已知答案出发,训练小型"教师"模型以适合学生模型学习的方式解释解决方案。 实
阅读全文
posted @ 2025-06-27 10:42 deephub
阅读(30)
评论(0)
推荐(0)
上一页
1
···
13
14
15
16
17
18
19
20
21
···
144
下一页
公告