随笔分类 -  深度学习

摘要:Unsloth是一个专注于加速大语言模型微调过程的开源项目。它通过一系列底层优化,显著提升了微调速度并大幅降低了内存消耗,同时能保持模型性能。无论是研究者还是开发者,都能借助Unsloth更高效地定制自己的大语言模型。本文将介绍Unsloth的使用,相关学习资源如下: 开源仓库:Unsloth 官方 阅读全文
posted @ 2025-10-01 11:18 落痕的寒假 阅读(578) 评论(0) 推荐(0)
摘要:锂离子电池是新能源汽车、储能系统及便携式电子设备的核心能源部件,其剩余使用寿命(Remaining Useful Life,RUL)的准确预测直接关系到设备运行安全、维护成本优化和能源效率提升。RUL预测算法能够提前量化电池剩余可用时间,是保障新能源汽车与储能系统安全稳定运行、降低突发故障风险、优化 阅读全文
posted @ 2025-09-13 10:21 落痕的寒假 阅读(475) 评论(0) 推荐(1)
摘要:在大语言模型基础知识一文中,检索增强生成(Retrieval-Augmented Generation,简称 RAG)技术作为构建大语言模型(Large Language Model,简称 LLM)应用的一种方式已被简要提及,本文将详细介绍RAG技术的实现流程及其演进趋势。 关于RAG技术更全面更系 阅读全文
posted @ 2025-08-08 20:05 落痕的寒假 阅读(965) 评论(0) 推荐(0)
摘要:在文章大语言模型基础知识里,模型训练与微调作为大语言模型(Large Language Model,LLM)应用构建的主要方式被简要提及,本系列文章将从技术原理、实施流程及应用场景等维度展开深度解析。相关知识的进一步参考见:LLM训练理论和实战。本文作为该系列的下半部分,包含第3章并聚焦于大语言模型 阅读全文
posted @ 2025-07-23 19:57 落痕的寒假 阅读(613) 评论(0) 推荐(0)
摘要:在文章大语言模型基础知识里,模型训练与微调作为大语言模型(Large Language Model,LLM)应用构建的主要方式被简要提及,本系列文章将从技术原理、实施流程及应用场景等维度展开深度解析。相关知识的进一步参考见:LLM训练理论和实战。本文作为系列的上半部分,内容涵盖第1章大语言模型概览和 阅读全文
posted @ 2025-07-21 20:28 落痕的寒假 阅读(603) 评论(0) 推荐(0)
摘要:在文章大语言模型基础知识里,提示词工程(Prompt Engineering)作为大语言模型(Large Language Model,LLM)应用构建的一种方式被简要提及,本文将着重对该技术进行介绍。 提示词工程就是在和LLM聊天时,用来让模型回答得更好的一种方法。LLM的工作原理是猜下一个字或词 阅读全文
posted @ 2025-02-28 20:26 落痕的寒假 阅读(1264) 评论(0) 推荐(2)
摘要:大语言模型(Large Language Model,LLM)是一类基于Transformer架构的深度学习模型,主要用于处理与自然语言相关的各种任务。简单来说,当用户输入文本时,模型会生成相应的回复或结果。它能够完成许多任务,如文本续写、分类、摘要、改写、翻译等。常见的LLM包括GPT、LLaMA 阅读全文
posted @ 2024-12-31 22:21 落痕的寒假 阅读(2644) 评论(0) 推荐(2)
摘要:TSLiB是一个为深度学习时间序列分析量身打造的开源仓库。它提供了多种深度时间序列模型的统一实现,方便研究人员评估现有模型或开发定制模型。TSLiB涵盖了长时预测(Long-term forecasting)、短时预测(Short-term forecasting)、缺失值填补(Missing va 阅读全文
posted @ 2024-08-28 22:09 落痕的寒假 阅读(4228) 评论(0) 推荐(1)
摘要:Supervision库是一款出色的Python计算机视觉低代码工具,其设计初衷在于为用户提供一个便捷且高效的接口,用以处理数据集以及直观地展示检测结果。Supervision库的官方开源仓库地址为:supervision,官方文档地址为:supervision-doc。 Supervision库需 阅读全文
posted @ 2024-03-18 09:29 落痕的寒假 阅读(2882) 评论(2) 推荐(3)
摘要:spaCy是一个基于Python编写的开源自然语言处理库。基于自然处理领域的最新研究,spaCy提供了一系列高效且易用的工具,用于文本预处理、文本解析、命名实体识别、词性标注、句法分析和文本分类等任务。 spaCy的官方仓库地址为:[spaCy-github](https://github.com/ 阅读全文
posted @ 2023-07-27 13:00 落痕的寒假 阅读(6070) 评论(0) 推荐(2)
摘要:对象检测是迄今为止计算机视觉中最重要的应用领域。然而,小物体的检测和大图像的推理仍然是实际使用中的主要问题,这是因为小目标物体有效特征少,覆盖范围少。小目标物体的定义通常有两种方式。一种是绝对尺度定义,即以物体的像素尺寸来判断是否为小目标,如在COCO数据集中,尺寸小于32×32像素的目标被判定为小 阅读全文
posted @ 2023-01-03 20:12 落痕的寒假 阅读(2465) 评论(3) 推荐(2)
摘要:​ 转载于DeepLearning: Contractive Autoencoder - dupuleng - 博客园 一、雅克比矩阵 雅克比矩阵是一阶偏导,假设(x1,x2,....,xn)到(y1,y2,...,ym)的映射,相当于m个n元函数,它的Jacobian Matrix如下 ​编辑 该 阅读全文
posted @ 2022-12-21 20:13 落痕的寒假 阅读(130) 评论(0) 推荐(0)
摘要:过拟合和欠拟合 简单来说过拟合就是模型训练集精度高,测试集训练精度低;欠拟合则是模型训练集和测试集训练精度都低。 官方文档地址为 https://tensorflow.google.cn/tutorials/keras/overfit_and_underfit 过拟合和欠拟合 以IMDB datas 阅读全文
posted @ 2022-12-19 23:06 落痕的寒假 阅读(112) 评论(0) 推荐(0)
摘要:imgaug是一款非常有用的python图像增强库,非常值得推荐应用于深度学习图像增强。其包含许多增强技术,支持图像分类,目标检测,语义分割,热图、关键点检测等一系列任务的图像增强。本文主要介绍imgaug基本使用,以及应用关键点和边界框增强。 官方代码仓库:imgaug 官方入门文档:imgaug 阅读全文
posted @ 2022-12-19 22:44 落痕的寒假 阅读(995) 评论(0) 推荐(0)
摘要:一文读懂神经网络 http://dataunion.org/11692.html (上文的补充) 卷积神经网络工作原理的直观理解 https://zhihu.com/question/39022858/answer/224446917 (挺不错的,但是讲的并不那么通俗) 数字识别的卷积神经网络学习模 阅读全文
posted @ 2022-12-19 22:44 落痕的寒假 阅读(55) 评论(0) 推荐(0)
摘要:ImageAI是一个Python库,旨在使开发人员,研究人员和学生能够使用简单的几行代码来构建具有独立的深度学习和计算机视觉功能的应用程序和系统。 ImageAI的官方GitHub存储库为https://github.com/OlafenwaMoses/ImageAI @ # 去掉警告 import 阅读全文
posted @ 2022-12-19 22:44 落痕的寒假 阅读(878) 评论(0) 推荐(0)
摘要:本文为本人caffe分类网络训练、结果可视化、部署及量化具体过程的心得笔记。caffe目前官方已经停止支持了,但是caffe是目前工业落地最常用的深度学习框架,用的人挺多。其实主要怕自己忘了,弄个备份,弄caffe很久了,怕不用东西都忘了,但是本文主要是讲述caffe下的分类网络。caffe默认已经 阅读全文
posted @ 2022-12-19 22:44 落痕的寒假 阅读(548) 评论(0) 推荐(0)
摘要:cvat是一个非常好用的标注工具,但是也是非常难以安装的标注工具,所以本文简单讲一讲如何安装与使用cvat。cvat最好在ubuntu18.04安装,windows平台安装难度很大,然后在其他平台使用。 1 安装 安装其实一步一步按照官方教程执行就好了,官方地址文档为cvat安装文档。安装最大的问题 阅读全文
posted @ 2022-12-19 22:41 落痕的寒假 阅读(1578) 评论(0) 推荐(0)
摘要:CCPD是一个大型的、多样化的、经过仔细标注的中国城市车牌开源数据集。CCPD数据集主要分为CCPD2019数据集和CCPD2020(CCPD-Green)数据集。CCPD2019数据集车牌类型仅有普通车牌(蓝色车牌),CCPD2020数据集车牌类型仅有新能源车牌(绿色车牌)。 在CCPD数据集中, 阅读全文
posted @ 2022-12-19 22:33 落痕的寒假 阅读(1330) 评论(0) 推荐(0)
摘要:网易云课堂深度学习工程师微专业: http://mooc.study.163.com/smartSpec/detail/1001319001.htm 吴恩达神经网络和深度学习课程主页: http://mooc.study.163.com/course/deeplearning_ai-20012810 阅读全文
posted @ 2022-12-19 21:49 落痕的寒假 阅读(56) 评论(0) 推荐(0)