AI
刷新
聊聊ChatGLM-6B医疗数据微调

博主头像 转载请注明出处: https://www.cnblogs.com/zhiyong-ITNote/ 参考了多个医疗大模型,如扁鹊、灵心等,重新思考了下微调的方案以及数据集的格式;基于ChatGLM/其它LLM整合多种微调方法的非官方实现的框架,审视其数据集格式,以及调试效果,进行微调。 最终基于liu ...

【译】深度学习不仅无法解决通用人工智能(AGI),而且毫无用处

博主头像 原作:反向科学 引言:我们中的一些人确切地知道原因:深度学习无法概括 /机器翻译/ 摘要 当AGI研究者抱怨深度学习的不足时,AI专家不应感到被冒犯。没有人真的想要摆脱深度学习。虽然 AGI 的出现确实会使深度学习在某些领域变得过时,但我们相信,即使在 AGI 解决之后,它也可能继续对许多自动化任务 ...

Sora Opera:天图万境联合华为云共筑AI生成式视频音效新高度

博主头像 本文分享自华为云社区《Sora Opera:天图万境联合华为云共筑AI生成式视频音效新高度》,作者: 华为云社区精选。 在人工智能技术的飞速发展浪潮中,天图万境科技有限公司(以下简称“天图万境”)联合华为云共同推出AI创新的声音生成工具——Sora Opera。这一突破性的技术将为AI生成式视频领域 ...

聊聊大模型的微调实现及其应用

博主头像 转载请备注出处: https://www.cnblogs.com/zhiyong-ITNote 微调框架概述 模型的微调有多种方式,对于入门的来说,一般都是基于官方的文档微调;最近发现很多开源库,其目的就是支持应用多种微调策略来微调模型,简化模型的微调门槛。比如 ChatGLM-Efficient- ...

使用Nginx将大模型Web应用部署到公网

博主头像 使用Nginx将大模型Web应用部署到公网 大模型训练完毕后,我们可以用SWIFT快速构建一个Web Demo大模型Web应用,本文将介绍如何使用Nginx将大模型Web应用部署到公网。 在进行后续步骤之前,先按照搭建一个大模型API服务中的方法安装好SWIFT框架,并激活到你的conda环境。 启 ...

【目标检测】Faster R-CNN算法实现

博主头像 本博客详细介绍了Faster RCNN模型的结构、算法原理、训练流程和预测流程,并提供了各部分的详细代码实现。博客首先阐述了Faster RCNN的整体架构,包括特征提取网络、区域建议网络(RPN)、RoI Pooling和最终的检测Classifier层等关键组件,并解释了它们各自的作用和相互之间... ...

RAG实战6-如何在LlamaIndex中使用自己搭建的API

博主头像 RAG实战6-如何在LlamaIndex使用自己搭建的大模型API 在搭建一个大模型API服务中,我们介绍了如何使用SWIFT框架搭建一个大模型API服务。在RAG实战1-5中,我们一直使用的是本地加载大模型的方式来调用大模型,本文将介绍如何在LlamaIndex中使用自己搭建的大模型API。 Ll ...

2024 SemEval 冠军

SemEval Task10,本质是一个文本分类的任务,有三个子任务,论文摘要如下:在多维对话中,情绪不仅作为情感交流的重要中介者,还承载着丰富的信息。因此,准确识别交流者的情绪并理解情绪变化的触发因素至关重要。本研究专注于多语言对话情绪识别和基于挑衅者的情绪逆向推理任务,旨在提高对话中情绪理解的准 ...

基于英特尔® Gaudi® 2 AI 加速器的文本生成流水线

博主头像 随着生成式人工智能 (Generative AI,GenAI) 革命的全面推进,使用 Llama 2 等开源 transformer 模型生成文本已成为新风尚。人工智能爱好者及开发人员正在寻求利用此类模型的生成能力来赋能不同的场景及应用。本文展示了如何基于 Optimum Habana 以及我们实现 ...

【译】LWM,AI 世界模型的黎明?

博主头像 原作:格列高利的伊格内修斯 引言:从语言到视频 AI行业的下一个里程碑--视频的征服真在加剧。 借助业界最热门的创新之一“Ring Attention(环形注意力、环形使者)”,一组研究人员构建了 LWM 视频模型,尽管这些模型还非常小,但包含的功能超越了目前ChatGPT的能力。 然而,基于视频的 ...

朴素贝叶斯模型

博主头像 朴素贝叶斯法 朴素贝叶斯是一种用先验概率估计后验概率的模型,通过估计先验概率得到样本和类别的近似联合概率,随后通过联合概率分布获得需要的后验概率分布进而实现分类。本次介绍的朴素贝叶斯法主要包括三块:总体思想(将后验概率转换为先验概率)、极大似然估计(使用极大似然法估计先验概率)、贝叶斯估计(使用贝叶 ...

万字带你了解ChatGLM

博主头像 本文分享自华为云社区《【云驻共创】华为云之昇思MindSpore大模型专题(第二期)-第一课:ChatGLM》,作者: 愚公搬代码。 前言 1.昇思MindSpore 昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动微分、分布式训练和推理、模型部署等功能,支持多种硬件平台, ...

监控大模型训练

博主头像 监控大模型训练 大模型训练时间久,而且过程中容易出现各种各样的问题而中断,中断之后不及时续练的话对GPU资源是很大的浪费,但是我们又不能一直盯着程序。所以本文将介绍如何编写一个监控程序来监控大模型的训练,以方便我们在大模型训练出现异常时及时通知给我们。 监控的方式有很多,这里介绍两个方式。 根据lo ...

<1···789···50>