摘要: 引子 Sora,2024年2月15日,OpenAI发布的人工智能文生视频大模型。支持60秒视频生成,震荡了国内国际学术圈、广告圈、AI教培圈。Sora最主要有三个优点:第一,“60s超长视频”,之前文本生成视频大模型一直无法真正突破AI视频的4秒连贯性瓶颈,而Sora直接做到了60秒连贯视频。第二, 阅读全文
posted @ 2024-04-03 08:56 要养家的程序猿 阅读(103) 评论(2) 推荐(0) 编辑
摘要: 引子 作为YOLO的拥趸,之前一直没有太关注DETR,虽然知道效果很好。但是,巨大的计算开销,还是一直让我望而却步。然而,今天在翻阅CVPR2024的论文的时候,突然看到这么一篇《RT-DETR: DETRs Beat YOLOs on Real-time Object Detection》。嗯,它 阅读全文
posted @ 2024-03-28 14:12 要养家的程序猿 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 引子 最近在做之前工作的资料整理,无意间翻到基于图像处理的划痕检测文章,网址都失效了 。OK,让我们开始吧。网址:http://www.qualitymag.com/articles/91490-detecting-of-cracks-and-scratches 检测产品表面缺陷,诸如污点、龟裂和刮 阅读全文
posted @ 2024-03-21 15:55 要养家的程序猿 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 引子 对于CV从业者来说,YOLO系列是个绕不过的经典结构,笔者遥想当年YOLO横空出世的时候,Faster RCNN还是学术界目标检测的翘楚。二阶段检测还是大行其道,不过时至今日,估摸着没有人再提二阶段目标检测的结构了。YOLO系列也从1更新到了9,这新鲜出炉的v9版本,我也来凑个热闹(虽然没有前 阅读全文
posted @ 2024-03-11 10:09 要养家的程序猿 阅读(363) 评论(0) 推荐(0) 编辑
摘要: 引子 近期,文生图,wav2lip很火,文生图,见识的太多,不多说了。wav2lip其通过语音驱动唇部动作并对视频质量进行修复,里面一般涉及到三个步骤,文本到语音转化,语音驱动唇部动作,图像质量修复。最后一步骤涉及到图像质量修复,考虑到之前做过基于GFP-GAN相关的工作,在此,总结汇总下。本文主要 阅读全文
posted @ 2024-03-06 11:36 要养家的程序猿 阅读(53) 评论(0) 推荐(0) 编辑
摘要: 引子 近期接到一个文本中英互译的任务,一直以为这种翻译应该很成熟,各种商用版本很多。那么开源的一定也不少,经过网络搜索发现,近两年还真的出现了很多优秀的开源翻译项目。找到了赫尔辛基大学开源免费的多语言翻译模型,开发了1400多个多语种翻译模型。其中就包含了中译英和英译中。OK,那就让我们开始吧。 一 阅读全文
posted @ 2024-02-26 17:28 要养家的程序猿 阅读(70) 评论(0) 推荐(0) 编辑
摘要: 引子 在深度学习CV领域,最初2012年突破的就是图像分类,发展这么多年,基本上已经没有什么进展了。此篇作为之前EfficientNet挽留过的总结,现在整理下,OK,让我们开始吧。 一、EfficientNet安装 1、pytorch版本网址:https://github.com/lukemela 阅读全文
posted @ 2024-02-22 19:02 要养家的程序猿 阅读(50) 评论(0) 推荐(0) 编辑
摘要: 引子 最近手上接了一个活儿,基于文本语料的实体抽取任务,调研了一圈发现目前开源轮子做的比较好的也就是PaddleNLP(大模型那种巨废资源,且幻觉严重的,不予考虑)。OK,那就让我们开始吧。 一、命名实体识别概念 命名实体识别(Named EntitiesRecognition,NER)是自然语言处 阅读全文
posted @ 2024-02-18 09:56 要养家的程序猿 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 引子 国产AI芯片这个集合,一直想补充的完整点。故翻了翻陈年的笔记,找到当年使用瑞芯微电子出的一款芯片RV1126的使用笔记,当时拿到的是一款基于RV1126的IP摄像头,在此整理记录下。OK,让我们开始吧。 一、文档 首先拿到官方的SDK包,解压后,SDK文档目录:rv1109_1126_sdk\ 阅读全文
posted @ 2024-02-05 09:36 要养家的程序猿 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 引子 前文已经有一篇,华为服务器Atlas芯片的文章(https://www.cnblogs.com/nick-algorithmer/p/17943216)。熟悉AI的同学们一定知道,除了服务器端端训练推理。AI推理还有一部分是边端推理,各大芯片厂商都有推出边端推理芯片,凑巧,拿到一个一块很老的华 阅读全文
posted @ 2024-01-29 10:00 要养家的程序猿 阅读(104) 评论(0) 推荐(0) 编辑