识别图像主题

  • pytorch 金毛分类
  • resnet 101

对抗式生成

  • GAN
  • CycleGAN
  • resnetGeneration 马 -> 斑马
  • 换脸、生成音频、文本、音乐

描述场景的预训练网络

  • NeuralTalk2 模型

  • 提供一幅自然图像,这个模型会生成一段关于场景的英文说明
    image

  • 包含 2 个相连的部分

    • 前半部分:一个网络,学习生成场景的 “描述性” 数字表征(分类?),例如,大花猫、激光鼠标、爪子,作为后半部分的输入。
    • 后半部分:循环神经网络,将这些描述性的数字放在一起产生一个连贯的句子
  • NeuralTalk2 是2016年的成果,目前已经找不到备份,现在都用Transformer架构

  • MS COCO 是微软构建的数据集,Microsoft Common Objects in Context

PyTorch 接口

  • 要通过 Torch Hub 机制发布模型,只需将一个名为 hubconf.py 的文件放在 GitHub 存储库的根目录下
  • 存储库、入口点、关键参数 <-- 使用 torch.hub 加载模型所需要的全部内容
import torch
from torch import hub
resnet18_model = hub.load('pytorch/vision:master',      #  Github 存储库的名称
                           'resnet18',                  #  入口函数的名称
                            pretrained = True)          #  关键参数(是否用 ImageNet 的参数进行初始化)
  • 将 pytorch/vision 主分支的快照及其权重下载到本地目录
  • 这里默认下载到本地的 torch/hub 目录下
  • 然后运行 resnet18 入口点函数,该函数返回实例化的模型

Tensor 广播

posted on 2026-01-04 09:57  中年二班  阅读(5)  评论(0)    收藏  举报