随笔分类 - 人工智能
摘要:原文:80 Ways to Use ChatGPT in the Classroom 译者:飞龙 协议:CC BY-NC-SA 4.0 第九章:其他用途 随着世界变得更加技术驱动,管理任务的需求变得越来越迫切。ChatGPT 已被证明是教学、学习和其他用途的宝贵资产。本章将介绍 ChatGPT 作为
阅读全文
摘要:原文:80 Ways to Use ChatGPT in the Classroom 译者:飞龙 协议:CC BY-NC-SA 4.0 第一章:介绍 chatGPT 于 2022 年 11 月崭露头角。它已经开始颠覆高等教育等行业和企业,类似于印刷机和互联网。在核心上,chatGPT 利用人工智能来
阅读全文
摘要:# 单个专家的架构,就是经典的 FFN class MixtralBLockSparseTop2MLP(nn.Module): def __init__(self, config: MixtralConfig): super().__init__() # FFNSize,一般是 HidSize x4
阅读全文
摘要:解决方案是参照其它LLM给它补上chat()方法: def chat(model, tok, ques, history=[], **kw): iids = tok.apply_chat_template( history + [{'role': 'user', 'content': ques}],
阅读全文
摘要:原文:ChatGPT Business Goldmines 译者:飞龙 协议:CC BY-NC-SA 4.0 第十七章:ChatGPT 商业金矿#15:在线课程创建业务 随着人们寻求便捷灵活的学习新技能、推进职业或探索新爱好的方式,在线课程变得越来越受欢迎。通过使用 OpenAI 的强大 AI 语言
阅读全文
摘要:原文:ChatGPT Business Goldmines 译者:飞龙 协议:CC BY-NC-SA 4.0 第一章:为什么我写这本书 欢迎阅读《ChatGPT 多源收入:20 个利润丰厚的业务,任何人都可以在一周内使用 ChatGPT 开始》。我很高兴分享我在利用 ChatGPT 创建多个收入来源
阅读全文
摘要:九、高级计算机视觉深度学习 本章涵盖 计算机视觉的不同分支:图像分类、图像分割、目标检测 现代卷积神经网络架构模式:残差连接、批量归一化、深度可分离卷积 可视化和解释卷积神经网络学习的技术 上一章通过简单模型(一堆Conv2D和MaxPooling2D层)和一个简单的用例(二进制图像分类)为您介绍了
阅读全文
摘要:七、使用 Keras:深入探讨 本章涵盖 使用 Sequential 类、功能 API 和模型子类创建 Keras 模型 使用内置的 Keras 训练和评估循环 使用 Keras 回调函数自定义训练 使用 TensorBoard 监控训练和评估指标 从头开始编写训练和评估循环 您现在对 Keras
阅读全文
摘要:四、入门神经网络:分类和回归 本章涵盖 您的第一个真实世界机器学习工作流示例 处理矢量数据上的分类问题 处理矢量数据上的连续回归问题 本章旨在帮助您开始使用神经网络解决实际问题。您将巩固从第二章和第三章中获得的知识,并将所学应用于三个新任务,涵盖神经网络的三种最常见用例 — 二元分类、多类分类和标量
阅读全文
摘要:前言 序言 如果你拿起这本书,你可能已经意识到深度学习在最近对人工智能领域所代表的非凡进步。我们从几乎无法使用的计算机视觉和自然语言处理发展到了在你每天使用的产品中大规模部署的高性能系统。这一突然进步的后果几乎影响到了每一个行业。我们已经将深度学习应用于几乎每个领域的重要问题,跨越了医学影像、农业、
阅读全文
摘要:十四、端到端结节分析,以及接下来的步骤 本章内容包括 连接分割和分类模型 为新任务微调网络 将直方图和其他指标类型添加到 TensorBoard 从过拟合到泛化 在过去的几章中,我们已经构建了许多对我们的项目至关重要的系统。我们开始加载数据,构建和改进结节候选的分类器,训练分割模型以找到这些候选,处
阅读全文
摘要:十二、通过指标和增强改进训练 本章涵盖 定义和计算精确率、召回率以及真/假阳性/阴性 使用 F1 分数与其他质量指标 平衡和增强数据以减少过拟合 使用 TensorBoard 绘制质量指标图 上一章的结束让我们陷入了困境。虽然我们能够将深度学习项目的机制放置好,但实际上没有任何结果是有用的;网络只是
阅读全文
摘要:第二部分:从现实世界的图像中学习:肺癌的早期检测 第 2 部分的结构与第 1 部分不同;它几乎是一本书中的一本书。我们将以几章的篇幅深入探讨一个单一用例,从第 1 部分学到的基本构建模块开始,构建一个比我们迄今为止看到的更完整的项目。我们的第一次尝试将是不完整和不准确的,我们将探讨如何诊断这些问题,
阅读全文
摘要:六、使用神经网络拟合数据 本章内容包括 与线性模型相比,非线性激活函数是关键区别 使用 PyTorch 的nn模块 使用神经网络解决线性拟合问题 到目前为止,我们已经仔细研究了线性模型如何学习以及如何在 PyTorch 中实现这一点。我们专注于一个非常简单的回归问题,使用了一个只有一个输入和一个输出
阅读全文
摘要:四、使用张量表示真实世界数据 本章内容包括 将现实世界的数据表示为 PyTorch 张量 处理各种数据类型 从文件加载数据 将数据转换为张量 塑造张量,使其可以作为神经网络模型的输入 在上一章中,我们了解到张量是 PyTorch 中数据的构建块。神经网络将张量作为输入,并产生张量作为输出。事实上,神
阅读全文
摘要:第一部分:PyTorch 核心 欢迎来到本书的第一部分。在这里,我们将与 PyTorch 迈出第一步,获得理解其结构和解决 PyTorch 项目机制所需的基本技能。 在第一章中,我们将首次接触 PyTorch,了解它是什么,解决了什么问题,以及它与其他深度学习框架的关系。第二章将带领我们进行一次旅行
阅读全文
摘要:原文:https://ar5iv.labs.arxiv.org/html/2212.10559 概述 这篇论文提出了一种新的方法,利用大型预训练语言模型展示了惊人的上下文学习能力。通过少量的示范输入-标签对,它们可以在没有参数更新的情况下预测未见输入的标签。尽管在性能上取得了巨大成功,但其工作机制仍
阅读全文
摘要:原文:hazyresearch.stanford.edu/blog/2024-03-03-based 全体团队:Simran,Sabri,Michael*,Aman,Silas,Dylan,James,Atri,Chris Arxiv:arxiv.org/abs/2402.18668 代码:gith
阅读全文
摘要:原文:https://www.moreusefulthings.com/ 教师提示 本页上的提示(但不包括网站上的其他内容)受知识共享许可证 署名 4.0 国际 的约��。该许可证要求再使用时给予创作者(Lilach Mollick 和 Ethan Mollick)信用。它允许再使用者在任何媒介或格
阅读全文
摘要:PrefixEncoder # 根据前缀 ID 获取前缀嵌入 # 前缀嵌入将连接到分头之后的 K 和 V 上 class PrefixEncoder(torch.nn.Module): """ The torch.nn model to encode the prefix Input shape:
阅读全文

浙公网安备 33010602011771号