会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
86
87
88
89
90
91
92
93
94
···
139
下一页
2023年3月21日
NLP / LLMs中的Temperature 是什么?
摘要: ChatGPT, GPT-3, GPT-3.5, GPT-4, LLaMA, Bard等大型语言模型的一个重要的超参数 大型语言模型能够根据给定的上下文或提示生成新文本,由于神经网络等深度学习技术的进步,这些模型越来越受欢迎。可用于控制生成语言模型行为的关键参数之一是Temperature 参数。在
阅读全文
posted @ 2023-03-21 10:16 deephub
阅读(230)
评论(0)
推荐(0)
2023年3月20日
Pandas 2.0 简单介绍和速度评测
摘要: Pandas是机器学习中最常用的一个库了,我们基本上每天都会使用它。而pandas使用了一个“NumPy”作为后端,这个我们也都是知道的,但是最近 Pandas 2.0 的RC版已经最近发布了。这个版本主要包括bug修复、性能改进和增加Apache Arrow后端。当涉及到使用DF时,Arrow比N
阅读全文
posted @ 2023-03-20 10:32 deephub
阅读(101)
评论(0)
推荐(0)
2023年3月19日
2023年3月的10篇论文推荐
摘要: 三月有很多的重大产品发布,包括刚刚发布的GPT4,还有Meta刚发布就被泄露的LLaMA,midjourney V5,还有ChatGPT的API(非常便宜)等等。 但是本文整理的是本月应该阅读的10篇论文,将包括多模态语言模型、扩散模型、机器翻译等主题。 1、LLaMA: Open and Effi
阅读全文
posted @ 2023-03-19 09:56 deephub
阅读(81)
评论(0)
推荐(0)
2023年3月18日
CLIP:语言-图像表示之间的桥梁
摘要: 最近GPT4的火爆覆盖了一个新闻:midjourney v5发布,DALLE2,midjourney都可以从文本中生成图像,这种模型要求人工智能同时理解语言和图像数据。 传统的基于人工智能的模型很难同时理解语言和图像。因为自然语言处理和计算机视觉一直被视为两个独立的领域,这使得机器在两者之间进行有效
阅读全文
posted @ 2023-03-18 11:25 deephub
阅读(169)
评论(0)
推荐(0)
2023年3月17日
GPT-4 和ChatGPT API的定价分析
摘要: OpenAI发布了他们的ChatGPT新机器学习模型GPT-4。GPT-4是GPT-3的一大进步,GPT-3是当前ChatGPT免费版本(GPT 3.5 Turbo)所运行的模型的基础,今天我们也来凑个热点,研究一下它们的定价 GPT-4新的功能 GPT-4可以在对话中使用图像,并可以回答有关图像的
阅读全文
posted @ 2023-03-17 13:06 deephub
阅读(480)
评论(0)
推荐(0)
2023年3月16日
处理缺失值的三个层级的方法总结
摘要: 缺失值是现实数据集中的常见问题,处理缺失值是数据预处理的关键步骤。缺失值可能由于各种原因而发生,例如数据的结构和质量、数据输入错误、传输过程中的数据丢失或不完整的数据收集。这些缺失的值可能会影响机器学习模型的准确性和可靠性,因为它们可能会引入偏差并扭曲结果,有些模型甚至在在缺少值的情况下根本无法工作
阅读全文
posted @ 2023-03-16 11:06 deephub
阅读(52)
评论(0)
推荐(0)
2023年3月15日
SDG,ADAM,LookAhead,Lion等优化器的对比介绍
摘要: 本文将介绍了最先进的深度学习优化方法,帮助神经网络训练得更快,表现得更好。有很多个不同形式的优化器,这里我们只找最基础、最常用、最有效和最新的来介绍。 优化器 首先,让我们定义优化。当我们训练我们的模型以使其表现更好时,首先使用损失函数,训练时损失的减少表明我们的模型运行良好。而优化是用来描述这种减
阅读全文
posted @ 2023-03-15 11:29 deephub
阅读(191)
评论(0)
推荐(0)
2023年3月14日
集成时间序列模型提高预测精度
摘要: 使用Catboost从RNN、ARIMA和Prophet模型中提取信号进行预测 集成各种弱学习器可以提高预测精度,但是如果我们的模型已经很强大了,集成学习往往也能够起到锦上添花的作用。流行的机器学习库scikit-learn提供了一个StackingRegressor,可以用于时间序列任务。但是St
阅读全文
posted @ 2023-03-14 10:42 deephub
阅读(71)
评论(0)
推荐(0)
2023年3月13日
图神经网络的数学原理总结
摘要: 图深度学习(Graph Deep Learning) 多年来一直在加速发展。许多现实生活问题使GDL成为万能工具:在社交媒体、药物发现、芯片植入、预测、生物信息学等方面都显示出了很大的前景。 本文将流行的图神经网络及其数学细微差别的进行详细的梳理和解释,图深度学习背后的思想是学习具有节点和边的图的结
阅读全文
posted @ 2023-03-13 12:02 deephub
阅读(67)
评论(0)
推荐(0)
2023年3月12日
少样本学习综述:技术、算法和模型
摘要: 机器学习最近取得了很大的进展,但仍然有一个主要的挑战:需要大量的标记数据来训练模型。 有时这种数据在现实世界中是无法获得的。以医疗保健为例,我们可能没有足够的x光扫描来检查一种新的疾病。但是通过少样本学习可以让模型只从几个例子中学习到知识! 所以少样本学习(FSL)是机器学习的一个子领域,它解决了只
阅读全文
posted @ 2023-03-12 09:58 deephub
阅读(78)
评论(0)
推荐(0)
上一页
1
···
86
87
88
89
90
91
92
93
94
···
139
下一页
公告