会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
126
127
128
129
130
131
132
133
134
···
155
下一页
2022年7月24日
微调LayoutLM v3进行票据数据的处理和内容识别
摘要: 文档理解是文档处理和提取中最重要的步骤。这是从非结构化或半结构化文档中提取信息并将其转换为结构化形式的过程。提取后的结构化表示可以支持各种下游任务,例如信息检索,汇总,分类等。有许多不同的方法可以理解文档,但它们都有一个共同的目标:创建文档内容的结构化表示,以便用于进一步的处理。 对于半结构化文档,
阅读全文
posted @ 2022-07-24 11:21 deephub
阅读(881)
评论(0)
推荐(0)
2022年7月23日
基于速度、复杂性等因素比较KernelSHAP和TreeSHAP
摘要: KernelSHAP 和 TreeSHAP 都用于近似 Shapley 值。TreeSHAP 的速度很快,但是它只能用于基于树的算法,如随机森林和 xgboost。而KernelSHAP 与模型无关。这意味着它可以与任何机器学习算法一起使用。我们将比较这两种近似方法。 本文中的实验,将展示 Tree
阅读全文
posted @ 2022-07-23 10:56 deephub
阅读(317)
评论(0)
推荐(0)
2022年7月22日
分布式学习和联邦学习简介
摘要: 在这篇文章中,我们将讨论分布式学习和联邦学习的主要原理以及它们是如何工作的。首先,我们从一个简单的单机示例开始,然后将其发展为分布式随机梯度下降(D-SGD),最后是联邦学习(FL)。 集中学习(单机) 一个最简单的例子,我们想学习人的身高和体重之间的线性关系,并且我们拥有100人的体重和身高数据,
阅读全文
posted @ 2022-07-22 11:18 deephub
阅读(220)
评论(0)
推荐(0)
2022年7月21日
使用python手写Metropolis-Hastings算法的贝叶斯线性回归
摘要: 在学习贝叶斯计算的解马尔可夫链蒙特卡洛(MCMC)模拟时,最简单的方法是使用PyMC3,构建模型,调用Metropolis优化器。但是使用别人的包我们并不真正理解发生了什么,所以本文通过手写Metropolis-Hastings来深入的理解MCMC的过程,再次强调我们自己实现该方法并不是并不是为了造
阅读全文
posted @ 2022-07-21 11:14 deephub
阅读(121)
评论(0)
推荐(0)
2022年7月20日
GraphMAE:将MAE的方法应用到图中使图的生成式自监督学习超越了对比学习
摘要: 前几天的文章中我们提到MAE在时间序列的应用,本篇文章介绍的论文已经将MAE的方法应用到图中,这是来自[KDD2022]的论文GraphMAE: Self-supervised Masked Graph Autoencoders 生成学习与对比学习 自监督学习从大量的无监督数据中挖掘出自己需要的的监
阅读全文
posted @ 2022-07-20 10:50 deephub
阅读(295)
评论(0)
推荐(0)
5分钟NLP:Python文本生成的Beam Search解码
摘要: 贪婪搜索是在每个时间步中选择概率最高的单词,也是我们最常用的一种方法,Beam Search不取每个标记本身的绝对概率,而是考虑每个标记的所有可能扩展。然后根据其对数概率选择最合适的标记序列。 例如令牌的概率如下所示: 例如,Pancakes + looks时间段1的概率等效于: Pancakes
阅读全文
posted @ 2022-07-20 10:48 deephub
阅读(52)
评论(0)
推荐(0)
2022年7月19日
使用Python和OCR进行文档解析的完整代码演示
摘要: 在本文中将使用Python演示如何解析文档(如pdf)并提取文本,图形,表格等信息。 文档解析涉及检查文档中的数据并提取有用的信息。它可以通过自动化减少了大量的手工工作。一种流行的解析策略是将文档转换为图像并使用计算机视觉进行识别。而文档图像分析(Document Image Analysis)是指
阅读全文
posted @ 2022-07-19 12:51 deephub
阅读(208)
评论(0)
推荐(1)
2022年7月18日
高斯过程相关研究的新进展的8篇论文推荐(统计 +人工智能)
摘要: 1、Low-Precision Arithmetic for Fast Gaussian Processes Wesley J. Maddox, Andres Potapczynski, Andrew Gordon Wilson https://arxiv.org/abs/2207.06856 低精
阅读全文
posted @ 2022-07-18 09:51 deephub
阅读(229)
评论(0)
推荐(0)
2022年7月17日
图神经网络的可解释性方法介绍和GNNExplainer解释预测的代码示例
摘要: 深度学习模型的可解释性为其预测提供了人类可以理解的推理。如果不解释预测背后的原因,深度学习算法就像黑匣子,对于一些场景说是无法被信任的。不提供预测的原因也会阻止深度学习算法在涉及跨域公平、隐私和安全的关键应用程序中使用。 深度学习模型的可解释性有助于增加对模型预测的信任, 提高模型对与公平、隐私和其
阅读全文
posted @ 2022-07-17 11:02 deephub
阅读(467)
评论(0)
推荐(0)
2022年7月16日
无监督学习的12个最重要的算法介绍及其用例总结
摘要: 无监督学习(Unsupervised Learning)是和监督学习相对的另一种主流机器学习的方法,无监督学习是没有任何的数据标注只有数据本身。 无监督学习算法有几种类型,以下是其中最重要的12种: 1、聚类算法根据相似性将数据点分组成簇 k-means聚类是一种流行的聚类算法,它将数据划分为k组。
阅读全文
posted @ 2022-07-16 11:10 deephub
阅读(921)
评论(0)
推荐(0)
上一页
1
···
126
127
128
129
130
131
132
133
134
···
155
下一页
公告