会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
125
126
127
128
129
130
131
132
133
···
155
下一页
2022年8月3日
细胞图像数据的主动学习
摘要: 通过细胞图像的标签对模型性能的影响,为数据设置优先级和权重。 许多机器学习任务的主要障碍之一是缺乏标记数据。而标记数据可能会耗费很长的时间,并且很昂贵,因此很多时候尝试使用机器学习方法来解决问题是不合理的。 为了解决这个问题,机器学习领域出现了一个叫做主动学习的领域。主动学习是机器学习中的一种方法,
阅读全文
posted @ 2022-08-03 11:11 deephub
阅读(129)
评论(0)
推荐(0)
2022年8月2日
10快速入门Query函数使用的Pandas的查询示例
摘要: pandas.的query函数为我们提供了一种编写查询过滤条件更简单的方法,特别是在的查询条件很多的时候,在本文中整理了10个示例,掌握着10个实例你就可以轻松的使用query函数来解决任何查询的问题。 首先,将数据集导入pandas DataFrame - df import pandas as
阅读全文
posted @ 2022-08-02 11:28 deephub
阅读(136)
评论(0)
推荐(0)
2022年8月1日
使用分类权重解决数据不平衡的问题
摘要: 在分类任务中,不平衡数据集是指数据集中的分类不平均的情况,会有一个或多个类比其他类多的多或者少的多。 在我们的日常生活中,不平衡的数据是非常常见的比如本篇文章将使用一个最常见的例子,信用卡欺诈检测来介绍,在我们的日常使用中欺诈的数量要远比正常使用的数量少很多,对于我们来说这就是数据不平衡的问题。 我
阅读全文
posted @ 2022-08-01 10:42 deephub
阅读(106)
评论(0)
推荐(0)
2022年7月31日
使用内存映射加快PyTorch数据集的读取
摘要: 本文将介绍如何使用内存映射文件加快PyTorch数据集的加载速度 在使用Pytorch训练神经网络时,最常见的与速度相关的瓶颈是数据加载的模块。如果我们将数据通过网络传输,除了预取和缓存之外,没有任何其他的简单优化方式。 但是如果数据本地存储,我们可以通过将整个数据集组合成一个文件,然后映射到内存中
阅读全文
posted @ 2022-07-31 10:21 deephub
阅读(199)
评论(0)
推荐(0)
2022年7月30日
30 个数据工程必备的Python 包
摘要: Python 可以说是最容易入门的编程语言,在numpy,scipy等基础包的帮助下,对于数据的处理和机器学习来说Python可以说是目前最好的语言,在各位大佬和热心贡献者的帮助下Python拥有一个庞大的社区支持技术发展,开发两个各种 Python 包来帮助数据人员的工作。 在本文中,将介绍一些非
阅读全文
posted @ 2022-07-30 10:20 deephub
阅读(142)
评论(0)
推荐(0)
2022年7月29日
6个可解释AI (XAI)的Python框架推荐
摘要: 随着人工智能的发展为了解决具有挑战性的问题,人们创造了更复杂、更不透明的模型。AI就像一个黑匣子,能自己做出决定,但是人们并不清楚其中缘由。建立一个AI模型,输入数据,然后再输出结果,但有一个问题就是我们不能解释AI为何会得出这样的结论。需要了解AI如何得出某个结论背后的原因,而不是仅仅接受一个在没
阅读全文
posted @ 2022-07-29 10:19 deephub
阅读(374)
评论(0)
推荐(0)
2022年7月28日
RepVGG论文详解以及使用Pytorch进行模型复现
摘要: RepVGG: Making VGG-style ConvNets Great Again 是2021 CVPR的一篇论文,正如他的名字一样,使用structural re-parameterization的方式让类VGG的架构重新获得了最好的性能和更快的速度。在本文中首先对论文进行详细的介绍,然后
阅读全文
posted @ 2022-07-28 11:41 deephub
阅读(250)
评论(0)
推荐(0)
2022年7月27日
特征工程中的缩放和编码的方法总结
摘要: 数据预处理是机器学习生命周期的非常重要的一个部分。特征工程又是数据预处理的一个重要组成, 最常见的特征工程有以下一些方法: 编码 缩放 转换 离散化 分离 等等 在本文中主要介绍特征缩放和特征编码的主要方法。 特征缩放 特征缩放是一种在固定范围内对数据中存在的独立特征进行标准化的技术。有些机器学习模
阅读全文
posted @ 2022-07-27 11:00 deephub
阅读(152)
评论(0)
推荐(0)
2022年7月26日
使用三重损失和孪生神经网络训练大型类目的嵌入表示
摘要: 大型网站类目目录的数量很大,一般都无法进行手动标记,所以理解大型目录的内容对在线业务来说是一个重大挑战,并且这使得对于新产品发现就变得非常困难,但这个问题可以通过使用自监督神经网络模型来解决。 在过去我们一直使用人工在系统中进行产品的标记,这样的确可以解决问题但是却耗费了很多人力的成本。如果能够创建
阅读全文
posted @ 2022-07-26 10:19 deephub
阅读(65)
评论(0)
推荐(0)
2022年7月25日
代码的表示学习:CodeBERT及其他相关模型介绍
摘要: 什么是CodeBert CodeBERT是微软在2020年开发的BERT模型的扩展。它是一个用于编程语言(PL)和自然语言(NL)的双峰预训练模型,可以执行下游的(NL-PL)任务,这个模型使用6种编程语言(Python, Java, JavaScript, PHP, Ruby, Go)进行NL-P
阅读全文
posted @ 2022-07-25 10:15 deephub
阅读(808)
评论(0)
推荐(0)
上一页
1
···
125
126
127
128
129
130
131
132
133
···
155
下一页
公告