会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Loading
七年的万事屋
谨言慎行
博客园
首页
新随笔
联系
订阅
管理
2022年3月7日
Doccano数据标注工具 - 自动标注(Auto-Labeling)功能
摘要: 图片如果看不到的可以点击这里:【FlowUs 息流】Doccano数据标注工具 - 自动标注(Auto-Labeling)功能 最近在使用Doccano标注数据时一直不明白Auto Labeling功能怎么使用,后来在Doccano的issue里看到了使用方式,记录一下 编写 api 接口并运行 f
阅读全文
posted @ 2022-03-07 20:23 七年i
阅读(3598)
评论(6)
推荐(0)
2021年12月29日
《GPT Understands, Too》论文主要部分翻译
摘要: 3.1 结构 Prompt \(\mathbf{p}\) 的功能是将 context \(\mathbf{x}\) ,target \(\mathbf{y}\) 和自身组成一个模板 \(T\) 。例如,在预测一个国家的首都(LAMA-TREx P36)任务中,模板可以为 "The capital o
阅读全文
posted @ 2021-12-29 14:09 七年i
阅读(382)
评论(0)
推荐(0)
2021年7月13日
卡尔曼滤波原理详解
摘要: 卡尔曼滤波原理详解 1. 什么是卡尔曼滤波 你可以在任何含有不确定信息的动态系统中使用卡尔曼滤波,对系统下一步的走向做出有根据的预测,即使伴随着各种干扰,卡尔曼滤波总是能指出真实发生的情况。 在连续变化的系统中使用卡尔曼滤波是非常理想的,它具有占用内存小的优点(除了前一个状态量外,不需要保留其它历史
阅读全文
posted @ 2021-07-13 11:33 七年i
阅读(2447)
评论(0)
推荐(1)
2021年7月11日
神经网络最优化过程
摘要: 1. 最优化(Optimization) 定义:最优化是寻找能使得损失函数值最小化的参数W的过程。 注:给的是损失优化问题的一个简单定义,并不是完整的最优化数学定义。 给定函数$f(x)$,其中$x$是输入数据的向量,需要计算函数$f(x)$相对于$x$的梯度,也就是$\Delta f(x)$ 1.
阅读全文
posted @ 2021-07-11 09:02 七年i
阅读(498)
评论(0)
推荐(0)
深度学习优化算法
摘要: 1. 优化算法 优化的目标在于降低训练损失,只关注最小化目标函数上的表现,优化算法通常只考虑最小化目标函数(损失函数)。 1.1. 局部最优 当一个优化问题的数值解在局部最优解附近时,由于目标函数有关解的梯度接近或变成零,最终迭代求得的数值解可能只能令目标函数局部最小化而非全局最小化。 1.2. 鞍
阅读全文
posted @ 2021-07-11 08:55 七年i
阅读(502)
评论(0)
推荐(0)
2021年5月4日
SVM中强对偶关系的简单推导
摘要: 定义原问题(Primal Problem) 最小化:\(f(w)\) 限制条件: \(g_i(w)\le0\ \ \ (i=1,2,...,K)\) \(h_i(w)=0\ \ \ (i=1,2,...,M)\) 不难看出这是一个非常普适性的定义,因为: 如果要求的是最大化 \(f(w)\) 问题,
阅读全文
posted @ 2021-05-04 21:08 七年i
阅读(347)
评论(0)
推荐(0)
2021年5月2日
机器学习笔记01. K-近邻算法
摘要: 1.1. K-近邻算法(KNN)概念 K Nearest Neighbor算法又叫KNN算法 定义: 如果一个样本在特征空间中的k个最相似(即特征空间中最近邻)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 距离公式: 两个样本的距离可以通过如下公式计算,又叫欧式距离 二维平面上点 \(a
阅读全文
posted @ 2021-05-02 15:15 七年i
阅读(381)
评论(0)
推荐(0)
机器学习项目的流程
摘要: 1. 抽象为数学问题 明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。 这里的抽象成数学问题,指的明确我们可以获得什么样的数据,抽象出的问题,是一个分类还是回归或者是聚类的问题。 2. 获取数据 数据决定了机器学习结果的上限,而算法只是尽可能
阅读全文
posted @ 2021-05-02 15:07 七年i
阅读(202)
评论(0)
推荐(0)
Pandas-09-综合案例
摘要: 1. 需求分析 现在有一组从2006年到2016年1000部最流行的电影数据 数据来源:https://www.kaggle.com/damianpanek/sunday-eda/data 问题1:我们想知道这些电影数据中评分的平均分,导演的人数等信息,我们应该怎么获取? 问题2:对于这一组电影数据
阅读全文
posted @ 2021-05-02 15:05 七年i
阅读(135)
评论(0)
推荐(0)
Pandas-08-分组与聚合
摘要: 1. 解释 分组与聚合通常是分析数据的一种方式,通常与一些统计函数一起使用,查看数据的分组情况。 其实交叉表与透视表也有分组的功能,所以算是分组的一种形式,只不过它们主要是计算次数或者计算比例。 要注意抛开聚合谈分组是没有意义的。 2. 分组API DataFrame.groupby(key, as
阅读全文
posted @ 2021-05-02 15:04 七年i
阅读(131)
评论(0)
推荐(0)
下一页
公告