上一页 1 ··· 55 56 57 58 59 60 61 62 63 ··· 67 下一页
摘要: 阅读全文
posted @ 2022-03-10 15:16 笨笨和呆呆 阅读(58) 评论(0) 推荐(0)
摘要: 我来表露下个人浅显的理解。半正定与正定矩阵同意用半正定矩阵来事例: 首先半正定矩阵定义为: 其中X 是向量,M 是变换矩阵 我们换一个思路看这个问题,矩阵变换中,代表对向量 X进行变换,我们假设变换后的向量为Y,记做。于是半正定矩阵可以写成: 这个是不是很熟悉呢? 他是两个向量的内积。 同时我们也有 阅读全文
posted @ 2022-03-10 13:42 笨笨和呆呆 阅读(154) 评论(0) 推荐(0)
摘要: https://www.zhihu.com/question/36301367/answer/156102040?ivk_sa=1024320u 核心在于: 方向导数,梯度方向,梯度三个词是不一样的 方向导数是一个值,一个切平面存在无数方向导数 梯度方向是在无数方向导数中找出值最大的那条切线,其切线 阅读全文
posted @ 2022-03-10 10:37 笨笨和呆呆 阅读(463) 评论(0) 推荐(0)
摘要: https://jingyan.baidu.com/article/6181c3e07a783f542ef153c9.html 阅读全文
posted @ 2022-03-09 10:34 笨笨和呆呆 阅读(364) 评论(0) 推荐(0)
摘要: 现有a = [1,2,3,4,5],现需要进行对a进行反转 方法1:list(reversed(a)) reversed(a)返回的是迭代器,所以前面加个list转换为list 方法2:sorted(a,reverse=True) 方法3:a[: :-1] 其中[::-1]代表从后向前取值,每次步进 阅读全文
posted @ 2022-03-09 09:19 笨笨和呆呆 阅读(555) 评论(0) 推荐(0)
摘要: 目的其实就是为了控制变量。 比如说你为了提升baseline的性能,给它加了两个模块A,B,加完之后效果果然提高了很多。于是你急急忙忙开始写论文,写到你的贡献,你给了两条:1.模块A,2.模块B。 但是这样写有个问题:尽管AB同时加上去对模型有提升效果,但是你并没有证明A、B两个模块分别都是有意义的 阅读全文
posted @ 2022-03-07 15:07 笨笨和呆呆 阅读(102) 评论(0) 推荐(0)
摘要: 对于严格凸函数,eg y=x^2 如果f(x)满足对任意x1 ≠ x2,都有f((x1+x2)/2) < (f(x1)+f(x2))/2.那么f(x)的Jensen不等式只有在各变量都相等时取等(x1=x2=.....xn) 所以如果想既满足x1 ≠ x2,又满足f((x1+x2)/2) = (f( 阅读全文
posted @ 2022-03-04 11:37 笨笨和呆呆 阅读(1207) 评论(0) 推荐(0)
摘要: 优先级 逗号>分号(用在固定参数)=竖线(用在变量分布) 频率派认为参数是固定值,贝叶斯派认为参数服从一个分布,但这2个式子代表一样的含义就是求条件概率 阅读全文
posted @ 2022-03-03 10:05 笨笨和呆呆 阅读(1120) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2022-03-02 15:58 笨笨和呆呆 阅读(44) 评论(0) 推荐(0)
摘要: 启发式方法(试探法)是一种帮你寻求答案的技术,但它给出的答案是具有偶然性的(subject to chance),因为启发式方法仅仅告诉你该如何去找,而没有告诉你要找什么。它并不告诉你该如何直接从A 点到达B 点,它甚至可能连A点和B点在哪里都不知道。实际上,启发式方法是穿着小丑儿外套的算法:它的结 阅读全文
posted @ 2022-03-02 10:50 笨笨和呆呆 阅读(1587) 评论(0) 推荐(0)
上一页 1 ··· 55 56 57 58 59 60 61 62 63 ··· 67 下一页