随笔分类 -  机器学习

摘要:联合概率 1.贝叶斯公式 阅读全文
posted @ 2018-12-12 20:06 do+better 阅读(209) 评论(0) 推荐(0)
摘要:数据+算法->项目 原理性:各类模型原理 评估准则 应用性:数据处理方式,清洗,降维,缺失值,格式组织 特征工程:选择降维,数值,类别,时间,等 模型调优:单模型,集成,过拟合 机器学习:监督学习,无监督学习 判别模型(LR,SVM),生成模型(朴素贝叶斯) 损失函数:分类,回归, 优化:最小二乘, 阅读全文
posted @ 2018-11-26 14:23 do+better 阅读(239) 评论(0) 推荐(0)
摘要:BM25算法是一种常见用来做相关度打分的公式,思路比较简单,主要就是计算一个query里面所有词和文档的相关度,然后在把分数做累加操作,而每个词的相关度分数主要还是受到tf/idf的影响。公式如下: R(qi,d)是每个词和文档的相关度值,其中qi代表每个词,d代表相关的文档,Wi是这个词的权重,然 阅读全文
posted @ 2018-11-19 10:21 do+better 阅读(230) 评论(0) 推荐(0)
摘要:#删除已有文件夹hadoop fs -rmr /sxydata/input/example_1hadoop fs -rmr /sxydata/output/example_1 #创建输入文件夹hadoop fs -mkdir /sxydata/input/example_1 #放入输入文件hadoo 阅读全文
posted @ 2018-11-15 16:43 do+better 阅读(127) 评论(0) 推荐(0)
摘要:极限: 函数 f 在 x0 处的极限为 L:limx→x0 f(x) = L 精确描述:ϵ − δ 语言:对于任意的正数 ϵ > 0, 存在正数 δ, 使得任何满足 |x − x0| < δ 的 x, 都有 |f(x) − L| < ϵ 极限中的无穷小阶数(Definition): **表示无穷小逼 阅读全文
posted @ 2018-06-20 10:54 do+better 阅读(913) 评论(0) 推荐(0)
摘要:input 128 corner AlexNet:2012年 Image inner CNN 7层 VGGNet:16层,19层 GoogleNet:inception V1....V4 ResNet 随着网络深度增加,我的treeerror和feiding错误增加,大众误区 3*3 resBloc 阅读全文
posted @ 2017-11-27 09:53 do+better 阅读(133) 评论(0) 推荐(0)
摘要:https://www.data.gov/ 阅读全文
posted @ 2017-10-22 10:41 do+better 阅读(96) 评论(0) 推荐(0)
摘要:mian 阅读全文
posted @ 2017-09-27 20:09 do+better 阅读(91) 评论(0) 推荐(0)
摘要:寻求帮助: help(帮助),dir(pd) import pandas ad pd help(pd) dir(pd) 2.python程序基础 +-*/ // ** 4+5=9 4-5.1=-1.09999999 6/4=1.5 pyhton3 6//4 = 1 4**0.5 = 2.0 4%3= 阅读全文
posted @ 2017-09-25 22:05 do+better 阅读(95) 评论(0) 推荐(0)
摘要:可以尝试http://127.0.0.1:8888/tree 阅读全文
posted @ 2017-05-26 11:48 do+better 阅读(3205) 评论(0) 推荐(0)