随笔分类 -  大数据分析基础

.NET ML 机器学习上手
摘要:打开: visual studio 2019 下载机器学习模块 在 工具->选项->环境-> 新特性中选用 ML 在解决方案管理器中, 添加ML项目. 选择使用场景,进行数据分析 scenario. 提供相关数据集, 并开始训练 对模型进行评分evaluation 建立耗损模型 Consume us 阅读全文
posted @ 2021-01-25 12:09 jude_liu 阅读(235) 评论(0) 推荐(0)
R语言 测试 训练步骤
摘要:1.测试集验证集合 library(ggplot2) library(caret) seed(123456) 设置随机数种子 prop.table(table(xxx字段) index<-createDataParatition xunlianji<- credit[index,] ceshiji< 阅读全文
posted @ 2021-01-24 21:08 jude_liu 阅读(533) 评论(0) 推荐(0)
R 语言描述性 数据分析 步骤
摘要:1. summary 、str、names、table -》 大体数据 2. mean、sum 、complete.cases、aggr(xxx,prop=false,numbers=true) -》 缺失值 引用: library(lattice) library(grid) library(mi 阅读全文
posted @ 2021-01-24 19:55 jude_liu 阅读(502) 评论(0) 推荐(0)
极大似然估计四个步骤
摘要:极大似然估计参数估计的四个步骤 (1) 写出似然函数; (2) 对似然函数取对数,并整理; (3) 求导数 ; (4) 解似然方程 。 极大似然估计的概念 极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就 阅读全文
posted @ 2021-01-24 16:44 jude_liu 阅读(3816) 评论(0) 推荐(0)
为啥有了标准差,还要方差
摘要:转载自: https://www.zhihu.com/question/20534502 为啥有了标准差,还要方差 自动最终我们想要的是标准差,方差只不过是计算的中间过程。 阅读全文
posted @ 2021-01-19 12:42 jude_liu 阅读(639) 评论(0) 推荐(0)
报错package xxx is not in GOROOT or GOPATH 或者 cannot find package “xxx“ in any of
摘要:GO111MODULE=“off” 在GO111MODULE="off"的条件下,并且写的代码不在$GOPATH/src下,也就是说下面的main.go不在$GOPATH/src目录下面,同时我想要使用另一个module里面的内容,并且这个module不是标准库,或者说不在GOROOT里(一般我们不 阅读全文
posted @ 2021-01-19 12:18 jude_liu 阅读(1571) 评论(0) 推荐(2)
正态分布(Normal distribution)也称“常态分布”,又名高斯分布
摘要:常用希腊字母符号: 正态分布公式 曲线可以表示为:称x服从正态分布,记为 X~N(m,s2),其中μ为均值,s为标zhuan准差,X∈(-∞,+ ∞ )。 其中 根号2侧部分 可以看成 密度函数的积分为1,你就可以看成为了凑出来1特意设置的 一个 框架 无实际意义。 标准正态分布另正态分布的μ为0, 阅读全文
posted @ 2021-01-02 19:09 jude_liu 阅读(4694) 评论(0) 推荐(0)
广义线性模型
摘要:拟合出一个线性回归 表示 加权及其结果 : f(x) = wtx+b , 一堆样本中。找到分割线 , 这是条简单直线,但是 现实中 没 这么简单 损失函数. J(Q) HQ(x) = g(Q0 + Q1X1+Q2X2+Q3X3) G函数 把 曲线转换为 直线 , 就是 广义线性模型 G函数 又叫。s 阅读全文
posted @ 2021-01-02 11:51 jude_liu 阅读(190) 评论(0) 推荐(0)
逻辑回归表达式
摘要:预测函数表示为 H 函数 , 该函数是需要造出来的 分类函数 ,用来对输入数据预测结果 。这个模型创造的过程,需要对数据有大概了解, 或者可以猜测使用的预测函数大概形式 , 比如是 线性函数还是非线性函数模型。 损失函数表示为 J 函数(cost), 该模型用来预测 H函数输出结果 与 训练数据类别 阅读全文
posted @ 2021-01-02 11:45 jude_liu 阅读(517) 评论(0) 推荐(0)
逻辑回归概念
摘要:线形回归 输出值为连续性变量 ,可以无限延伸, 逻辑回归输出是一个概率,概率为0 和 1 之间 , 属于分类算法。 阅读全文
posted @ 2021-01-02 11:36 jude_liu 阅读(236) 评论(0) 推荐(0)