上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 34 下一页
摘要: 欠拟合与过拟合 什么是过拟合与欠拟合 欠拟合 过拟合 第一种情况:因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。 第二种情况:机器已经基本能区别天鹅和其他动物了。然后,很不巧已有的天鹅图片全是白天鹅的,于是机器经过学习后,会认为天鹅的羽毛都是白的,以后看到羽毛是黑的天鹅就会 阅读全文
posted @ 2021-01-21 22:24 清风紫雪 阅读(356) 评论(0) 推荐(1)
摘要: 线性回归 什么是线性回归 定义与公式 线性回归(Linear regression)是利用回归方程(函数)对一个或多个自变量(特征值)和因变量(目标值)之间关系进行建模的一种分析方式。 特点:只有一个自变量的情况称为单变量回归,大于一个自变量情况的叫做多元回归 线性回归的特征与目标的关系分析 线性回 阅读全文
posted @ 2021-01-20 20:57 清风紫雪 阅读(362) 评论(0) 推荐(0)
摘要: 朴素贝叶斯算法 朴素 假定特征与特征之间是相互独立的 贝叶斯公式 公式分为三个部分: P(C):每个文档类别的概率(某文档类别数/总文档数量) P(W│C):给定类别下特征(被预测文档中出现的词)的概率P(F1,F2,…) 预测文档中每个词的概率 计算方法:P(F1│C)=Ni/N (训练文档中去计 阅读全文
posted @ 2021-01-19 22:10 清风紫雪 阅读(395) 评论(0) 推荐(1)
摘要: 数据集介绍与划分 数据集的划分 机器学习一般的数据集会划分为两个部分: 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 划分比例: 训练集:70% 80% 75% 测试集:30% 20% 30% API sklearn.model_selection.train_te 阅读全文
posted @ 2021-01-18 23:04 清风紫雪 阅读(630) 评论(0) 推荐(0)
摘要: 特征工程 特征抽取 文本特征提取-CountVectorizer 作用:对文本数据进行特征值化 sklearn.feature_extraction.text.CountVectorizer(stop_words=[]) 返回词频矩阵 CountVectorizer.fit_transform(X) 阅读全文
posted @ 2021-01-17 22:07 清风紫雪 阅读(340) 评论(0) 推荐(0)
摘要: sklearn数据集 数据集API介绍 sklearn.datasets 加载获取流行数据集 datasets.load_*() 获取小规模数据集,数据包含在datasets里 datasets.fetch_*(data_home=None) 获取大规模数据集,需要从网络上下载,函数的第一个参数是d 阅读全文
posted @ 2021-01-16 22:43 清风紫雪 阅读(408) 评论(0) 推荐(0)
摘要: Spark Streaming Spark Streaming 介绍 批量计算 流计算 Spark Streaming 入门 Netcat 的使用 项目实例 目标:使用 Spark Streaming 程序和 Socket server 进行交互, 从 Server 处获取实时传输过来的字符串, 拆 阅读全文
posted @ 2021-01-15 22:35 清风紫雪 阅读(240) 评论(0) 推荐(0)
摘要: 写此文的目的是为了方便寒假自己忘记填问卷星 一开始的想法和去年一样,去年就写过一版,想着今年不过就是改改数据,换换id而已,另外没想到的事情发生了。。。 满怀信心的写完代码 from selenium import webdriver import time import random def ru 阅读全文
posted @ 2021-01-14 22:42 清风紫雪 阅读(2346) 评论(0) 推荐(0)
摘要: 今天要yum点东西到服务器上,然后本地centos6用yum下载包,就报了All mirror URLs are not using ftp, http[s] or file. 终于还是万能的度娘告诉我因为centos6的支持给官方停掉了...... 那你就这样做: sed -i "s|enable 阅读全文
posted @ 2021-01-14 16:26 清风紫雪 阅读(818) 评论(0) 推荐(0)
摘要: A分数 题目描述: 1/1 + 1/2 + 1/4 + 1/8 + 1/16 + .... 每项是前一项的一半,如果一共有20项,求这个和是多少,结果用分数表示出来。类似:3/2当然,这只是加了前2项而已。分子分母要求互质。 思路: 可以知道这是一个等比数列,求前20项的和,在进行化简,gcd即可 阅读全文
posted @ 2021-01-14 11:32 清风紫雪 阅读(211) 评论(0) 推荐(0)
上一页 1 ··· 7 8 9 10 11 12 13 14 15 ··· 34 下一页