上一页 1 ··· 4 5 6 7 8 9 下一页
摘要: 一句话描述:在特征条件独立的情况下,学习(X,Y)的联合概率分布,给定新的X,计算后验概率最大的Y作为其输出。 基本方法 前提假设: 条件独立假设指用于分类的特征在类确定的情况下是条件独立的。 用于分类的特征的分布不受类别变量的影响。 用于分类的特征向量均为布尔型随机变量。 过程: 利用训练数据估计 阅读全文
posted @ 2020-11-25 22:57 unuliha 阅读(177) 评论(0) 推荐(0)
摘要: 模型选择的目的是使学到的模型对已知数据和未知数据都有较好的预测能力,同时又要避免过拟合。所考察的指标主要是模型的训练误差及测试误差,模型的复杂度越高,训练误差越小,但测试误差先减小后增大。 训练误差和测试误差随模型复杂度变化趋势 过拟合是指模型的复杂度比真模型更高,模型选择就是选择测试误差最小的适当 阅读全文
posted @ 2020-11-25 21:12 unuliha 阅读(537) 评论(0) 推荐(0)
摘要: 一、 源起 女友上班有时需要新建多个名称类似(英文/中文前缀+数字后缀)的文件夹,修改某个目录下所有文件/文件夹的名称,修改某个目录下所有文件的格式为指定格式,如果直接复制粘贴,挨个修改名称及格式的话确实令人不太愉快,所以想着做一个工具解决一下这个问题。 二、 成果展示 按着她的要求,简单操作,页面 阅读全文
posted @ 2020-11-24 22:28 unuliha 阅读(1603) 评论(0) 推荐(0)
摘要: 任务:西游记字频统计,词频统计。 工具:sql sever2012、图悦。 数据:西游记.txt 结果: sql代码: -- 字符统计 DECLARE @len int,@i int; DECLARE @str nchar(1000); -- 用临时表#array建立统计数组 if object_i 阅读全文
posted @ 2020-07-20 10:01 unuliha 阅读(1211) 评论(0) 推荐(0)
摘要: 工具:Navicat Premium 封装的mysql。 1.表的创建 -- 创建数据库 create database school; use school; -- 建表 -- 学生表:学生编号,学生姓名, 出生年月,学生性别 create table Student(s_id varchar(1 阅读全文
posted @ 2020-07-12 15:50 unuliha 阅读(1097) 评论(0) 推荐(0)
摘要: 前言 对数据集进行分组并对各组进行聚合或转换,是数据分析工作的重要环节。Pandas提供的groupby功能以一种自然的方式对数据集进行切片、切块、摘要等操作。具体地,包括以下功能: 计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。 组内数据转换及运算,如归一化、线性回归、组内排名、子集 阅读全文
posted @ 2020-05-22 15:02 unuliha 阅读(996) 评论(0) 推荐(0)
摘要: s = pd.Series(['Tom', 'William Rick', 'John', 'Alber@t', np.nan, '1234','SteveMinsu']) s.str#不能对series对象使用str处理函数,必须转换成pandas.core.strings.StringMetho 阅读全文
posted @ 2020-05-01 09:57 unuliha 阅读(746) 评论(0) 推荐(0)
摘要: unsorted_df=pd.DataFrame(np.random.randn(10,2),index=[1,4,6,2,3,5,9,8,0,7], columns=['col2','col1']) 8.1 按索引进行排序(sort_index()) ### 按索引排序,需要指定轴和方向,默认为列 阅读全文
posted @ 2020-05-01 09:46 unuliha 阅读(6861) 评论(0) 推荐(1)
摘要: N=20 ### 直接列名迭代 df = pd.DataFrame({ 'A': pd.date_range(start='2016-01-01',periods=N,freq='D'), 'x': np.linspace(0,stop=N-1,num=N), 'y': np.random.rand 阅读全文
posted @ 2020-04-30 11:19 unuliha 阅读(733) 评论(0) 推荐(0)
摘要: 6.1 reindex() 直接修改索引(相当于截取原 df 的子集) N=20 df = pd.DataFrame({ 'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),#freq设置步长,默认D表示日 'x': np.linspa 阅读全文
posted @ 2020-04-30 11:16 unuliha 阅读(8097) 评论(0) 推荐(1)
上一页 1 ··· 4 5 6 7 8 9 下一页