Loading

摘要: 数据结构 本博文纯手打,待完善,不定期更新。 线性表 线性表的类型定义 线性表 (linear_list)是最常用且最简单的一种数据结构。简言之,一个线性表是n个数据元素的有限序列。 一个数据结构可以由若干个 数据项 (item)组成。在这种情况下,常把数据元素称为 记录 (record),含有大量 阅读全文
posted @ 2019-12-16 09:06 pgCai 阅读(314) 评论(0) 推荐(0)
摘要: 数据挖掘经典算法 先描述各种算法的基本知识与优略,后续会推出所有单个算法的具体描述、推导、代码。 C4.5决策树 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法。C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1.用信息增益率来选择属性,克服了用 阅读全文
posted @ 2019-12-06 22:10 pgCai 阅读(425) 评论(0) 推荐(0)
摘要: 数据挖掘(一) 常见库 什么是数据分析与挖掘技术 所谓数据分析,即对已知的数据进行分析,然后提取出一些有价值的信 息,比如统计出平均数、标准差等信息,数据分析的数据量有时可能不 会太大,而数据挖掘,是 指对大量的数据进行分析与挖掘 ,得到一些 未 知的,有价值的信息 等,比如从网站的用户或用户行为数 阅读全文
posted @ 2019-12-06 21:29 pgCai 阅读(610) 评论(0) 推荐(0)
摘要: 一、标题写法: 第一种方法: 1、在文本下面加上 等于号 = ,那么上方的文本就变成了大标题。等于号的个数无限制,但一定要大于0个哦。。 2、在文本下面加上 下划线 - ,那么上方的文本就变成了中标题,同样的 下划线个数无限制。 3、要想输入=号,上面有文本而不让其转化为大标题,则需要在两者之间加一 阅读全文
posted @ 2019-12-05 21:44 pgCai 阅读(462) 评论(0) 推荐(0)
摘要: X ~ :随机变量X的取值和其对应的概率值P(X = ) 满足正态分布(高斯函数) 很多随机现象可以用正态分布描述或者近似描述 某些概率分布可以用正态分布近似计算 正态分布(又称高斯分布)的概率密度函数 numpy中 numpy.random.normal(loc=0.0, scale=1.0, s 阅读全文
posted @ 2019-11-01 19:34 pgCai 阅读(1372) 评论(0) 推荐(0)
摘要: 合并 np.newaxis 分割 阅读全文
posted @ 2019-10-16 08:53 pgCai 阅读(1567) 评论(0) 推荐(0)
摘要: 使用Pandas读取CSV文件 阅读全文
posted @ 2019-09-10 07:26 pgCai 阅读(4472) 评论(0) 推荐(0)
摘要: train loss与test loss结果分析train loss 不断下降,test loss不断下降,说明网络仍在学习;train loss 不断下降,test loss趋于不变,说明网络过拟合;train loss 趋于不变,test loss不断下降,说明数据集100%有问题;train 阅读全文
posted @ 2019-07-19 16:14 pgCai 阅读(2180) 评论(0) 推荐(0)
摘要: zfill方法用来给字符串前面补0 阅读全文
posted @ 2019-07-18 19:30 pgCai 阅读(4283) 评论(0) 推荐(0)
摘要: 转载自 百度知道 id:风_南(https://zhidao.baidu.com/usercenter?uid=e9904069236f25705e799313) 转载只为方便学习复习,侵删。 在用scikit-learn包训练机器学习模型时候,这里举一个训练SVM的例子: 1. 先要按照sciki 阅读全文
posted @ 2019-05-28 22:32 pgCai 阅读(719) 评论(0) 推荐(0)