摘要: numpy.unique numpy.unique 函数用于去除数组中的重复元素 data['date_parsed'] = pd.to_datetime(data['Date'], infer_datetime_format=True) data['date_parsed'] = pd.to_da 阅读全文
posted @ 2021-10-22 17:50 faithtwo 阅读(53) 评论(0) 推荐(0)
摘要: import pandas as pddata = { "mango": [420, 380, 390], "apple": [50, 40, 45], "pear": [1, 2, 3], "banana": [23, 45,56]}df = pd.DataFrame(data)print(df) 阅读全文
posted @ 2021-10-21 16:37 faithtwo 阅读(45) 评论(0) 推荐(0)
摘要: 十大经典预测算法(一) 线性回归 十大经典预测算法(二) 逻辑回归 十大经典预测算法(四) 支持向量机(SVM算法) 十大经典预测算法(六) 集成学习(模型融合算法) 十大经典预测算法(七) 随机森林 十大经典预测算法(八) ADBOOST 十大经典预测算法(九) GBDT 1. 线性回归 在统计学 阅读全文
posted @ 2021-10-19 18:53 faithtwo 阅读(33542) 评论(0) 推荐(0)
摘要: CUME_DIST 小于等于当前值的行数/分组内总行数–比如,统计小于等于当前薪水的人数,所占总人数的比例 PERCENT_RANK 分组内当前行的RANK值-1/分组内总行数-1应用场景不了解,可能在一些特殊算法的实现中可以用到吧 ; having 函数必须和group by 函数一起才可以使用, 阅读全文
posted @ 2021-07-07 18:21 faithtwo 阅读(69) 评论(0) 推荐(0)
摘要: matplotlib.pyplot.plot(*args, **kwargs) https://blog.csdn.net/chinwuforwork/article/details/51786967 绘制线条或标记的轴。参数是一个可变长度参数,允许多个X、Y对可选的格式字符串。 例如,下面的每一个 阅读全文
posted @ 2021-06-07 11:17 faithtwo 阅读(531) 评论(0) 推荐(0)
摘要: 关联性分析:关联规则学习是一种基于规则的机器学习方法,用于发现大型数据库中变量之间的有趣关系。它旨在使用一些有趣的度量来识别在数据库中发现的强规则。这种基于规则的方法在分析更多数据时也会生成新规则。假设数据集足够大,最终目标是帮助机器模拟人类大脑的特征提取和新未分类数据的抽象关联能力 支持度(Sup 阅读全文
posted @ 2021-05-21 18:12 faithtwo 阅读(858) 评论(0) 推荐(0)
摘要: 数列(sequence of number),是以正整数集(或它的有限子集)为定义域的函数,是一列有序的数。数列中的每一个数都叫做这个数列的项。排在第一位的数称为这个数列的第1项(通常也叫做首项),排在第二位的数称为这个数列的第2项,以此类推,排在第n位的数称为这个数列的第n项,通常用an表示。 收 阅读全文
posted @ 2021-05-21 18:00 faithtwo 阅读(434) 评论(0) 推荐(0)
摘要: CTR(Click-Through-Rate)即点击通过率,是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即该广告的实际点击次数(严格的来说,可以是到达目标页面的数量)除以广告的展现量(Show content)。 投资回报率(ROI)ret 阅读全文
posted @ 2021-05-21 17:35 faithtwo 阅读(464) 评论(0) 推荐(0)