faithtwo

2021年10月22日

摘要： numpy.unique numpy.unique 函数用于去除数组中的重复元素 data['date_parsed'] = pd.to_datetime(data['Date'], infer_datetime_format=True) data['date_parsed'] = pd.to_da 阅读全文

posted @ 2021-10-22 17:50 faithtwo 阅读(71) 评论(0) 推荐(0)

2021年10月21日

Pandas 数据结构 - DataFrame 案列

摘要： import pandas as pddata = { "mango": [420, 380, 390], "apple": [50, 40, 45], "pear": [1, 2, 3], "banana": [23, 45,56]}df = pd.DataFrame(data)print(df) 阅读全文

posted @ 2021-10-21 16:37 faithtwo 阅读(61) 评论(0) 推荐(0)

2021年10月19日

十大经典预测算法

摘要：十大经典预测算法（一）线性回归十大经典预测算法（二）逻辑回归十大经典预测算法（四）支持向量机（SVM算法）十大经典预测算法（六）集成学习（模型融合算法）十大经典预测算法（七）随机森林十大经典预测算法（八） ADBOOST 十大经典预测算法（九） GBDT 1. 线性回归在统计学阅读全文

posted @ 2021-10-19 18:53 faithtwo 阅读(34308) 评论(0) 推荐(0)

2021年7月7日

Hive常用数据函数

摘要： CUME_DIST 小于等于当前值的行数/分组内总行数–比如，统计小于等于当前薪水的人数，所占总人数的比例 PERCENT_RANK 分组内当前行的RANK值-1/分组内总行数-1应用场景不了解，可能在一些特殊算法的实现中可以用到吧； having 函数必须和group by 函数一起才可以使用，阅读全文

posted @ 2021-07-07 18:21 faithtwo 阅读(83) 评论(0) 推荐(0)

2021年6月7日

matplotlib.pyplot.plot()参数详解

摘要： matplotlib.pyplot.plot(*args, **kwargs) https://blog.csdn.net/chinwuforwork/article/details/51786967 绘制线条或标记的轴。参数是一个可变长度参数，允许多个X、Y对可选的格式字符串。例如，下面的每一个阅读全文

posted @ 2021-06-07 11:17 faithtwo 阅读(562) 评论(0) 推荐(0)

2021年5月21日

关联性分析

摘要：关联性分析：关联规则学习是一种基于规则的机器学习方法，用于发现大型数据库中变量之间的有趣关系。它旨在使用一些有趣的度量来识别在数据库中发现的强规则。这种基于规则的方法在分析更多数据时也会生成新规则。假设数据集足够大，最终目标是帮助机器模拟人类大脑的特征提取和新未分类数据的抽象关联能力支持度(Sup 阅读全文

posted @ 2021-05-21 18:12 faithtwo 阅读(876) 评论(0) 推荐(0)

数学常见概念解释

摘要：数列（sequence of number），是以正整数集（或它的有限子集）为定义域的函数，是一列有序的数。数列中的每一个数都叫做这个数列的项。排在第一位的数称为这个数列的第1项（通常也叫做首项），排在第二位的数称为这个数列的第2项，以此类推，排在第n位的数称为这个数列的第n项，通常用an表示。收阅读全文

posted @ 2021-05-21 18:00 faithtwo 阅读(490) 评论(0) 推荐(0)

互联网常用词汇

摘要： CTR（Click-Through-Rate）即点击通过率，是互联网广告常用的术语，指网络广告（图片广告/文字广告/关键词广告/排名广告/视频广告等）的点击到达率，即该广告的实际点击次数（严格的来说，可以是到达目标页面的数量）除以广告的展现量（Show content）。投资回报率（ROI）ret 阅读全文

posted @ 2021-05-21 17:35 faithtwo 阅读(484) 评论(0) 推荐(0)

公告