08 2018 档案

摘要:l = [4,2,5,3,9,8,1] print(l) #冒泡排序 #冒泡排序的时间复杂度为O(n^2)。 ''' for i in range(1,len(l)): for j in range(len(l)-i): if l[j]>l[j+1]: l[j],l[j+1] = l[j+1],l[j] ''' #选择排序 #选择排序的时间复杂度为... 阅读全文
posted @ 2018-08-21 15:14 夜尽天已明 阅读(169) 评论(0) 推荐(0)
摘要:【分类指标】 1.accuracy_score(y_true,y_pre) : 精度 2.auc(x, y, reorder=False) : ROC曲线下的面积;较大的AUC代表了较好的performance。 3.average_precision_score(y_true, y_score,  阅读全文
posted @ 2018-08-12 19:04 夜尽天已明 阅读(19562) 评论(0) 推荐(2)
摘要:【RandomForestClassifier】 参数 n_estimators : 随机森林中树的个数,即学习器的个数。 max_features : 划分叶子节点,选择的最大特征数目 n_features:在寻找最佳分割时要考虑的特征数量 max_depth : 树的最大深度,如果选择defau 阅读全文
posted @ 2018-08-09 18:22 夜尽天已明 阅读(10918) 评论(0) 推荐(2)
摘要:【AdaBoostClassifier】 Adaboost-参数: base_estimator:基分类器,默认是决策树,在该分类器基础上进行boosting,理论上可以是任意一个分类器,但是如果是其他分类器时需要指明样本权重。 n_estimators:基分类器提升(循环)次数,默认是50次,这个 阅读全文
posted @ 2018-08-08 19:04 夜尽天已明 阅读(13551) 评论(0) 推荐(0)
摘要:1.概念 1.1 进程:(有时也称为重量级进程),是一个执行中的程序。每个程序都有自己的地址空间、内存、数据栈以及其他用于跟踪执行的辅助数据。 1.2 线程:线程是操作系统够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并 阅读全文
posted @ 2018-08-06 17:36 夜尽天已明 阅读(185) 评论(0) 推荐(0)
摘要:【LDA】线性判别分析 参数: solver:一个字符串,指定了求解最优化问题的算法,可以为如下的值。 'svd':奇异值分解。对于有大规模特征的数据,推荐用这种算法。 'lsqr':最小平方差,可以结合skrinkage参数。 'eigen' :特征分解算法,可以结合shrinkage参数。 sk 阅读全文
posted @ 2018-08-06 15:47 夜尽天已明 阅读(6164) 评论(0) 推荐(1)
摘要:【API文档大集合】 sklearn API:http://sklearn.apachecn.org/cn/0.19.0/tutorial/index.html pandas API:http://pandas.pydata.org/pandas-docs/stable/api.html matpl 阅读全文
posted @ 2018-08-03 13:46 夜尽天已明 阅读(192) 评论(0) 推荐(0)
摘要:Scrapy框架的架构如下图 具体部分说明: Engine:引擎,处理整个系统的数据流处理,出发事物,是整个框架的核心 Item:项目。定义了爬取结果的数据结构,爬取的数据会被赋值成该Item对象 Scheduler:调度器,接受引擎发过来的请求并将其加入队列中,在引擎再次请求的时候将请求提供给引擎 阅读全文
posted @ 2018-08-01 19:27 夜尽天已明 阅读(318) 评论(0) 推荐(0)