05 2018 档案

摘要:import requests import json import pandas as pd import time import re headers = { 'User-Agent': 'XXXX', 'Cookie': 'XXX'} def get_ad(page): url = 'https://m.weibo.cn/api/container/getIn... 阅读全文
posted @ 2018-05-18 18:12 Erick-LONG 阅读(522) 评论(1) 推荐(0)
摘要:class MaxHeap(object): # def __init__(self): # self.data = [] # 创建堆 # self.count = len(self.data) # 元素数量 def __init__(self, arr): self.data = copy.copy(arr) sel... 阅读全文
posted @ 2018-05-16 15:49 Erick-LONG 阅读(184) 评论(0) 推荐(0)
摘要:上四分位数 quantile(0.75)下四分位数间距= 上四分位数-下四分位数k =1.5 形变 原始数据 < 上四分位数 + k *间距 异常值 原始数据 > 下四分位数 - k *间距 isnull()空置均值标准差均值最大最小值偏度 skew()峰度系数 kurt() 次数 value_co 阅读全文
posted @ 2018-05-15 19:18 Erick-LONG 阅读(151) 评论(0) 推荐(0)
摘要:衡量线性回归模型误差的三种方式 计算最终模型预测准确度R方 阅读全文
posted @ 2018-05-13 09:12 Erick-LONG 阅读(772) 评论(0) 推荐(0)
摘要:from werkzeug.routing import BaseConverter app = Flask(__name__) class TeleConveter(BaseConverter): regex = r'1[85734]\d{9}' @app.route('/tele//') def he(my_tel): return 'Hello World! %s'%... 阅读全文
posted @ 2018-05-11 07:49 Erick-LONG 阅读(293) 评论(0) 推荐(0)
摘要:自己实现数据归一化类 阅读全文
posted @ 2018-05-09 10:08 Erick-LONG 阅读(320) 评论(0) 推荐(0)
摘要:是否考虑距离这个参数 #欧拉距离平方,1次方为曼哈顿距离,3次及以上为明可夫斯基距离 阅读全文
posted @ 2018-05-08 17:12 Erick-LONG 阅读(2052) 评论(0) 推荐(0)
摘要:自己实现 sklearn自带精准度 阅读全文
posted @ 2018-05-08 16:32 Erick-LONG 阅读(760) 评论(0) 推荐(0)
摘要:自己实现 sklearn带的分类器‘ 利用KNN算法测试 判断准确率 阅读全文
posted @ 2018-05-08 15:13 Erick-LONG 阅读(398) 评论(0) 推荐(0)
摘要:import numpy as np from math import sqrt from collections import Counter class KNNClassifier(object): """docstring for KNNClassifier""" def __init__(self, k): assert k>=1,"k must be ... 阅读全文
posted @ 2018-05-08 13:16 Erick-LONG 阅读(318) 评论(0) 推荐(0)