摘要: 说明:本文重在说明交易数据统计、分析方法,所有数据均为生成的数据 时间原因代码未定义成函数 统计指标:1.用户单日交易行为数据 2.按小时为计算单位,统计用户行为数据(旨在求得一天24小时中每个小时的交易金额、交易量和后再做统计计算) 获取数据代码如下: 在juoyter-notebook中 导入所 阅读全文
posted @ 2019-05-17 11:13 TTT周清风 阅读(677) 评论(0) 推荐(0) 编辑
摘要: 需要改动三个地方: 1.models.py 创建模型User,并继承原模型类AbstraUser(在此处我增加了一个新的字段手机号) 2.settings.py 新增设置如下,‘first_app’为你的app的名字,‘User’为models.py中第1步新创建的类名(也就是新的表名,此处仍使用原 阅读全文
posted @ 2019-05-09 13:21 TTT周清风 阅读(1309) 评论(0) 推荐(1) 编辑
摘要: 前提说明: 1.Hadoop与spark是两个独立的框架,只安装spark也可独立运行,spark有自己的调度器(standalone模式); 2.在Hadoop的基础上安装spark就是为了使用yarn调度器与Hadoop的hdfs存储; 3.如果你只想安装spark,可不用看Hadoop的安装, 阅读全文
posted @ 2019-05-02 17:14 TTT周清风 阅读(860) 评论(0) 推荐(0) 编辑
摘要: 备注还没来得及写,共爬取八千多的歌手,每名歌手平均三十首歌曲算,大概二十多万首歌曲 run.py kugou.py items.py pipelines.py settings.py 阅读全文
posted @ 2018-09-13 09:03 TTT周清风 阅读(794) 评论(0) 推荐(0) 编辑
摘要: 上面的代码等价于下面的代码: 两者的运行结果也都是一样的: 主函数运行之前None 也许你会很奇怪,为什么用print(test(2, 3, 4, ))会返回None,我当时也是一头雾水,下面我就解释一下这是为什么,这还是跑不了装饰器原理,一定要理解其原理。 以上面的两段代码为例,@foo替代了te 阅读全文
posted @ 2018-07-29 17:50 TTT周清风 阅读(237) 评论(0) 推荐(0) 编辑
摘要: 1 import random 2 import time 3 4 5 class Player: 6 def __init__(self): 7 self.name = "老张" 8 self.fist = "你这样会报错" 9 self.score = 0 10 11 def pla... 阅读全文
posted @ 2018-07-21 14:04 TTT周清风 阅读(502) 评论(1) 推荐(0) 编辑
摘要: 见代码 阅读全文
posted @ 2018-07-21 14:01 TTT周清风 阅读(176) 评论(0) 推荐(0) 编辑
摘要: 1 def sort_list_method_1(a): 2 return sorted(a) 3 4 5 print(sort_list_method_1([1, 4, 2])) 6 7 8 def sort_list_method_2(a): 9 for i in range(len(a)): 阅读全文
posted @ 2018-07-05 21:10 TTT周清风 阅读(711) 评论(1) 推荐(0) 编辑
摘要: 1 def week(today, n): 2 s = n % 7 + today 3 return "n天后是星期:{}".format(s) 4 5 6 print(week(1, 3)) 阅读全文
posted @ 2018-07-05 21:00 TTT周清风 阅读(356) 评论(0) 推荐(0) 编辑
摘要: 1 a = [1, 2, 3] 2 b = [4, 5, 6] 3 4 5 def sum_super(* args): 6 s = 0 7 for i in args: 8 s += sum(i) 9 return s 10 11 12 # print(sum_super(a, b)) 阅读全文
posted @ 2018-07-05 20:56 TTT周清风 阅读(131) 评论(0) 推荐(0) 编辑