上一页 1 2 3 4 5 6 7 8 9 ··· 20 下一页
摘要: 1 import requests 2 import os 3 import shutil 4 import time 5 6 7 class PostBarSpider(object): 8 def __init__(self, post_bar, page_number, file_dir): 9 # 爬取某个贴吧前多少页内容 10 ... 阅读全文
posted @ 2019-03-14 21:13 tele 阅读(574) 评论(0) 推荐(0) 编辑
摘要: 前面在讲git的基本使用时提到过HEAD指向当前版本,但具体的情况是HEAD指向当前分支,当前分支指向最新的提交也就是当前版本 1.分支的创建与切换 查看当前分支 git branch,可以看到是默认的master分支 创建一个新的分支然后切换到新分支 git branch new_branch g 阅读全文
posted @ 2019-03-11 21:49 tele 阅读(173) 评论(0) 推荐(0) 编辑
摘要: 1.下载 windows :用淘宝的镜像 https://npm.taobao.org/mirrors/git-for-windows/ linux : yum install git可以参考:https://git-scm.com/download/linux 2.简单介绍 git中有两个概念比较 阅读全文
posted @ 2019-03-10 19:36 tele 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 用的本地模式,pom.xml中添加了mysql驱动包,mysql已经开启,写入的时候发现用format("jdbc").save()的方式发现会有does not allow create table as select的异常,于是去官方文档上发现了使用jdbc()的方式,测试 正常,说明下Prop 阅读全文
posted @ 2019-02-19 14:39 tele 阅读(1230) 评论(0) 推荐(0) 编辑
摘要: 根据官方文档的说法,要把hive-site.xml,core-site.xml,hdfs-site.xml拷贝到spark的conf目录下,保证mysql已经启动 java scala 阅读全文
posted @ 2019-02-18 20:23 tele 阅读(679) 评论(0) 推荐(0) 编辑
摘要: java scala 阅读全文
posted @ 2019-02-17 17:06 tele 阅读(1286) 评论(0) 推荐(0) 编辑
摘要: java scala 阅读全文
posted @ 2019-02-17 14:04 tele 阅读(805) 评论(0) 推荐(0) 编辑
摘要: 网上找的大部分资料都很旧,最后翻了下文档只找到了说明 大概意思是1.6之后如果想要使用分区推断就要设置数据源的basePath,因此代码如下 java (注意basePath与实际的parquet文件的路径,basePath是分区推断列之前的路径) scala scala的版本用的本地路径,测试发现 阅读全文
posted @ 2019-02-15 20:08 tele 阅读(1094) 评论(0) 推荐(0) 编辑
摘要: java scala 阅读全文
posted @ 2019-02-14 22:08 tele 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 1 # list是有序的 2 3 # 创建list 4 myList = ["123", 1234, "ok", "hello"] 5 6 # 使用dir()函数查看有哪些该对象有哪些方法 __xx__是python提供的内置方法/属性 7 print(dir(myList)) 8 9 # 增加元素 10 11 # 在指定位置添加元素 12 my... 阅读全文
posted @ 2019-02-14 22:02 tele 阅读(323) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 20 下一页