摘要: Hbase连接使用 安装happybase和thrift pip install happybase pip install thrift import happybase # 1.从数据库导入到hbase if __name__ != '__main__': import pandas as pd 阅读全文
posted @ 2020-07-23 18:10 hziwei 阅读(136) 评论(0) 推荐(0)
摘要: 使用pyspark连接数据库 # spark操作数据库 from pyspark.sql import SQLContext, SparkSession from pyspark import SparkConf, SparkContext # spark地址 master_url = "spark 阅读全文
posted @ 2020-07-23 18:09 hziwei 阅读(346) 评论(0) 推荐(0)
摘要: Scrapy 和 scrapy-redis的区别 scrapy是一个Python爬虫框架,爬取效率极高,具有高度定制性,但是不支持分布式。而scrapy-redis一套基于redis数据库、运行在scrapy框架之上的组件,可以让scrapy支持分布式策略,Slaver端共享Master端redis 阅读全文
posted @ 2020-07-23 18:07 hziwei 阅读(237) 评论(0) 推荐(0)