jupyter 连接 pyspark

import os
import sys
spark_name = os.environ.get('SPARK_HOME',None)
if not spark_name:
    raise ValueErrorError('spark环境没有配置好')
sys.path.insert(0,os.path.join(spark_name,'python'))
sys.path.insert(0,os.path.join(spark_name,'python/lib/py4j-0.10.4-src.zip'))
exec(open(os.path.join(spark_name,'python/pyspark/shell.py')).read())

参考:spark的介绍和pyspark的使用

posted @ 2018-09-07 20:23  机器狗mo  阅读(1211)  评论(0)    收藏  举报