2019年9月27日

利用python写接口

摘要: 开发步骤: 1、实例化server 2、装饰器下面的函数变为一个接口 3、启动服务 开发工具和流程: python库:flask =》实例化server:server = flask.Flask(__name__) =》@server.route('/index',methods=['post']) 阅读全文

posted @ 2019-09-27 18:37 nnnnnnnnnnnnnnnn 阅读(608) 评论(0) 推荐(0)

ML Pipelines

摘要: 一个典型的机器学习过程从数据收集开始,要经历多个步骤,才能得到需要的输出。这非常类似于流水线式工作,即通常会包含源数据ETL(抽取、转化、加载),数据预处理,指标提取,模型训练与交叉验证,新数据预测等步骤。 一、定义: DataFrame:使用Spark SQL中的DataFrame作为数据集,它可 阅读全文

posted @ 2019-09-27 14:33 nnnnnnnnnnnnnnnn 阅读(380) 评论(0) 推荐(0)

异常:Python in worker has different version 2.6 than that in driver 2.7

摘要: 问题:pyspark的环境和系统python环境冲突 解决: 方法一、 import osos.environ['PYSPARK_PYTHON']='/opt/anaconda2/bin/python' 方法二、 export PYSPARK_PYTHON= 位置 export PYSPARK_DR 阅读全文

posted @ 2019-09-27 14:08 nnnnnnnnnnnnnnnn 阅读(2182) 评论(0) 推荐(0)

pyspark之创建SparkSession

摘要: 1.from pyspark.sql import SparkSession 2.spark = SparkSession.builder.master("spark://master:7077") \ .appName('compute_customer_age') \ .config('spar 阅读全文

posted @ 2019-09-27 14:05 nnnnnnnnnnnnnnnn 阅读(2198) 评论(0) 推荐(0)

导航