Python如何获取外部传参
最近在学PySpark,发现有几个有意思的点。
ScalaSpark→JavaSpark→PySpark
Python如何获取外部传参
在Java、Scala中,可执行文件代码都会有一个main方法
def main(args: Array[String]): Unit = {
val input = args(0)
val output = args(1)
}
public static void main(String[] args) {
String input = args[0];
String output = args[1];
}
在python中就有点不一样了:
import sys
if __name__ == '__main__':
input_path = sys.argv[1]
output = sys.argv[2]
由于python运行代码的特殊性,
sys.argv[0]这个参数固定为python文件的名称,所以在处理传参的时候,要注意这一点。
pySpark在进行输出时,默认输出路径不能存在。

浙公网安备 33010602011771号