spark-4-文件读写
hdfs文件读写报错:
AccessControlException: Permission denied: user=root, access=WRITE, inode="/user/chaojunwang":chaojunwang:supergroup:drwxr-xr-x
【解决方法】
1. 不要sudo启动hadoop或pyspark
2. 在hadoop路径下 ./bin/hdfs dfs -chmod 777 /user 修改 hdfs 文件系统中/user/chaojunwang 路径的权限
3. 在pyspark中即可完成 hdfs 的文件读写
>>> textFile = sc.textFile("hdfs://localhost:9000/user/chaojunwang/word.txt")
>>> textFile.saveAsTextFile("hdfs://localhost:9000/user/chaojunwang/writeback.txt")
>>> textFile = sc.textFile("hdfs://localhost:9000/user/chaojunwang/writeback.txt")
>>> textFile.first()
'It is a start for me to pyspark learning.'
----想成为合格的算法工程师----

浙公网安备 33010602011771号