今天遇到一个很奇怪的问题,sparkstreaming在获取kafka数据的时候,第一次可以成功获取,但是当py文件再次执行,再次获取数据的时候会获取到空白行,在处理数据时,因为这行空白就会报下标越界,就很奇怪,一开始传输几个就没问题,爬几次之后就会出现空白行,是网络问题还是机器性能不够呢,不知道。