python re和file的联用
最近我需要用到Dota更新日志的数据,所以进行了一下小小的处理,写这篇随笔的时候我是不知道什么是数据处理的,所以这篇文很简单,没啥用处,但也算是我学习中的一步吧。
先贴我的数据来源http://www.dota2.com.cn/article/details/20180426/198891.html
因为更新的日志的格式比较像,而且数据比较多,顺便还可以练习一下基础,所以也不亏。
我先把数据粘贴在txt中,接下来是我的代码。
1 import re 2 3 with open('da.txt', 'r') as f: 4 s = f.read() 5 s = s.replace('\n', ' ') 6 s = re.split('综合 | 物品 | 英雄', s) 7 s.remove(s[0]) 8 for i in range(len(s)): 9 s[i] = s[i].strip() 10 if i == 0: 11 s[i] = s[i].replace('-',' ') 12 s[i] = s[i].split(' ') 13 for j in range(len(s[i])): 14 s[i][j] = s[i][j].strip() 15 # #s[i]是代表综合的 16 else: 17 s[i] = s[i].split(' ') 18 for j in range(len(s[i])): 19 s[i][j] = s[i][j].split(' - ') 20 21 22 with open('write.txt', 'w') as e: 23 for i in range(len(s)): 24 if i==0: 25 for j in range(len(s[i])): 26 e.write(s[i][j]) 27 e.write('\n') 28 else: 29 for j in range(len(s[i])): 30 for k in range(len(s[i][j])): 31 e.write(s[i][j][k]) 32 e.write('\n')
先说好,我的做法不太规范,仅此针对我要处理的事情,这里的后面我是把它放到另一个txt中的,但实际上,我需要把这个弄成一个函数处理,因为这些数据是放到html中的。
处理前:
处理后:
希望明天的我能用上js吧。先放一张假的图


浙公网安备 33010602011771号