python re和file的联用

最近我需要用到Dota更新日志的数据,所以进行了一下小小的处理,写这篇随笔的时候我是不知道什么是数据处理的,所以这篇文很简单,没啥用处,但也算是我学习中的一步吧。

先贴我的数据来源http://www.dota2.com.cn/article/details/20180426/198891.html

因为更新的日志的格式比较像,而且数据比较多,顺便还可以练习一下基础,所以也不亏。

我先把数据粘贴在txt中,接下来是我的代码。

 1 import re
 2 
 3 with open('da.txt', 'r') as f:
 4     s = f.read()
 5 s = s.replace('\n', ' ')
 6 s = re.split('综合 | 物品 | 英雄', s)
 7 s.remove(s[0])
 8 for i in range(len(s)):
 9     s[i] = s[i].strip()
10     if i == 0:
11         s[i] = s[i].replace('-',' ')
12         s[i] = s[i].split('    ')
13         for j in range(len(s[i])):
14             s[i][j] = s[i][j].strip()
15         # #s[i]是代表综合的
16     else:
17         s[i] = s[i].split('    ')
18         for j in range(len(s[i])):
19             s[i][j] = s[i][j].split('  - ')
20 
21 
22 with open('write.txt', 'w') as e:
23     for i in range(len(s)):
24         if i==0:
25             for j in range(len(s[i])):
26                 e.write(s[i][j])
27                 e.write('\n')
28         else:
29             for j in range(len(s[i])):
30                 for k in range(len(s[i][j])):
31                     e.write(s[i][j][k])
32                     e.write('\n')

先说好,我的做法不太规范,仅此针对我要处理的事情,这里的后面我是把它放到另一个txt中的,但实际上,我需要把这个弄成一个函数处理,因为这些数据是放到html中的。

处理前:

处理后:

希望明天的我能用上js吧。先放一张假的图

posted @ 2018-05-02 22:21  neebla  阅读(157)  评论(0)    收藏  举报