aflw数据集使用
网上的一些资源
工具:https://pan.baidu.com/share/init?shareid=2715092862&uk=3395615408 
密码是difchttps://pan.baidu.com/share/init?shareid=2577552196&uk=1677924157这个应该是完整版的,仅供参考9gtf。
本人申请了数据集,但是只有aflw-images-0.tar.gz,aflw-images-2.tar.gz,aflw-images-3.tar.gz,工具是用的第一个链接
还有一个闫大脑门同学的链接,更详细
https://pan.baidu.com/share/link?shareid=2792069998&uk=1897923954#list/path=%2F
没有秘密
将压缩包放到linux上的同一个文件夹中,解压缩即可
安装
sqliteman
sudo
 apt-get install sqliteman
数据处理的脚本为
#-*-coding:utf-8-*-
fid_a = open('a.txt')
fid_b = open('b.txt')
fid_c = open('c.txt','w')
lines_a = fid_a.readlines()
lines_b = fid_b.readlines()
lines_c = []
num = []
#去重
lines_a_no_repeat=[]#没重复的
for line_a in lines_a:
    if line_a not in lines_a_no_repeat:
        lines_a_no_repeat.append(line_a)
        num.append(lines_a.count(line_a))
#取编号
ii=0
for tmp in lines_a_no_repeat:
    j = 0
    for i in range(0,len(lines_a)):
        if tmp==lines_a[i]:
            if j == 0:
                fid_c.writelines(lines_a[i].strip('\n\r')+' '+str(num[ii])+'\n')
                j = j + 1
            fid_c.writelines(lines_b[i])
    ii = ii + 1
fid_a = open('a.txt')  
fid_b = open('b.txt')  
fid_c = open('cc.txt','w')  
lines_a = fid_a.readlines()  
lines_b = fid_b.readlines()  
lines_c = []  
for i in range(0,len(lines_b)):  
    lines_a[i]= lines_a[i].strip('\n\r')  
    lines_c.append(lines_a[i]+' '+lines_b[i])  
    fid_c.writelines(lines_c[i])  
                    
                
                
            
        
浙公网安备 33010602011771号