数据集的处理
1.已知训练集,验证集,测试集的情况下,对数据集进行合并
合并文件夹里的所有内容。对data/UWCSE中的多个txt进行合并,将合并的内容写入UWCSE.txt中
public class CllocetDataset {
public static void main(String[] args) throws IOException {
File hxyk = new File("data/UWCSE");
File hxykhz = new File("data/UWCSE.txt");
BufferedWriter bw = new BufferedWriter(new FileWriter(hxykhz));
File[] files = hxyk.listFiles();
for (File file : files) {
BufferedReader br = new BufferedReader(new FileReader(file));
char[] chars = new char[1024];
int len;
while ((len = br.read(chars)) != -1){
bw.write(chars,0,len);
}
br.close();
}
bw.close();
}
}
2.更换数据集的列
在excel中进行
3.xlsx与txt的转换
https://www.aconvert.com/cn/document/csv-to-txt/
直接先命名为xls,再命名为txt即可

浙公网安备 33010602011771号