数据集的处理

1.已知训练集,验证集,测试集的情况下,对数据集进行合并

合并文件夹里的所有内容。对data/UWCSE中的多个txt进行合并,将合并的内容写入UWCSE.txt中

public class CllocetDataset {
    public static void main(String[] args) throws IOException {
        File hxyk = new File("data/UWCSE");
        File hxykhz = new File("data/UWCSE.txt");
        BufferedWriter bw = new BufferedWriter(new FileWriter(hxykhz));

        File[] files = hxyk.listFiles();

        for (File file : files) {
            BufferedReader br = new BufferedReader(new FileReader(file));
            char[] chars = new char[1024];
            int len;
            while ((len = br.read(chars)) != -1){
                bw.write(chars,0,len);
            }
            br.close();
        }

        bw.close();
    }
}

2.更换数据集的列

在excel中进行

3.xlsx与txt的转换

https://www.aconvert.com/cn/document/csv-to-txt/

直接先命名为xls,再命名为txt即可

posted @ 2023-01-17 16:12  GraphL  阅读(58)  评论(0)    收藏  举报