1. 本周学习总结

1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容。

(1)File可以表示一个特定文件的名称,也能表示一个目录下的一组文件的名称。
(2)继承自InputStream或Reader的类都含有名为read()的基本方法,用于读取单个字节或者字节数组。OutputStream或Writer的类子类都含有名为write()的基本方法,用于写单个字节或者字节数组。
(3)与输入有关的所有类都应该从InputStream继承,而与输出有关的所有类都应该从OutputStream继承。
(5)InputStream和OutputStream,采用字节流方式读写,Reader和Writer采用字符流读写。

2. 书面作业

1.将Student对象(属性:int id, String name,int age,double grade)写入文件student.data、从文件读出显示。

字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)

1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号)

1.2 生成文件大小多少?分析该文件大小

其中看得见的内容共37个字符,占37字节,回车换行3个共6字节,总43字节

1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么?

参考:本题具体要求见流与文件实验任务书-题目1-2.1
参考代码:TextFileTest.java

文件为0字节,PrintWriter的println方法采用buffered形式,先将数据缓冲到内存中,如果没有flush,则数据无法输出到硬存中,也就无法正确存储,而close方法,会默认调用flush,所以没有close会造成数据的丢失。

2. 缓冲流

2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间

显而易见用BufferedReader更快,因为每次读写请求要触发磁盘访问,读写请求直接由低层OS处理,如果每读一个字节就触发一次,效率太低,采用缓存方式可以有效减少I/O操作次数,进而节省时间

2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因。

有所提升,因为BufferedWriter使用的缓冲技术,同样减少了底层操作的次数

3. 字符编码

3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号)

出现乱码现象,(因为FileReader并没有实现父类中带字符集参数的构造函数,只能按系统默认的字符集来解码。--from 学霸)

3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。

参考:InputStreamReaderTest.java与教学PPT

4. 字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream

4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号)

4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么?

生成的文件大小为64字节,对比题目1生成的文件大了,题目1的文件中我们所看到的每个字符占1个字节,除去回车换行和分隔符剩28字节,本题中文件中的数据每个int型占4字节,每个double型占8字节,这里就占了48字节,除此外还有String型占据了一定存储空间。
前者按输出的内容确定占用的内存空间,后者为固定占存。

4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。

00 00 00 01-->1
00 04 7A 65 6E 67-->zeng
00 00 00 13 -->19
40 00 00 00 00 00 00 00 --> 2.0
以此类推

4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) //参考ObjectStreamTest目录

参考:本题具体要求见流与文件实验任务书-题目1-1

5. Scanner基本概念组装对象

编写public static List readStudents(String fileName)从fileName指定的文本文件中读取所有学生,并将其放入到一个List中。应该使用那些IO相关的类?说说你的选择理由。

使用BufferedReader,缓冲让读写更高效,因为要读UTF-8格式的文件,所以需要用到InputStreamReader,从文件中输入由FileInputStream实现。

实验文件:Students.txt
参考:TextFileTest目录下TextFileTest.java

6. 选做:RandomAccessFile

6.1 使用RandomAccessFile实现题目1.1。(截图关键代码,出现学号)

6.2 分析文件大小

文件大小64字节,与题目4一样

7. 文件操作

编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。

7.1 编写public static void findFile(String path,String filename)函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号)

7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1)

7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。

参考代码:FindDirectories.java
参考:本题具体要求见流与文件实验任务书-题目2

7.4 选做:将指定目录及子目录下的所有.java文件,转化成UTF-8编码格式,并测试。

参考资料:判断文件的编码格式

8. 正则表达式

8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号)

8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串。

参考:本题具体要求见流与文件实验任务书-题目3

8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="images/mail1.gif",然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。

3. 码云及PTA

3.1. 码云代码提交记录

在码云的项目中,依次选择“统计-Commits历史-设置时间段”, 然后搜索并截图

3.2 PTA以前未完成的题目