201521123037 《Java程序设计》第12周学习总结

1. 本周学习总结

1.1 以你喜欢的方式(思维导图或其他)归纳总结多流与文件相关内容。

  1. I/O流。本质上是一个数据序列;最基本的可处理数据单位为byte。
    1.1 分类:输入流(读数据),输出流(写数据);字节流(InputStream、OutputSream),字符流(Reader、Writer)。
    1.2 (字节流)InputStream中的read方法:读一个字节并返回,到达流末尾返回-1。OutputStream中的write方法:向输出流写一个字节;flush方法:刷新输出流并强制写出所有缓冲的输出字节。共有方法:close():关闭流并释放与流相关的所有系统资源。
    1.3 (字符流)存储文本格式数据,需要考虑字符编码。出现乱码:InputStreamReader和OutputStreamWriter可以指定编码在字节流和字符流间转换。
    1.4 (缓冲流)只有在必要的时候进行真正的底层I/O操作(如read时,缓存区空进行底层操作;write,缓存区满进行底层操作),更高效。flush方法,有的缓冲流类支持autoflush,缓冲流关闭时一般先调用flush方法。
    1.5 格式化输出:文本扫描器(Scanner)、PrintWriter PrintStream(格式化输出)。Scanner:分隔模式符(可指定useDelimiter);PrintWriter PrintStream:print println format。
    1.6 数据流(Data Streams):处理基本数据类型和字节,字节数组。
    1.7 组合过滤流:为流额外增加功能。
    1.8 对象流(Object Stream)对象必须实现Serializable接口才可以序列化,该接口只是一个标识接口。实现类有ObjectInputSream和ObjectOutputSream。
  2. 文件和目录操作
    2.1 File:文件和目录路径名的抽象表示形式;RandomAccessFile:提供对文件的随机访问。
  3. NIO.2
  4. 正则表达式

2. 书面作业

将Student对象(属性:int id, String name,int age,double grade)写入文件student.data、从文件读出显示。

1. 字符流与文本文件:使用 PrintWriter(写),BufferedReader(读)

1.1 生成的三个学生对象,使用PrintWriter的println方法写入student.txt,每行一个学生,学生的每个属性之间用|作为分隔。使用Scanner或者BufferedReader将student.txt的数据读出。(截图关键代码,出现学号)

  • PrintWriter将数据写入文件

  • 使用Scanner将数据从文件中读出

  • 使用BufferedReader将数据从文件中读出

  • 运行结果

  • student.txt

1.2 生成文件大小多少?分析该文件大小


生成的文件大小为1KB。每一行中,学号1字节,名字3字节,年龄2字节,年级3字节,换行2字节,'|'占3字节,一行有14字节,共有三行,共42字节。

1.3 如果调用PrintWriter的println方法,但在后面不close。文件大小是多少?为什么?

生成的文件大小为0KB。缓冲区存储写入的数据,当缓冲区被填充满的时候,会存入目的地,未被填充满时,需要使用flush方法将缓存区的内容读出,否则数据丢失。PrintWriter的close方法中能够将缓存区内容读出,同样不会造成数据丢失。这里去掉close方法,导致数据丢失,文件未存储数据,文件大小为0KB。

2. 缓冲流

2.1 使用PrintWriter往文件里写入1千万行(随便什么内容都行),然后对比使用BufferedReader与使用Scanner从该文件中读取数据的速度(只读取,不输出),使用哪种方法快?请详细分析原因?提示:可以使用junit4对比运行时间

使用BufferedReader读取数据的速度更快。Scanner是一个简单文本扫描器,使用分隔符模式将其输入分解为标记,默认情况下该分隔符模式与空白匹配。BufferedReader 从字符输入流中读取文本,缓冲各个字符,从而提供字符、数组和行的高效读取。使用了缓冲区,避免每次读取数据时都进行I/O操作,只有在必要的时候进行(read缓冲区为空时或write缓冲区为满)。

2.2 将PrintWriter换成BufferedWriter,观察写入文件的速度是否有提升。记录两者的运行时间。试分析原因。

BufferedWriter是带有缓冲区的字符写入流,只有在必要的时候如write缓冲区满,才进行底层I/O操作。相比于PrintWriter更高效。

3. 字符编码

3.1 现有EncodeTest.txt 文件,该文件使用UTF-8编码。使用FileReader与BufferedReader将EncodeTest.txt的文本读入并输出。是否有乱码?为什么会有乱码?如何解决?(截图关键代码,出现学号)

  • 出现乱码。


保存数据和读出数据使用的编码不同时,会出现乱码。FileReader只能按系统默认的字符集(如GBK)进行解码,但EncodeTest.txt文件编码方法为UTF-8。使用FileInputStream 和InputStreamReader指定字符编码为UTF-8。


3.2 编写一个方法convertGBK2UTF8(String src, String dst),可以将以GBK编码的源文件src转换成以UTF8编码的目的文件dst。

4. 字节流、二进制文件:DataInputStream, DataOutputStream、ObjectInputStream

4.1 参考DataStream目录相关代码,尝试将三个学生对象的数据写入文件,然后从文件读出并显示。(截图关键代码,出现学号)

  • 数据写入文件

  • 从文件中读出数据并显示

  • 显示结果

4.2 生成的文件有多大?分析该文件大小?将该文件大小和题目1生成的文件对比是大了还是小了,为什么?

  • 查看DataInputStream的源代码
public final void writeInt(int v) throws IOException {//整型占4字节
        out.write((v >>> 24) & 0xFF);
        out.write((v >>> 16) & 0xFF);
        out.write((v >>>  8) & 0xFF);
        out.write((v >>>  0) & 0xFF);
        incCount(4);
    }
public final void writeLong(long v) throws IOException {//double型占8字节
        writeBuffer[0] = (byte)(v >>> 56);
        writeBuffer[1] = (byte)(v >>> 48);
        writeBuffer[2] = (byte)(v >>> 40);
        writeBuffer[3] = (byte)(v >>> 32);
        writeBuffer[4] = (byte)(v >>> 24);
        writeBuffer[5] = (byte)(v >>> 16);
        writeBuffer[6] = (byte)(v >>>  8);
        writeBuffer[7] = (byte)(v >>>  0);
        out.write(writeBuffer, 0, 8);
        incCount(8);
    }

63字节。int型占四字节,double型占8字节,姓名占3字节,行末占2字节,一行有21字节,共3行,为63字节。相比较题目1生成的文件更大了。DataInputStream的write方法返回的值有所不同。

4.3 使用wxMEdit的16进制模式(或者其他文本编辑器的16进制模式)打开student.data,分析数据在文件中是如何存储的。

00 00 00 01:1 
00 03 61:aaa
61 61 00 00:20
00 14 40 00 00 00 00 00:2.0
00 00:\n

00 00 00 02:2
00 03 62:bbb
62 62 00 00:21
00 15 40 08 00 00 00 00:3.0
00 00:\n

00 00 00 03:3
00 03 63:ccc
63 63 00 00:19
00 13 3F F0 00 00 00 00:1.0
00 00:\n

**4.4 使用ObjectInputStream(读), ObjectOutputStream(写)读写学生。(截图关键代码,出现学号) **

  • 显示结果

5. Scanner基本概念组装对象

编写public static List<Student> readStudents(String fileName)从fileName指定的文本文件中读取所有学生,并将其放入到一个List中。应该使用那些IO相关的类?说说你的选择理由。

public class TextFileTest
{
   public static void main(String[] args)
   {
      try
      {
         // retrieve all records into a new array
         Scanner in = new Scanner(new InputStreamReader(new FileInputStream("Students.txt"),"UTF-8"));
         ArrayList<Student> newStu = new ArrayList<Student>();
         newStu=readData(in);
         in.close();
	     for (Student e : newStu) {
	    	 System.out.println(e);
		 }
      }
      catch (IOException exception)
      {
         exception.printStackTrace();
      }
      
   }
   private static ArrayList<Student> readData(Scanner in)
   {
      in.nextLine(); // consume newline
      ArrayList<Student> list = new ArrayList<Student>();
      for (int i = 0; i < 3; i++)
      {
    	 Student stu=new Student();
    	 stu.readData(in);
         list.add(stu);
      }
      return list;
   }
}
class Student {
    ......
    public void readData(Scanner in)
    {
       String line = in.nextLine();
       if(line!=null){
    	   String[] tokens = line.split(" ");
    	   this.id=Integer.parseInt(tokens[0]);
    	   this.name=tokens[1];
    	   this.age=Integer.parseInt(tokens[2]);
    	   this.grade=Double.parseDouble(tokens[3]);
       }
    }
}

  • 显示结果

调用InputStreamReader和FileInputStream将文件中的数据按指定编码读出。

6. 选做:RandomAccessFile

6.1 使用RandomAccessFile实现题目1.1。(截图关键代码,出现学号)
6.2 分析文件大小

7. 文件操作

编写一个程序,可以根据指定目录和文件名,搜索该目录及子目录下的所有文件,如果没有找到指定文件名,则显示无匹配,否则将所有找到的文件名与文件夹名显示出来。
7.1 编写public static void findFile(String path,String filename)函数,以path指定的路径为根目录,在其目录与子目录下查找所有和filename相同的文件名,一旦找到就马上输出到控制台。(截图关键代码,出现学号)


7.2 加分点:使用队列、使用图形界面、使用Java NIO.2完成(任选1)

  • 使用队列

7.3 选做:实现删掉指定目录及其子目录下的所有空文件夹。

public static void findFile(String path,String filename){
		File pathName=new File(path);
		Queue<File> queue=new ArrayDeque<File>();
		queue.add(pathName);
		while(!queue.isEmpty()){
			File a=queue.poll();
			String[] fileName = a.list();
			for (String e : fileName) {
				File file=new File(pathName.getPath(),e);
				if(e.equals(filename)){
					file.delete();//删除与filename同名的文件
				}
				if(file.isDirectory()){
					findFile(file.getPath(),filename);
				}
			}
		}
	}

7.4 选做:将指定目录及子目录下的所有.java文件,转化成UTF-8编码格式,并测试。

8. 正则表达式

8.1 如何判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。(截图关键代码,出现学号)

  • 显示结果

8.2 选做:修改HrefMatch.java,尝试匹配网页中的数字字符串、匹配网页中的图片字符串。

8.3 选做(较难):进一步改造上面的程序,获得图片的链接,如IMG src="images/mail1.gif",然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif。最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。

3. 码云及PTA

3.1. 码云代码提交记录

在码云的项目中,依次选择“统计-Commits历史-设置时间段”, 然后搜索并截图

3.2 PTA以前未完成的题目

截图

4.选做:课外阅读

4.1 尝试翻译Lesson: Basic I/O中的Summary
4.2 尝试完成Questions and Exercise
4.3 字符集与编码
4.4 Java正则表达式的语法与示例

posted @ 2017-05-13 19:36  卟噜卟噜  阅读(211)  评论(0编辑  收藏  举报