IO基础知识

参考:

【Java基本功】浅析Java中IO流的概念和用法

100G的文件如何读取 - 第306篇

100G的文件如何读取续集 - 第307篇

搞懂I/O多路复用及其技术

搭建分布式文件系统FastDFS

Java实现文件复制常见方式

老生常谈,但是不得不再谈的 [拷贝] 

Java 异步 IO

能懂系列之 Java.IO 字符流读写文件

能懂系列之 Java.io 文件读写

能懂系列之 Java.IO.File 详述

面试官扎心一问:NIO的原理是什么机制?

从原理到应用,一文说透 Java 的 I/O 体系

搞懂I/O多路复用及其技术

浅析操作系统和Netty中的零拷贝机制

一口气说出 5 种 IO 模型,蒙圈了!

从实践角度重新理解BIO和NIO

没想到 Unicode 字符还能这样玩?

Java 异步 IO

Java IO详解那点事

浅析操作系统和Netty中的零拷贝机制

JAVA中写时复制Copy-On-Write

咱们一起来聊聊Java NIO

NIO 和 IO 到底有什么区别?别说你不会!

如何在Java代码中去掉烦人的“!=null”

Java 异步 IO

面试官:什么是NIO?NIO的原理是什么机制?

五种I/O模型和Java NIO源码分析

Java中OIO与NIO的简单区别

Java NIO 学习笔记(一)----概述,Channel/Buffer

Java NIO 学习笔记(二)----聚集和分散,通道到通道

Java NIO 学习笔记(三)----Selector

Java NIO 学习笔记(四)----文件通道和网络通道

Java NIO 学习笔记(五)----路径、文件和管道 Path/Files/Pipe

Java NIO 学习笔记(六)----异步文件通道 AsynchronousFileChannel

Java NIO 学习笔记(七)----NIO/IO 的对比和总结

http://ifeve.com/java-io/

htts://www.cnblogs.com/ylspace/p/8128112.html

NIO

java.nio.file相较于java.io.file在进行操作时有许多异常处理,而不会只是返回true或者false

参考:https://blog.csdn.net/holmofy/article/details/77606224

          https://blog.csdn.net/LuoZheng4698729/article/details/51697648

谈谈你对java.io.Serializable接口的理解,我们知道它用于序列化,是空方法接口,还有其它认识吗?

Java面试每日一题 -- Java中的NIO,BIO,AIO分别是什么

Java NIO -- 管道 (Pipe)

Java NIO -- DatagramChannel

Java NIO -- 阻塞和非阻塞

Java NIO -- 通道 Channel 

Java NIO -- 直接缓冲区与非直接缓冲区

Java NIO -- 缓冲区(Buffer)的数据存取

Java NIO

能懂系列之 Java.IO 字符流读写文件

能懂系列之 Java.io 文件读写

能懂系列之 Java.IO.File 详述

​咱们一起来聊聊Java NIO

你还在被 Java NIO 虐?该试试 Netty 了!

【面试】彻底理解 IO多路复用?

NIO 和 IO 到底有什么区别?别说你不会!

谈谈对不同I/O模型的理解 (阻塞/非阻塞IO,同步/异步IO)

性能测试过程中-磁盘 IO 高分析方法

Java NIO之缓冲区

NIO这样理解才够深入!

关于零拷贝的一点认识

性能测试过程中-磁盘 IO 高分析方法

BIO、NIO、AIO、多路复用IO的区别(图解)

字节操作

实现文件复制

    public static void copyFile(String src, String dist) throws IOException {
        FileInputStream in = new FileInputStream(src);//输入流
        FileOutputStream out = new FileOutputStream(dist);//输出流
        byte[] buffer = new byte[20 * 1024];
        int cnt;
        // read() 最多读取 buffer.length 个字节
        // 返回的是实际读取的个数
        // 返回 -1 的时候表示读到 eof,即文件尾
        while ((cnt = in.read(buffer, 0, buffer.length)) != -1) {//从流中读取字节到内存中
            out.write(buffer, 0, cnt);//从内存中的字节读出到输出流
        }
        in.close();
        out.close();
    }
View Code

Java I/O 使用了装饰者模式来实现。以 InputStream 为例,

InputStream 是抽象组件;

FileInputStream 是 InputStream 的子类,属于具体组件,提供了字节流的输入操作;

FilterInputStream 属于抽象装饰者,装饰者用于装饰组件,为组件提供额外的功能。例如 BufferedInputStream 为 FileInputStream 提供缓存的功能。

实例化一个具有缓存功能的字节流对象时,只需要在 FileInputStream 对象上再套一层 BufferedInputStream 对象即可。

FileInputStream fileInputStream = new FileInputStream(filePath);
BufferedInputStream bufferedInputStream = new BufferedInputStream(fileInputStream);

DataInputStream 装饰者提供了对更多数据类型进行输入的操作,比如 int、double 等基本类型

 

字符操作

编码与解码

编码就是把字符转换为字节,而解码是把字节重新组合成字符。

如果编码和解码过程使用不同的编码方式那么就出现了乱码。

GBK 编码中,中文字符占 2 个字节,英文字符占 1 个字节;

UTF-8 编码中,中文字符占 3 个字节,英文字符占 1 个字节;

UTF-16be 编码中,中文字符和英文字符都占 2 个字节。

UTF-16be 中的 be 指的是 Big Endian,也就是大端。相应地也有 UTF-16le,le 指的是 Little Endian,也就是小端。

Java 的内存编码使用双字节编码 UTF-16be,这不是指 Java 只支持这一种编码方式,而是说 char 这种类型使用 UTF-16be 进行编码。char 类型占 16 位,也就是两个字节,Java 使用这种双字节编码是为了让一个中文或者一个英文都能使用一个 char 来存储。

String 的编码方式

String 可以看成一个字符序列,可以指定一个编码方式将它编码为字节序列,也可以指定一个编码方式将一个字节序列解码为 String

String str1 = "中文";
byte[] bytes = str1.getBytes("UTF-8");
String str2 = new String(bytes, "UTF-8");
System.out.println(str2);

在调用无参数 getBytes() 方法时,默认的编码方式不是 UTF-16be。双字节编码的好处是可以使用一个 char 存储中文和英文,而将 String 转为 bytes[] 字节数组就不再需要这个好处,因此也就不再需要双字节编码。getBytes() 的默认编码方式与平台有关,一般为 UTF-8。

byte[] bytes = str1.getBytes();

Reader 与 Writer

不管是磁盘还是网络传输,最小的存储单元都是字节,而不是字符。但是在程序中操作的通常是字符形式的数据,因此需要提供对字符进行操作的方法。

InputStreamReader 实现从字节流解码成字符流;

OutputStreamWriter 实现字符流编码成为字节流。

实现逐行输出文本文件的内容

public static void readFileContent(String filePath) throws IOException {

    FileReader fileReader = new FileReader(filePath);
    BufferedReader bufferedReader = new BufferedReader(fileReader);

    String line;
    while ((line = bufferedReader.readLine()) != null) {
        System.out.println(line);
    }

    // 装饰者模式使得 BufferedReader 组合了一个 Reader 对象
    // 在调用 BufferedReader 的 close() 方法时会去调用 Reader 的 close() 方法
    // 因此只要一个 close() 调用即可
    bufferedReader.close();
}
View Code

 

对象操作

序列化

序列化就是将一个对象转换成字节序列,方便存储和传输。

  • 序列化:ObjectOutputStream.writeObject()
  • 反序列化:ObjectInputStream.readObject()

不会对静态变量进行序列化,因为序列化只是保存对象的状态,静态变量属于类的状态。

Serializable

序列化的类需要实现 Serializable 接口,它只是一个标准,没有任何方法需要实现,但是如果不去实现它的话而进行序列化,会抛出异常。

public static void main(String[] args) throws IOException, ClassNotFoundException {

    A a1 = new A(123, "abc");
    String objectFile = "file/a1";

    ObjectOutputStream objectOutputStream = new ObjectOutputStream(new FileOutputStream(objectFile));
    objectOutputStream.writeObject(a1);
    objectOutputStream.close();

    ObjectInputStream objectInputStream = new ObjectInputStream(new FileInputStream(objectFile));
    A a2 = (A) objectInputStream.readObject();
    objectInputStream.close();
    System.out.println(a2);
}

private static class A implements Serializable {

    private int x;
    private String y;

    A(int x, String y) {
        this.x = x;
        this.y = y;
    }

    @Override
    public String toString() {
        return "x = " + x + "  " + "y = " + y;
    }
}
View Code

transient

transient 关键字可以使一些属性不会被序列化。

ArrayList 中存储数据的数组 elementData 是用 transient 修饰的,因为这个数组是动态扩展的,并不是所有的空间都被使用,因此就不需要所有的内容都被序列化。通过重写序列化和反序列化方法,使得可以只序列化数组中有内容的那部分数据。

private transient Object[] elementData;

 

什么是序列化?什么是反序列化?

如果我们需要持久化 Java 对象比如将 Java 对象保存在文件中,或者在网络传输 Java 对象,这些场景都需要用到序列化。

简单来说:

序列化: 将数据结构或对象转换成二进制字节流的过程

反序列化:将在序列化过程中所生成的二进制字节流的过程转换成数据结构或者对象的过程

对于 Java 这种面向对象编程语言来说,我们序列化的都是对象(Object)也就是实例化后的类(Class),但是在 C++这种半面向对象的语言中,struct(结构体)定义的是数据结构类型,而 class 对应的是对象类型。

维基百科是如是介绍序列化的:

序列化(serialization)在计算机科学的数据处理中,是指将数据结构或对象状态转换成可取用格式(例如存成文件,存于缓冲,或经由网络中发送),以留待后续在相同或另一台计算机环境中,能恢复原先状态的过程。依照序列化格式重新获取字节的结果时,可以利用它来产生与原始对象相同语义的副本。对于许多对象,像是使用大量引用的复杂对象,这种序列化重建的过程并不容易。面向对象中的对象序列化,并不概括之前原始对象所关系的函数。这种过程也称为对象编组(marshalling)。从一系列字节提取数据结构的反向操作,是反序列化(也称为解编组、deserialization、unmarshalling)。

综上:序列化的主要目的是通过网络传输对象或者说是将对象存储到文件系统、数据库、内存中。

 

Java 序列化中如果有些字段不想进行序列化,怎么办?

对于不想进行序列化的变量,使用transient关键字修饰。

transient 关键字的作用是:阻止实例中那些用此关键字修饰的的变量序列化;当对象被反序列化时,被 transient 修饰的变量值不会被持久化和恢复。transient 只能修饰变量,不能修饰类和方法。

获取用键盘输入常用的两种方法

方法 1:通过 Scanner

Scanner input = new Scanner(System.in);
String s = input.nextLine();
input.close();

方法 2:通过 BufferedReader

BufferedReader input = new BufferedReader(new InputStreamReader(System.in));
String s = input.readLine();

Java 中 IO 流分为几种?

按照流的流向分,可以分为输入流和输出流;

按照操作单元划分,可以划分为字节流和字符流;

按照流的角色划分为节点流和处理流。

Java Io 流共涉及 40 多个类,这些类看上去很杂乱,但实际上很有规则,而且彼此之间存在非常紧密的联系, Java I0 流的 40 多个类都是从如下 4 个抽象类基类中派生出来的。

InputStream/Reader: 所有的输入流的基类,前者是字节输入流,后者是字符输入流。

OutputStream/Writer: 所有输出流的基类,前者是字节输出流,后者是字符输出流。

按操作方式分类结构图:

 

按操作对象分类结构图:

 

既然有了字节流,为什么还要有字符流?

问题本质想问:不管是文件读写还是网络发送接收,信息的最小存储单元都是字节,那为什么 I/O 流操作要分为字节流操作和字符流操作呢?

回答:字符流是由 Java 虚拟机将字节转换得到的,问题就出在这个过程还算是非常耗时,并且,如果我们不知道编码类型就很容易出现乱码问题。所以, I/O 流就干脆提供了一个直接操作字符的接口,方便我们平时对字符进行流操作。如果音频文件、图片等媒体文件用字节流比较好,如果涉及到字符的话使用字符流比较好。

 

参考文章:

Java中OIO与NIO的简单区别  

 

 

 

 

 

posted @ 2021-06-30 19:29  弱水三千12138  阅读(133)  评论(0)    收藏  举报