Java NIO中核心组成和IO区别

Posted on 2016-11-03 16:10  BHeart  阅读(237)  评论(0编辑  收藏  举报
1、Java NIO核心组件

Java NIO中有很多类和组件,包括Channel,Buffer 和 Selector 构成了核心的API。其它组件如Pipe和FileLock是与三个核心组件共同使用的工具类。

Channel 基本上,所有的 IO 在NIO 中都从一个Channel 开始。Channel 有点象流。 数据可以从Channel读到Buffer中,也可以从Buffer 写到Channel中。

Channel

JAVA NIO中的一些主要Channel的实现:
FileChannel(从文件中读写数据)
DatagramChannel(通过UDP读写网络中的数据)
SocketChannel(通过TCP读写网络中的数据)
ServerSocketChannel(可以监听新进来的TCP连接,像Web服务器那样。对每一个新进来的连接都会创建一个SocketChannel)
这些通道涵盖了UDP和TCP网络IO,以及文件IO。

使用FileChannel读取数据到Buffer中的示例(注意 buf.flip() 的调用,首先读取数据到Buffer,然后反转Buffer,接着再从Buffer中读取数据):

private static void nioRead() throws IOException {
		RandomAccessFile aFile = new RandomAccessFile("src/nio_01/nio-data.txt", "rw");
		FileChannel inChannel = aFile.getChannel();

		//create buffer with capacity of 48 bytes
		ByteBuffer buf = ByteBuffer.allocate(48);

		int bytesRead = inChannel.read(buf); //read into buffer.
		while (bytesRead != -1) {
		  buf.flip();  //make buffer ready for read

		  while(buf.hasRemaining()){
		      System.out.print((char) buf.get()); // read 1 byte at a time
		  }

		  buf.clear(); //make buffer ready for writing
		  bytesRead = inChannel.read(buf);
		}
		aFile.close();
	}

Buffer 缓冲区本质上是一块可以写入数据,然后可以从中读取数据的内存。这块内存被包装成NIO Buffer对象,并提供了一组方法,用来方便的访问该块内存。

JAVA NIO中的关键的Buffer实现:MappedByteBuffer、ByteBuffer、CharBuffer、DoubleBuffer、FloatBuffer、IntBuffer、LongBuffer、ShortBuffer等,这些Buffer覆盖了你能通过IO发送的基本数据类型:byte, short, int, long, float, double 和 char。
  1. Buffer的基本用法

    使用Buffer读写数据一般遵循以下四个步骤:

    1. 写入数据到Buffer

    2. 调用flip()方法

    3. 从Buffer中读取数据

    4. 调用clear()方法或者compact()方法

    当向buffer写入数据时,buffer会记录下写了多少数据。一旦要读取数据,需要通过flip()方法将Buffer从写模式切换到读模式。在读模式下,可以读取之前写入到buffer的所有数据。一旦读完了所有的数据,就需要清空缓冲区,让它可以再次被写入。有两种方式能清空缓冲区:调用clear()或compact()方法。clear()方法会清空整个缓冲区。compact()方法只会清除已经读过的数据。任何未读的数据都被移到缓冲区的起始处,新写入的数据将放到缓冲区未读数据的后面。 下面是一个使用Buffer的例子:

    RandomAccessFile aFile = new RandomAccessFile("data/nio-data.txt", "rw");
    FileChannel inChannel = aFile.getChannel();
    
    //create buffer with capacity of 48 bytes
    ByteBuffer buf = ByteBuffer.allocate(48);
    
    int bytesRead = inChannel.read(buf); //read into buffer.
    while (bytesRead != -1) {
      buf.flip();  //make buffer ready for read
    
      while(buf.hasRemaining()){
       System.out.print((char) buf.get()); // read 1 byte at a time
      }
    
      buf.clear(); //make buffer ready for writing
      bytesRead = inChannel.read(buf);
    }
    aFile.close();
    
  2. Buffer中的3个重要参数

    capacity:作为一个内存块,Buffer有一个固定的大小值,也叫“capacity”.你只能往里写capacity个byte、long,char等类型。一旦Buffer满了,需要将其清空(通过读数据或者清除数据)才能继续写数据往里写数据。

    position:在写模式下,position表示当前的位置。初始的position值为0.当一个byte、long等数据写到Buffer后, position会向前移动到下一个可插入数据的Buffer单元。position最大可为capacity – 1。在读模式下,也是从某个特定位置读。当将Buffer从写模式切换到读模式,position会被重置为0. 当从Buffer的position处读取数据时,position向前移动到下一个可读的位置。

    limit:在写模式下,Buffer的limit表示你最多能往Buffer里写多少数据。 写模式下,limit等于Buffer的capacity。在读模式下, limit表示你最多能读到多少数据。因此,当切换Buffer到读模式时,limit会被设置成写模式下的position值。换句话说,你能读到之前写入的所有数据(limit被设置成已写数据的数量,这个值在写模式下就是position)。

    position和limit的含义取决于Buffer处在读模式还是写模式。不管Buffer处在什么模式,capacity的含义总是一样的。

    Buffer

  3. Buffer创建

    ByteBuffer buf = ByteBuffer.allocate(48);	//方式一,从内存申请
    byte array[] = new byte[48];
    ByteBuffer buf = ByteBuffer.wrap(48);	//方式二,包装数组
    
  4. Buffer重置和清空

    rewind() clear() flip()
    position 置零 置零 置零
    mark 清空 清空 清空
    limit 未改动 设置为capacity 设置为position
    作用 为读取Buffer中有效数据做准备 为重新写入Buffer做准备 在读写时切换

    以上3个函数都重置了Buffer对象,但只是重置了它的各项标志位,并不是真正清空了Buffer对象的内容。
    当调用clear()方法后,position将被设回0,limit被设置成 capacity的值。换句话说,Buffer 被清空了。Buffer中的数据并未清除,只是这些标记告诉我们可以从哪里开始往Buffer里写数据。如果Buffer中有一些未读的数据,调用clear()方法,数据将“被遗忘”,数据将丢失。
    如果Buffer中仍有未读的数据,且后续还需要这些数据,但是此时想要先先写些数据,那么使用compact()方法。
    compact()方法将所有未读的数据拷贝到Buffer起始处。然后将position设到最后一个未读元素正后面。limit属性依然像clear()方法一样,设置成capacity。现在Buffer准备好写数据了,但是不会覆盖未读的数据。

  5. Buffer读写

    1. 从Buffer中读取数据

    从Buffer中读取数据有两种方式:从Buffer读取数据到Channel; 使用get()方法从Buffer中读取数据。

    //方式一: 从Buffer读取数据到Channel
    int bytesWritten = inChannel.write(buf);
    
    //方式二: 使用get()方法从Buffer中读取数据的例子
    byte aByte = buf.get();
    

    get方法有很多版本,允许你以不同的方式从Buffer中读取数据。例如,从指定position读取,或者从Buffer中读取数据到字节数组。更多Buffer实现的细节参考JavaDoc。

    1. 向Buffer中写数据

    写数据到Buffer有两种方式:从Channel写到Buffer; 通过Buffer的put()方法写到Buffer里。

    //方式一:从Channel写到Buffer
    int bytesRead = inChannel.read(buf);
    //方式二:通过put方法写Buffer
    buf.put(127);
    
  6. Buffer标志

    标志缓冲区是一项在数据处理时很有用的功能,可随时记录当前位置。通过调用Buffer.mark()方法,可以标记Buffer中的一个特定position。之后可以通过调用Buffer.reset()方法恢复到这个position。

    buffer.mark();	//call buffer.get() a couple of times, e.g. during parsing.
    buffer.reset();	//set position back to mark.
    
  7. Buffer复制、只读分区和子分区

    Buffer中duplicate()方法使用后会生成一个完全一样的新缓冲区。这个新缓存区的好处是:和原缓冲区共享相同内存,并且任意一方的改动都是相互可见的,但两者维护了各自的position、limit和mark。这大大提高了编程的灵活性,为多方同时处理数据提供了可能。
    Buffer中asReadOnlyBuffer()方法使用后会得到一个与当前缓冲区一致的,并且共享相同内存的只读缓存区。只读缓存区对数据安全很有用。当缓存区作为参数传递给对象的某个方法时,由于无法确认该方法是否会破坏缓冲区数据,此时,使用只读缓冲区可以保证数据不被修改。而且原始缓冲区的变动对只读缓冲区是可见的。
    Buffer中slice()方法使用后,将在现有的缓冲区中创建新的子缓冲区,子缓冲区和父缓冲区共享内存数据。这个方法有助于将系统模块化。当想要处理Buffer某个子分区的片段时,可以使用slice()方法取得一个子缓冲区,让后就像处理普通分区一样处理这个片段,而无需考虑缓冲区的边界问题。

  8. Buffer处理结构化数据

    Java NIO开始支持scatter/gather,scatter/gather用于描述从Channel(译者注:Channel在中文经常翻译为通道)中读取或者写入到Channel的操作。

    分散(scatter)从Channel中读取是指在读操作时将读取的数据写入多个buffer中。因此,Channel将从Channel中读取的数据“分散(scatter)”到多个Buffer中。

    聚集(gather)写入Channel是指在写操作时将多个buffer的数据写入同一个Channel,因此,Channel 将多个Buffer中的数据“聚集(gather)”后发送到Channel。

    scatter / gather经常用于需要将传输的数据分开处理的场合,例如传输一个由消息头和消息体组成的消息,你可能会将消息体和消息头分散到不同的buffer中,这样你可以方便的处理消息头和消息体。

    Scattering Reads是指数据从一个channel读取到多个buffer中。如下图描述:

    Scatter

    ByteBuffer header = ByteBuffer.allocate(128);
    ByteBuffer body   = ByteBuffer.allocate(1024);
    
    ByteBuffer[] bufferArray = { header, body };
    channel.read(bufferArray);
    

    注意buffer首先被插入到数组,然后再将数组作为channel.read() 的输入参数。read()方法按照buffer在数组中的顺序将从channel中读取的数据写入到buffer,当一个buffer被写满后,channel紧接着向另一个buffer中写。
    Scattering Reads在移动下一个buffer前,必须填满当前的buffer,这也意味着它不适用于动态消息(译者注:消息大小不固定)。换句话说,如果存在消息头和消息体,消息头必须完成填充(例如 128byte),Scattering Reads才能正常工作。

    Gathering Writes是指数据从多个buffer写入到同一个channel。如下图描述:

    Gather

    ByteBuffer header = ByteBuffer.allocate(128);
    ByteBuffer body   = ByteBuffer.allocate(1024);
    
    //write data into buffers
    ByteBuffer[] bufferArray = { header, body };
    channel.write(bufferArray);
    

    buffers数组是write()方法的入参,write()方法会按照buffer在数组中的顺序,将数据写入到channel,注意只有position和limit之间的数据才会被写入。因此,如果一个buffer的容量为128byte,但是仅仅包含58byte的数据,那么这58byte的数据将被写入到channel中。因此与Scattering Reads相反,Gathering Writes能较好的处理动态消息。

  9. Buffer文件映射到内存

    MappedByteBuffer 将文件直接映射到内存(这里的内存指的是虚拟内存,并不是物理内存)。通常,可以映射整个文件,如果文件比较大的话可以分段进行映射,只要指定文件的那个 部分就可以。

    三种方式:FileChannel提供了map方法来把文件影射为内存映像文件: MappedByteBuffer map(int mode,long position,long size); 可以把文件的从position开始的size大小的区域映射为内存映像文件,mode指出了 可访问该内存映像文件的方式:READ_ONLY,READ_WRITE,PRIVATE。

    1. READ_ONLY,(只读): 试图修改得到的缓冲区将导致抛出 ReadOnlyBufferException.(MapMode.READ_ONLY)。

    2. READ_WRITE(读/写): 对得到的缓冲区的更改最终将传播到文件;该更改对映射到同一文件的其他程序不一定是可见的。 (MapMode.READ_WRITE)。

    3. PRIVATE(专用): 对得到的缓冲区的更改不会传播到文件,并且该更改对映射到同一文件的其他程序也不是可见的;相反,会创建缓冲区已修改部分的专用副本。 (MapMode.PRIVATE)。

    三个方法

    1. fore() 缓冲区是READ_WRITE模式下,此方法对缓冲区内容的修改强行写入文件
    2. load() 将缓冲区的内容载入内存,并返回该缓冲区的引用
    3. isLoaded() 如果缓冲区的内容在物理内存中,则返回真,否则返回假。

    三个特性:调用信道的map()方法后,即可将文件的某一部分或全部映射到内存中,映射内存缓冲区是个直接缓冲区,继承自ByteBuffer,但相对于ByteBuffer,它有更多的优点:读取快、写入快、随时随地写入。

  10. Buffer的比较
    可以使用equals()和compareTo()方法比较两个Buffer。

    equals()方法当满足下列条件时,表示两个Buffer相等:
    有相同的类型(byte、char、int等),Buffer中剩余的byte、char等的个数相等,Buffer中所有剩余的byte、char等都相同。
    如你所见,equals只是比较Buffer的一部分,不是每一个在它里面的元素都比较。实际上,它只比较Buffer中的剩余元素。
    
    compareTo()方法比较两个Buffer的剩余元素(byte、char等), 如果满足下列条件,则认为一个Buffer“小于”另一个Buffer:
    第一个不相等的元素小于另一个Buffer中对应的元素,所有元素都相等,但第一个Buffer比另一个先耗尽(第一个Buffer的元素个数比另一个少)。
    

Selector Selector允许单线程处理多个Channel。如果你的应用打开了多个连接(通道),但每个连接的流量都很低,使用Selector就会很方便(需要再次分析学习)。例如,在一个聊天服务器中一个单线程中使用一个Selector处理3个Channel的图示:

Selector

要使用Selector,得向Selector注册Channel,然后调用它的select()方法。这个方法会一直阻塞到某个注册的通道有事件就绪。一旦这个方法返回,线程就可以处理这些事件,事件的例子有如新连接进来,数据接收等。
  1. Selector的创建(open())
  2. 向Selector注册通道(register())
  3. 通过Selector选择通道(select())
  4. Selector唤醒(wakeUp())

一个完整的Selector示例:

//出自:http://zhhphappy.iteye.com/blog/2032893
selector = Selector.open();

ServerSocketChannel ssc = ServerSocketChannel.open();
ssc.configureBlocking(false);
ssc.socket().bind(new InetSocketAddress(port));

ssc.register(selector, SelectionKey.OP_ACCEPT);

while (true) {
	// select()阻塞,等待有事件发生唤醒
	int selected = selector.select();

	if (selected > 0) {
		Iterator<SelectionKey> selectedKeys = selector.selectedKeys().iterator();
		while (selectedKeys.hasNext()) {
			SelectionKey key = selectedKeys.next();
			if ((key.readyOps() & SelectionKey.OP_ACCEPT) == SelectionKey.OP_ACCEPT) {
				// 处理 accept 事件
			} else if ((key.readyOps() & SelectionKey.OP_READ) == SelectionKey.OP_READ) {
				// 处理 read 事件
			} else if ((key.readyOps() & SelectionKey.OP_WRITE) == SelectionKey.OP_WRITE) {
				// 处理 write 事件
			}
			selectedKeys.remove();
		}
	}
}

Pipe Java NIO 管道是2个线程之间的单向数据连接。Pipe有一个source通道和一个sink通道。数据会被写到sink通道,从source通道读取。Pipe原理的图示:

Pipe

  1. 创建管道

    Pipe pipe = Pipe.open();	//通过Pipe.open()方法打开管道
    
  2. 向管道写数据

    //要向管道写数据,需要访问sink通道
    Pipe.SinkChannel sinkChannel = pipe.sink();
    
    //通过调用SinkChannel的write()方法,将数据写入SinkChannel
    String newData = "New String to write to file..." + 	System.currentTimeMillis();
    ByteBuffer buf = ByteBuffer.allocate(48);
    buf.clear();
    buf.put(newData.getBytes());
    
    buf.flip();
    
    while(buf.hasRemaining()) {
       sinkChannel.write(buf);
    }
    
  3. 从管道中读取数据

    //从读取管道的数据,需要访问source通道
    Pipe.SourceChannel sourceChannel = pipe.source();
    
    //调用source通道的read()方法来读取数据,read()方法返回的int值会告诉我们多少字节被读进了缓冲区。
    ByteBuffer buf = ByteBuffer.allocate(48);
    int bytesRead = sourceChannel.read(buf);
    
2、Java NIO和IO区别
IO NIO
面向流 面向缓冲
阻塞IO 非阻塞IO
有选择器
  1. 面向流与面向缓冲

    Java NIO和IO之间第一个最大的区别是,IO是面向流的,NIO是面向缓冲区的。 Java IO面向流意味着每次从流中读一个或多个字节,直至读取所有字节,它们没有被缓存在任何地方。此外,它不能前后移动流中的数据。如果需要前后移动从流中读取的数据,需要先将它缓存到一个缓冲区。 Java NIO的缓冲导向方法略有不同。数据读取到一个它稍后处理的缓冲区,需要时可在缓冲区中前后移动。这就增加了处理过程中的灵活性。但是,还需要检查是否该缓冲区中包含所有您需要处理的数据。而且,需确保当更多的数据读入缓冲区时,不要覆盖缓冲区里尚未处理的数据。

  2. 阻塞与非阻塞IO

    Java IO的各种流是阻塞的。这意味着,当一个线程调用read() 或 write()时,该线程被阻塞,直到有一些数据被读取,或数据完全写入。该线程在此期间不能再干任何事情了。 Java NIO的非阻塞模式,使一个线程从某通道发送请求读取数据,但是它仅能得到目前可用的数据,如果目前没有数据可用时,就什么都不会获取。而不是保持线程阻塞,所以直至数据变的可以读取之前,该线程可以继续做其他的事情。 非阻塞写也是如此。一个线程请求写入一些数据到某通道,但不需要等待它完全写入,这个线程同时可以去做别的事情。 线程通常将非阻塞IO的空闲时间用于在其它通道上执行IO操作,所以一个单独的线程现在可以管理多个输入和输出通道(channel)。

  3. 选择器(Selectors)

    Java NIO的选择器允许一个单独的线程来监视多个输入通道,你可以注册多个通道使用一个选择器,然后使用一个单独的线程来“选择”通道:这些通道里已经有可以处理的输入,或者选择已准备写入的通道。这种选择机制,使得一个单独的线程很容易来管理多个通道。

3、NIO和IO如何影响应用程序的设计

无论您选择IO或NIO工具箱,可能会影响您应用程序设计的以下几个方面:

  1. 对NIO或IO类的API调用。

    当然,使用NIO的API调用时看起来与使用IO时有所不同,但这并不意外,因为并不是仅从一个InputStream逐字节读取,而是数据必须先读入缓冲区再处理。

  2. 数据处理。使用纯粹的NIO设计相较IO设计,数据处理也受到影响。

    在IO设计中,我们从InputStream或Reader逐字节读取数据。假设你正在处理一基于行的文本数据流,例如文本:Name: Anna Age: 25 Email: anna@mailserver.com Phone: 1234567890
    该文本行的流可以这样处理:InputStream input = … ; // get the InputStream from the client socket

    BufferedReader reader = new BufferedReader(new InputStreamReader(input));
    String nameLine   = reader.readLine();
    String ageLine    = reader.readLine();
    String emailLine  = reader.readLine();
    String phoneLine  = reader.readLine();
    

    请注意处理状态由程序执行多久决定。换句话说,一旦reader.readLine()方法返回,你就知道肯定文本行就已读完, readline()阻塞直到整行读完,这就是原因。你也知道此行包含名称;同样,第二个readline()调用返回的时候,你知道这行包含年龄等。 正如你可以看到,该处理程序仅在有新数据读入时运行,并知道每步的数据是什么。一旦正在运行的线程已处理过读入的某些数据,该线程不会再回退数据(大多如此)。Java IO: 从一个阻塞的流中读数据?
    而在NIO的实现中会有所不同,下面是一个简单的例子:

    ByteBuffer buffer = ByteBuffer.allocate(48);
    int bytesRead = inChannel.read(buffer);
    

    注意第二行,从通道读取字节到ByteBuffer。当这个方法调用返回时,你不知道你所需的所有数据是否在缓冲区内。你所知道的是,该缓冲区包含一些字节,这使得处理有点困难。假设第一次 read(buffer)调用后,读入缓冲区的数据只有半行,例如,“Name:An”,你能处理数据吗?显然不能,需要等待,直到整行数据读入缓存,在此之前,对数据的任何处理毫无意义。
    所以,你怎么知道是否该缓冲区包含足够的数据可以处理呢?好了,你不知道。发现的方法只能查看缓冲区中的数据。其结果是,在你知道所有数据都在缓冲区里之前,你必须检查几次缓冲区的数据。这不仅效率低下,而且可以使程序设计方案杂乱不堪。例如:

    ByteBuffer buffer = ByteBuffer.allocate(48);
    int bytesRead = inChannel.read(buffer);
    while(! bufferFull(bytesRead) ) {
      bytesRead = inChannel.read(buffer);
    }
    

    bufferFull()方法必须跟踪有多少数据读入缓冲区,并返回真或假,这取决于缓冲区是否已满。换句话说,如果缓冲区准备好被处理,那么表示缓冲区满了。bufferFull()方法扫描缓冲区,但必须保持在bufferFull()方法被调用之前状态相同。如果没有,下一个读入缓冲区的数据可能无法读到正确的位置。这是不可能的,但却是需要注意的又一问题。如果缓冲区已满,它可以被处理。如果它不满,并且在你的实际案例中有意义,你或许能处理其中的部分数据。但是许多情况下并非如此。Java NIO:从一个通道里读数据,直到所有的数据都读到缓冲区里?

  3. 用来处理数据的线程数。

    Java NIO: 单线程管理多个连接
    Java IO: 一个典型的IO服务器设计- 一个连接通过一个线程处理.