本篇讲述的是Java IO包中的DataInputStream和DataOutputStream类。
这两个类都属于Java IO中的包装类,为基础流提供了丰富的读写方法,可以将Java中的数据类型轻松地写入流中。
package java.io;
public class DataInputStream extends FilterInputStream implements DataInput {
* 一个带一个参数的构造方法,传入的参数为一个InputStream对象。内部本质是调用父类FilterInputStream的构造方法。
public DataInputStream(InputStream in) {
private byte bytearr[] = new byte[80];
private char chararr[] = new char[80];
* 每次读取多个字节的数据,传入的参数为一个byte型数组,读取的数据会填充到该数组中区,最终返回实际读取的字节数。
public final int read(byte b[]) throws IOException {
return in.read(b, 0, b.length);
* 每次读取多个字节的数据,有3个传入的参数,第一个参数为一个byte型数组,用于装取读取到的字节数据,第二和第三个参数都是int型数据,分别表示读取的起点,
* 和读取的长度。
public final int read(byte b[], int off, int len) throws IOException {
return in.read(b, off, len);
* 每次读取多个字节的数据,传入的参数为一个byte型数组,用于装取读取的字节数据。与上面read方法的区别在于该方法必须等到传入的字节数组填满或者读取到文件
* 结尾或者抛出异常时才会返回,最终返回实际读取的字节数。
public final void readFully(byte b[]) throws IOException {
readFully(b, 0, b.length);
* 每次读取多个字节的数据,传入的第一个参数为一个byte型数组,用于装取读取的字节数据,第二个参数和第三个参数都为int型数据,分别代表着读取的起点和读取
* 的长度。
public final void readFully(byte b[], int off, int len) throws IOException {
if (len < 0)
throw new IndexOutOfBoundsException();
int n = 0;
while (n < len) {
int count = in.read(b, off + n, len - n);
if (count < 0)
throw new EOFException();
n += count;
* 该方法用于跳过指定长度的字节数。最终返回实际跳过的字节数。
public final int skipBytes(int n) throws IOException {
int total = 0;//实际跳过的字节数
int cur = 0; //当前跳过的字节数
while ((total<n) && ((cur = (int) in.skip(n-total)) > 0)) {
total += cur;
return total;
* 读取boolean型数据,原理是读取一个字节的数据,将其与0比较,非0为true,0为false,最终返回比较结果。
public final boolean readBoolean() throws IOException {
int ch = in.read();
if (ch < 0)
throw new EOFException();
return (ch != 0);
* 每次读取一个byte型数据,原理是每次读取一个字节的数据,然后将其转换成byte型数据并返回。
public final byte readByte() throws IOException {
int ch = in.read();
if (ch < 0)
throw new EOFException();
return (byte)(ch);
* 每次读取一个无符号的byte型数据,原理是每次读取一个字节的数据,最终将其返回。
public final int readUnsignedByte() throws IOException {
int ch = in.read();
if (ch < 0)
throw new EOFException();
return ch;
* 每次读取一个short类型的的数据,原理是每次读取两个字节的数据,分别代表着short类型数据的高八位和低八位,最终将其组合成一个short型数据并返回。
public final short readShort() throws IOException {
int ch1 = in.read();
int ch2 = in.read();
if ((ch1 | ch2) < 0)
throw new EOFException();
return (short)((ch1 << 8) + (ch2 << 0));
* 每次读取一个无符号short类型的数据,原理是每次读取两个字节的数据,分别代表着short类型数据的高八位和低八位,最终将其组合并返回。
public final int readUnsignedShort() throws IOException {
int ch1 = in.read();
int ch2 = in.read();
if ((ch1 | ch2) < 0)
throw new EOFException();
return (ch1 << 8) + (ch2 << 0);
* 每次读取一个char类型的数据,原理是每次读取两个字节的数据,分别代表着char类型数据高八位和低八位,最终将其组合并转换成一个char类型数据并返回。
public final char readChar() throws IOException {
int ch1 = in.read();
int ch2 = in.read();
if ((ch1 | ch2) < 0)
throw new EOFException();
return (char)((ch1 << 8) + (ch2 << 0));
* 每次读取一个int类型的数据,原理是每次读取4个字节的数据,每个字节的数据依次从int型数据的最高位开始填充,最终将拼装后的int型数据返回。
public final int readInt() throws IOException {
int ch1 = in.read();
int ch2 = in.read();
int ch3 = in.read();
int ch4 = in.read();
if ((ch1 | ch2 | ch3 | ch4) < 0)
throw new EOFException();
return ((ch1 << 24) + (ch2 << 16) + (ch3 << 8) + (ch4 << 0));
private byte readBuffer[] = new byte[8];
* 每次读取一个long类型的数据,其工作原理是通过readFully方法一次读取8个字节的数据,然后将读取的数据依次从long型数据的最高位开始填充,最终将填充完毕的
* long型数据返回。
public final long readLong() throws IOException {
readFully(readBuffer, 0, 8);
return (((long)readBuffer[0] << 56) +
((long)(readBuffer[1] & 255) << 48) +
((long)(readBuffer[2] & 255) << 40) +
((long)(readBuffer[3] & 255) << 32) +
((long)(readBuffer[4] & 255) << 24) +
((readBuffer[5] & 255) << 16) +
((readBuffer[6] & 255) << 8) +
((readBuffer[7] & 255) << 0));
* 每次读取一个Float型数据,原理是先通过readInt方法读取一个int型数据,然后再将其转换成float行数据并返回。
public final float readFloat() throws IOException {
return Float.intBitsToFloat(readInt());
* 每次读取一个double型数据,原理是先通过readLong方法读取一个long型数据,然后再将其转换成double型数据并返回。
public final double readDouble() throws IOException {
return Double.longBitsToDouble(readLong());
private char lineBuffer[];
* 一次读取一行数据,最终将读取的数据转换为一个String类型并返回。
public final String readLine() throws IOException {
char buf[] = lineBuffer;
if (buf == null) {
buf = lineBuffer = new char[128];
int room = buf.length;
int offset = 0;
int c;
loop: while (true) {
switch (c = in.read()) {
case -1:
case '\n':
break loop;
case '\r':
int c2 = in.read();
if ((c2 != '\n') && (c2 != -1)) {
if (!(in instanceof PushbackInputStream)) {
this.in = new PushbackInputStream(in);
break loop;
if (--room < 0) {
buf = new char[offset + 128];
room = buf.length - offset - 1;
System.arraycopy(lineBuffer, 0, buf, 0, offset);
lineBuffer = buf;
buf[offset++] = (char) c;
if ((c == -1) && (offset == 0)) {
return null;
return String.copyValueOf(buf, 0, offset);
* 从流中以UTF编码格式读取数据,并以String类型返回。实际调用的是之后带参的readUTF的方法。
public final String readUTF() throws IOException {
return readUTF(this);
* 从流中已UTF编码格式读取数据,传入的参数为一个DataInput对象,用于对流进行读取操作。
public final static String readUTF(DataInput in) throws IOException {
int utflen = in.readUnsignedShort();
byte[] bytearr = null;
char[] chararr = null;
if (in instanceof DataInputStream) {
DataInputStream dis = (DataInputStream)in;
if (dis.bytearr.length < utflen){
dis.bytearr = new byte[utflen*2];
dis.chararr = new char[utflen*2];
chararr = dis.chararr;
bytearr = dis.bytearr;
} else {
bytearr = new byte[utflen];
chararr = new char[utflen];
int c, char2, char3;
int count = 0;
int chararr_count=0;
in.readFully(bytearr, 0, utflen);
while (count < utflen) {
c = (int) bytearr[count] & 0xff;
if (c > 127) break;
while (count < utflen) {
c = (int) bytearr[count] & 0xff;
switch (c >> 4) {
case 0: case 1: case 2: case 3: case 4: case 5: case 6: case 7:
// 0xxxxxxx,该种情况下表示是单字节数据,可以直接将其转成char型数据存放入chararr数组中去。
case 12: case 13:
// 110xxxxx 10xxxxxx,该种情况下是双字节数据,需要从byte型数组中取出两个字节数据,所以先将读取索引count+2。然后进行安全检测,读取位置
// 不能超过数据总长度。
count += 2;
if (count > utflen)
throw new UTFDataFormatException(
"malformed input: partial character at end");
char2 = (int) bytearr[count-1];
if ((char2 & 0xC0) != 0x80)
throw new UTFDataFormatException(
"malformed input around byte " + count);
//step1(c & 0x1F):c读取的其实是双字节数据的高八位,因为utf8编码格式,双字节高八位的数据编码格式为110xxxxx,当与0x1F相与后可以将前
//step2(char2 & 0x3F):char2为读取的双字节数据的低八位,因为utf8编码格式,双字节低八位的数据编码格式为10xxxxxx,当与0x3F相与后将高两位
chararr[chararr_count++]=(char)(((c & 0x1F) << 6) |
(char2 & 0x3F));
case 14:
//1110 xxxx 10xx xxxx 10xx xxxx ,此种情况下表示是3字节数据,需从bytearr数组中取出3个字节的数据进行拼装处理,因为步骤与上面双字节数据
count += 3;
if (count > utflen)
throw new UTFDataFormatException(
"malformed input: partial character at end");
char2 = (int) bytearr[count-2];
char3 = (int) bytearr[count-1];
if (((char2 & 0xC0) != 0x80) || ((char3 & 0xC0) != 0x80))
throw new UTFDataFormatException(
"malformed input around byte " + (count-1));
chararr[chararr_count++]=(char)(((c & 0x0F) << 12) |
((char2 & 0x3F) << 6) |
((char3 & 0x3F) << 0));
// 10xx xxxx, 1111 xxxx 剩余的就是这两者情况了,刚开始在这里纠结了好久,因为标准utf8是可以占有1~4个字节的,然而这里并没有对占用4字节
// 的情况进行处理,但是后来通过在Stack Overflow找到了答案,其实源码的JavaDocs中已经有了解释,在这里使用的是modified UTF-8而不是标准的
// utf8,所以只会占用1~3个字节,在这里不得不再次感叹一下,Stack Overflow确实很强大。
throw new UTFDataFormatException(
"malformed input around byte " + count);
// 最终将chararr中的数据转换成String类型并返回,这里指的注意的在源码中这里有个注释'The number of chars produced may be less than utflen'。
return new String(chararr, 0, chararr_count);
package java.io;
public class DataOutputStream extends FilterOutputStream implements DataOutput {
protected int written;
private byte[] bytearr = null;
* 一个带一个参数的构造方法,传入的参数是一个OutputStream对象,内部调用FilterOutputStream对象的构造参数。
public DataOutputStream(OutputStream out) {
* 该方法用于记录在流中吸入了多少字节的数据,如果长度超过了int型表达范围,则该值一直为Integer.MAX_VALUE。
private void incCount(int value) {
int temp = written + value;
if (temp < 0) {
temp = Integer.MAX_VALUE;
written = temp;
* 该方法每次向写入一个字节的数据。
public synchronized void write(int b) throws IOException {
* 该方法每次写入多个字节的数据,含有3个参数,第一个参数为一个byte型数组, 作为要写入流中的数据源,后两个参数都为int型数据,第一个表示开始写入的位置,
* 第二个为写入的长度,成功往流中写入数据后调用incCount方法,记录下写入数据的长度。
public synchronized void write(byte b[], int off, int len)
throws IOException
out.write(b, off, len);
* 该方法用于将缓存区中的数据写入流中。
public void flush() throws IOException {
* 每次向流中写入一个boolean型数据,本质其实是根据java中默认的非零为true,0为false,向流中写入一个数值,读取时根据这个规则再还原成对应的boolean型值。
public final void writeBoolean(boolean v) throws IOException {
out.write(v ? 1 : 0);
* 每次向流中写入一个byte型数据。
public final void writeByte(int v) throws IOException {
* 每次向流中写入一个short型数据,实质是经过两次写入操作,先写入short型数据的高八位,再写入低八位。
public final void writeShort(int v) throws IOException {
out.write((v >>> 8) & 0xFF);
out.write((v >>> 0) & 0xFF);
* 原理同上,每次向流中写入一个char型数据,实质是经过两次写入,先入char型数据的高八位,在写入其低八位。
public final void writeChar(int v) throws IOException {
out.write((v >>> 8) & 0xFF);
out.write((v >>> 0) & 0xFF);
* 每次向流中写入一个int型数据,实质是经过4次写入,依次从最高位开始,每八位为一组,向流中写入数据。
public final void writeInt(int v) throws IOException {
out.write((v >>> 24) & 0xFF);
out.write((v >>> 16) & 0xFF);
out.write((v >>> 8) & 0xFF);
out.write((v >>> 0) & 0xFF);
private byte writeBuffer[] = new byte[8];
* 一次向流中写入一个long型数据。将long型数据从最高位开始以8位为一组,依次写入缓存数组中,最后通过write方法写入流中。
public final void writeLong(long v) throws IOException {
writeBuffer[0] = (byte)(v >>> 56);
writeBuffer[1] = (byte)(v >>> 48);
writeBuffer[2] = (byte)(v >>> 40);
writeBuffer[3] = (byte)(v >>> 32);
writeBuffer[4] = (byte)(v >>> 24);
writeBuffer[5] = (byte)(v >>> 16);
writeBuffer[6] = (byte)(v >>> 8);
writeBuffer[7] = (byte)(v >>> 0);
out.write(writeBuffer, 0, 8);
* 一次向流中写入一个float型数据,本质是将float型数据转化成int型数据,然后通过writeInt方法写入流中。
public final void writeFloat(float v) throws IOException {
* 一次向流中写入一个double型数据,本质是将double型数据转化成long型数据,然后通过writeLong方法写入流中。
public final void writeDouble(double v) throws IOException {
* 一次向流中以byte的形式写入一个字符串类型数据,本质是通过字符串的charAt方法,将字符串中的每个字符转化成byte型数据写入流中。
public final void writeBytes(String s) throws IOException {
int len = s.length();
for (int i = 0 ; i < len ; i++) {
* 一次向流中以char的形式写入一个字符串类型数据,本质是通过字符串的charAt方法,将字符串中的每个字符以char型(通过高低位拆分)直接写入流中。
public final void writeChars(String s) throws IOException {
int len = s.length();
for (int i = 0 ; i < len ; i++) {
int v = s.charAt(i);
out.write((v >>> 8) & 0xFF);
out.write((v >>> 0) & 0xFF);
incCount(len * 2);
* 一次向流中以utf8的格式写入一个String类型的数据。本质是调用之后带两个参数的writeUTF方法。
public final void writeUTF(String str) throws IOException {
writeUTF(str, this);
* 一次向流中以utf8的格式写入一个String类型的数据。
static int writeUTF(String str, DataOutput out) throws IOException {
int strlen = str.length();
int utflen = 0;
int c, count = 0;
for (int i = 0; i < strlen; i++) {
c = str.charAt(i);
if ((c >= 0x0001) && (c <= 0x007F)) {
} else if (c > 0x07FF) {
utflen += 3;
} else {
utflen += 2;
if (utflen > 65535)
throw new UTFDataFormatException(
"encoded string too long: " + utflen + " bytes");
byte[] bytearr = null;
if (out instanceof DataOutputStream) {
DataOutputStream dos = (DataOutputStream)out;
if(dos.bytearr == null || (dos.bytearr.length < (utflen+2)))
dos.bytearr = new byte[(utflen*2) + 2];
bytearr = dos.bytearr;
} else {
bytearr = new byte[utflen+2];
bytearr[count++] = (byte) ((utflen >>> 8) & 0xFF);
bytearr[count++] = (byte) ((utflen >>> 0) & 0xFF);
int i=0;
for (i=0; i<strlen; i++) {
c = str.charAt(i);
if (!((c >= 0x0001) && (c <= 0x007F))) break;
bytearr[count++] = (byte) c;
for (;i < strlen; i++){
c = str.charAt(i);
if ((c >= 0x0001) && (c <= 0x007F)) {
bytearr[count++] = (byte) c;
} else if (c > 0x07FF) {
bytearr[count++] = (byte) (0xE0 | ((c >> 12) & 0x0F));
bytearr[count++] = (byte) (0x80 | ((c >> 6) & 0x3F));
bytearr[count++] = (byte) (0x80 | ((c >> 0) & 0x3F));
} else {
bytearr[count++] = (byte) (0xC0 | ((c >> 6) & 0x1F));
bytearr[count++] = (byte) (0x80 | ((c >> 0) & 0x3F));
out.write(bytearr, 0, utflen+2);
return utflen + 2;
* 返回当前写入流中数据的字节总数。
public final int size() {
return written;

package dataInOut;
import java.io.DataInputStream;
import java.io.DataOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
public class DataIOTest1 {
public static void main(String[] args) {
try (DataOutputStream dos = new DataOutputStream(new FileOutputStream(
new File("./src/file/test1.txt")));
DataInputStream dis = new DataInputStream(new FileInputStream(
new File("./src/file/test1.txt")))) {
dos.writeUTF("Hello World");
int tempInt = dis.readInt();
boolean tempBoolean = dis.readBoolean();
String tempUTF = dis.readUTF();
System.out.println(tempInt+" : "+tempBoolean+" : "+tempUTF);
} catch (Exception e) {