Java 中将字符串转换为 UTF-8 字节


在将字符串转换为 UTF-8 字节之前,让我们先了解一下 UTF-8。

UTF-8 是一种可变长度字符编码。UTF-8 可以像 ASCII 一样紧凑,但也可以包含任何 Unicode 字符,文件大小会略微增加。UTF 代表 Unicode 转换格式。“8”表示它分配 8 位块来表示一个字符。表示一个字符所需的块数从 1 到 4 不等。

为了将字符串转换为 UTF-8,我们使用 Java 中的 getBytes() 方法。getBytes() 方法将字符串编码为字节序列并返回一个字节数组。

声明 − getBytes() 方法声明如下:

public byte[] getBytes(String charsetName)

其中 charsetName 是将字符串编码为字节数组的特定字符集。

让我们来看一个在 Java 中将字符串转换为 UTF-8 字节的程序。

示例

 在线演示

public class Example {
   public static void main(String args[]) throws Exception {
      String s = "Hello World";
      byte arr[] = s.getBytes("UTF8");
      for (byte x: arr) {
         System.out.print(x+" ");
      }
   }
}

输出

72 101 108 108 111 32 87 111 114 108 100

让我们理解上述程序。我们创建了一个字符串 s:

String s = "Hello World";

String s 被赋值为 Hello World。

为了将其转换为 UTF-8,我们使用 getBytes(“UTF-8”) 方法。这将给我们一个如下所示的字节数组:

byte[] arr = s.getBytes("UTF-8");

然后,为了打印字节数组,我们使用增强型 for 循环:

for (byte x: arr) {
   System.out.print(x+" ");
}

更新于:2020年6月26日

23K+ 次浏览

开启你的职业生涯

通过完成课程获得认证

开始学习
广告