Java 教程

Java 控制语句

面向对象编程

Java 内置类

Java 文件处理

Java 错误和异常

Java 多线程

Java 同步

Java 网络

Java 集合

Java 接口

Java 数据结构

Java 集合算法

高级 Java

Java 杂项

Java API 和框架

Java 类参考

Java 有用资源

Java - 字符类



通常,当我们处理字符时,我们使用基本数据类型 char。

示例

char ch = 'a';

// Unicode for uppercase Greek omega character
char uniChar = '\u039A'; 

// an array of chars
char[] charArray ={ 'a', 'b', 'c', 'd', 'e' }; 

Java 中 Character 类的使用

但是,在开发过程中,我们会遇到需要使用对象而不是基本数据类型的情况。为了实现这一点,Java 为基本数据类型 char 提供了包装类Character

Java Character 类

Character 类提供了一些有用的类(即静态)方法来操作字符。您可以使用 Character 构造函数创建 Character 对象 -

Character ch = new Character('a');

在某些情况下,Java 编译器也会为您创建 Character 对象。例如,如果您将一个基本 char 传递给一个期望对象的方法,编译器会自动将 char 转换为 Character。如果转换反过来进行,则此功能称为自动装箱或拆箱。

Java Character 类的示例

// Here following primitive char 'a'
// is boxed into the Character object ch
Character ch = 'a';

// Here primitive 'x' is boxed for method test,
// return is unboxed to char 'c'
char c = test('x');

转义序列

以反斜杠 (\) 开头的字符是转义序列,对编译器具有特殊含义。

换行符 (\n) 在本教程中已在 System.out.println() 语句中频繁使用,以在字符串打印后换行。

下表显示了 Java 转义序列 -

转义序列 描述
\t 在此处插入制表符。
\b 在此处插入退格键。
\n 在此处插入换行符。
\r 在此处插入回车符。
\f 在此处插入换页符。
\' 在此处插入单引号字符。
\" 在此处插入双引号字符。
\\ 在此处插入反斜杠字符。

当在打印语句中遇到转义序列时,编译器会相应地解释它。

示例:转义序列

如果要将引号放在引号内,则必须在内部引号上使用转义序列 \" -

public class Test {

   public static void main(String args[]) {
      System.out.println("She said \"Hello!\" to me.");
   }
}

输出

She said "Hello!" to me.

字符类

声明

以下是java.lang.Character类的声明 -

public final class Character
   extends Object
      implements Serializable, Comparable<Character>

字段

以下是java.lang.Character类的字段 -

  • static byte COMBINING_SPACING_MARK - 这是 Unicode 规范中的通用类别“Mc”。

  • static byte CONNECTOR_PUNCTUATION - 这是 Unicode 规范中的通用类别“Pc”。

  • static byte CONTROL - 这是 Unicode 规范中的通用类别“Cc”。

  • static byte CURRENCY_SYMBOL - 这是 Unicode 规范中的通用类别“Sc”。

  • static byte DASH_PUNCTUATION - 这是 Unicode 规范中的通用类别“Pd”。

  • static byte DECIMAL_DIGIT_NUMBER - 这是 Unicode 规范中的通用类别“Nd”。

  • static byte DIRECTIONALITY_ARABIC_NUMBER - 这是 Unicode 规范中的弱双向字符类型“AN”。

  • static byte DIRECTIONALITY_BOUNDARY_NEUTRAL - 这是 Unicode 规范中的弱双向字符类型“BN”。

  • static byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR - 这是 Unicode 规范中的弱双向字符类型“CS”。

  • static byte DIRECTIONALITY_EUROPEAN_NUMBER - 这是 Unicode 规范中的弱双向字符类型“EN”。

  • static byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR − 在 Unicode 规范中,这是弱双向字符类型“ES”。

  • static byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR − 在 Unicode 规范中,这是弱双向字符类型“ET”。

  • static byte DIRECTIONALITY_LEFT_TO_RIGHT − 在 Unicode 规范中,这是强双向字符类型“L”。

  • static byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING − 在 Unicode 规范中,这是强双向字符类型“LRE”。

  • static byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE − 在 Unicode 规范中,这是强双向字符类型“LRO”。

  • static byte DIRECTIONALITY_NONSPACING_MARK − 在 Unicode 规范中,这是弱双向字符类型“NSM”。

  • static byte DIRECTIONALITY_OTHER_NEUTRALS − 在 Unicode 规范中,这是中性双向字符类型“ON”。

  • static byte DIRECTIONALITY_PARAGRAPH_SEPARATOR − 在 Unicode 规范中,这是中性双向字符类型“B”。

  • static byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT − 在 Unicode 规范中,这是弱双向字符类型“PDF”。

  • static byte DIRECTIONALITY_RIGHT_TO_LEFT − 在 Unicode 规范中,这是强双向字符类型“R”。

  • static byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC − 在 Unicode 规范中,这是强双向字符类型“AL”。

  • static byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING − 在 Unicode 规范中,这是强双向字符类型“RLE”。

  • static byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE − 在 Unicode 规范中,这是强双向字符类型“RLO”。

  • static byte DIRECTIONALITY_SEGMENT_SEPARATOR − 在 Unicode 规范中,这是中性双向字符类型“S”。

  • static byte DIRECTIONALITY_UNDEFINED − 这是未定义的双向字符类型。

  • static byte DIRECTIONALITY_WHITESPACE − 在 Unicode 规范中,这是中性双向字符类型“WS”。

  • static byte ENCLOSING_MARK − 在 Unicode 规范中,这是通用类别“Me”。

  • static byte END_PUNCTUATION − 在 Unicode 规范中,这是通用类别“Pe”。

  • static byte FINAL_QUOTE_PUNCTUATION − 在 Unicode 规范中,这是通用类别“Pf”。

  • static byte FORMAT − 在 Unicode 规范中,这是通用类别“Cf”。

  • static byte INITIAL_QUOTE_PUNCTUATION − 在 Unicode 规范中,这是通用类别“Pi”。

  • static byte LETTER_NUMBER − 在 Unicode 规范中,这是通用类别“Nl”。

  • static byte LINE_SEPARATOR − 在 Unicode 规范中,这是通用类别“Zl”。

  • static byte LOWERCASE_LETTER − 在 Unicode 规范中,这是通用类别“Ll”。

  • static byte MATH_SYMBOL − 在 Unicode 规范中,这是通用类别“Sm”。

  • static int MAX_CODE_POINT − 这是 Unicode 代码点的最大值。

  • static char MAX_HIGH_SURROGATE − 在 UTF-16 编码中,这是 Unicode 高代理对代码单元的最大值。

  • static char MAX_LOW_SURROGATE − 在 UTF-16 编码中,这是 Unicode 低代理对代码单元的最大值。

  • static int MAX_RADIX − 这是可用于转换为和从字符串转换的最大基数。

  • static char MAX_SURROGATE − 在 UTF-16 编码中,这是 Unicode 代理对代码单元的最大值。

  • static char MAX_VALUE − 此字段的常量值为 char 类型的最大值,'\uFFFF'。

  • static int MIN_CODE_POINT − 这是 Unicode 代码点的最小值。

  • static char MIN_HIGH_SURROGATE − 在 UTF-16 编码中,这是 Unicode 高代理对代码单元的最小值。

  • static char MIN_LOW_SURROGATE − 在 UTF-16 编码中,这是 Unicode 低代理对代码单元的最小值。

  • static int MIN_RADIX − 这是可用于转换为和从字符串转换的最小基数。

  • static int MIN_SUPPLEMENTARY_CODE_POINT − 这是补充代码点的最小值。

  • static char MIN_SURROGATE − 在 UTF-16 编码中,这是 Unicode 代理对代码单元的最小值。

  • static char MIN_VALUE − 此字段的常量值为 char 类型的最小值,'\u0000'。

  • static byte MODIFIER_LETTER − 在 Unicode 规范中,这是通用类别“Lm”。

  • static byte MODIFIER_SYMBOL − 在 Unicode 规范中,这是通用类别“Sk”。

  • static byte NON_SPACING_MARK − 在 Unicode 规范中,这是通用类别“Mn”。

  • static byte OTHER_LETTER − 在 Unicode 规范中,这是通用类别“Lo”。

  • static byte OTHER_NUMBER − 在 Unicode 规范中,这是通用类别“No”。

  • static byte OTHER_PUNCTUATION − 在 Unicode 规范中,这是通用类别“Po”。

  • static byte OTHER_SYMBOL − 在 Unicode 规范中,这是通用类别“So”。

  • static byte PARAGRAPH_SEPARATOR − 在 Unicode 规范中,这是通用类别“Zp”。

  • static byte PRIVATE_USE − 在 Unicode 规范中,这是通用类别“Co”。

  • static int SIZE − 这是以无符号二进制形式表示 char 值所使用的位数。

  • static byte SPACE_SEPARATOR − 在 Unicode 规范中,这是通用类别“Zs”。

  • static byte START_PUNCTUATION − 在 Unicode 规范中,这是通用类别“Ps”。

  • static byte SURROGATE − 在 Unicode 规范中,这是通用类别“Cs”。

  • static byte TITLECASE_LETTER − 在 Unicode 规范中,这是通用类别“Lt”。

  • static Class<Character> TYPE − 这是表示基本类型 char 的 Class 实例。

  • static byte UNASSIGNED − 在 Unicode 规范中,这是通用类别“Cn”。

  • static byte UPPERCASE_LETTER − 在 Unicode 规范中,这是通用类别“Lu”。

类构造函数

序号 构造函数及描述
1

Character(char value)

这将构造一个新分配的 Character 对象,该对象表示指定的 char 值。

类方法

序号 方法及描述
1 static int charCount(int codePoint)

此方法确定表示指定字符(Unicode 代码点)所需的 char 值数量。

2 char charValue()

此方法返回此 Character 对象的值。

3 static int codePointAt(char[] a, int index)

此方法返回 char 数组给定索引处的代码点。

4 static int codePointBefore(char[] a, int index)

此方法返回 char 数组给定索引之前的代码点。

5 static int codePointCount(char[] a, int offset, int count)

此方法返回 char 数组参数子数组中的 Unicode 代码点数

6 int compareTo(Character anotherCharacter)

此方法以数字方式比较两个 Character 对象。

7 static int digit(char ch, int radix)

此方法返回字符 ch 在指定基数中的数值。

8 boolean equals(Object obj)

此方法将此对象与指定对象进行比较

9 static char forDigit(int digit, int radix)

此方法确定指定基数中特定数字的字符表示形式。

10 static byte getDirectionality(char ch)

此方法返回给定字符的 Unicode 双向属性。

11 static int getNumericValue(char ch)

此方法返回指定 Unicode 字符表示的 int 值。

12 static int getType(char ch)

此方法返回一个值,指示字符的通用类别。

13 int hashCode()

此方法返回此 Character 的哈希码。

14 static boolean isDefined(char ch)

此方法确定字符是否在 Unicode 中定义。

15 static boolean isDigit(char ch)

此方法确定指定的字符是否为数字。

16 static boolean isHighSurrogate(char ch)

此方法确定给定的 char 值是否为高代理对代码单元(也称为前导代理对代码单元)。

17 static boolean isIdentifierIgnorable(char ch)

此方法确定在 Java 标识符或 Unicode 标识符中是否应将指定的字符视为可忽略的字符。

18 static boolean isISOControl(char ch)

此方法确定指定的字符是否为 ISO 控制字符。

19 static boolean isJavaIdentifierPart(char ch)

此方法确定指定的字符是否可以作为 Java 标识符的一部分,而不是第一个字符。

20 static boolean isJavaIdentifierStart(char ch)

此方法确定指定的字符是否允许作为 Java 标识符的第一个字符。

21 static boolean isLetter(char ch)

此方法确定指定的字符是否为字母。

22 static boolean isLetterOrDigit(char ch)

此方法确定指定的字符是否为字母或数字。

23 static boolean isLowerCase(char ch)

此方法确定指定的字符是否为小写字符。

24 static boolean isLowSurrogate(char ch)

此方法确定给定的 char 值是否为低代理对代码单元(也称为尾随代理对代码单元)。

25 static boolean isMirrored(char ch)

此方法确定字符是否根据 Unicode 规范镜像。

26 static boolean isSpaceChar(char ch)

此方法确定指定的字符是否为 Unicode 空格字符。

27 static boolean isSupplementaryCodePoint(int codePoint)

此方法确定指定的字符(Unicode 代码点)是否在补充字符范围内。

28 static boolean isSurrogatePair(char high, char low)

此方法确定指定的 char 值对是否为有效的代理对。

29 static boolean isTitleCase(char ch)

此方法确定指定的字符是否为标题大小写字符。

30 static boolean isUnicodeIdentifierPart(char ch)

此方法确定指定的字符是否可以作为 Unicode 标识符的一部分,而不是第一个字符。

31 static boolean isUnicodeIdentifierStart(char ch)

此方法确定指定的字符是否允许作为 Unicode 标识符的第一个字符。

32 static boolean isUpperCase(char ch

此方法确定指定的字符是否为大写字符。

33 static boolean isValidCodePoint(int codePoint)

此方法确定指定的代码点是否为 0x0000 到 0x10FFFF(含)范围内的有效 Unicode 代码点值。

34 static boolean isWhitespace(char ch)

此方法确定指定的字符是否根据 Java 属于空白字符。

35 static int offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)

此方法返回给定 char 子数组中相对于给定索引偏移 codePointOffset 个代码点的索引

36 static char reverseBytes(char ch)

此方法返回通过反转指定 char 值中字节的顺序获得的值。

37 static char[] toChars(int codePoint)

此方法将指定的字符(Unicode 代码点)转换为存储在 char 数组中的 UTF-16 表示形式。

38 static int toCodePoint(char high, char low)

此方法将指定的代理对转换为其补充代码点值。

39 static char toLowerCase(char ch)

此方法使用 UnicodeData 文件中的大小写映射信息将字符参数转换为小写。

40 String toString()

此方法返回一个表示此 Character 值的 String 对象。

41 static char toTitleCase(char ch)

此方法使用 UnicodeData 文件中的大小写映射信息将字符参数转换为标题大小写。

42 static char toUpperCase(char ch)

此方法使用 UnicodeData 文件中的大小写映射信息将字符参数转换为大写。

43 static Character valueOf(char c)

此方法返回一个表示指定 char 值的 Character 实例。

继承的方法

此类继承自以下类 -

  • java.lang.Object

示例

以下示例演示了 Java Character charCount() 方法的使用。在此程序中,我们创建了一个 int 变量并为其分配了一个十六进制值,该值等效于一个 char 值。然后使用 charCount() 方法,我们检查它是否是一个有效的补充字符。然后打印结果。

package com.tutorialspoint;

public class CharacterDemo {
   public static void main(String[] args) {

      // create and assign values to int codepoint cp
      int cp = 0x12345;

      // create an int res
      int res;

      // assign the result of charCount on cp to res
      res = Character.charCount(cp);
      String str1 = "It is not a valid supplementary character";
      String str2 = "It is a valid supplementary character";

      // print res value
      if ( res == 1 ) {
         System.out.println( str1 );
      } else if ( res == 2 ) {
         System.out.println( str2 );
      }
   }
}

输出

让我们编译并运行上述程序,这将产生以下结果 -

It is a valid supplementary character
广告