C语言中的令牌



令牌指的是计算机语言(例如C语言)源代码中最小的单元。这个术语借用自语言学理论。就像某种语言(例如英语)中的特定文本包含单词(字母、数字和标点符号的集合)一样,编译器将C程序分解成令牌,然后继续进行编译过程的后续阶段。

编译过程的第一阶段是词法分析器。词法分析器将源代码分割成单个令牌,识别令牌类型,并将令牌逐个传递给编译器的下一阶段。

解析器是编译的下一阶段。它能够理解语言的语法,识别语法错误并将无错误的程序翻译成机器语言。

C源代码也包含不同类型的令牌。C语言中的令牌类型如下:

  • 字符集
  • 关键字令牌
  • 字面量令牌
  • 标识符令牌
  • 运算符令牌
  • 特殊符号令牌

让我们讨论每种令牌类型。

C字符集

C语言识别一个字符集,其中包含英语字母——大写字母和小写字母(A到Z,以及a到z)、数字0到9,以及某些其他具有特殊含义的符号。在C语言中,某些字符组合也具有特殊含义。例如,\n被称为换行符。这种组合称为转义序列。

以下是C语言的字符集:

  • 大写字母:A到Z
  • 小写字母:a到z
  • 数字:0到9
  • 特殊字符:! " # $ % & ' ( ) * + - . : , ; ` ~ = < > { } [ ] ^ _ \ /

在一对双引号"和"之间的任何这些字符序列用于表示字符串字面量。数字用于表示数字字面量。方括号用于定义数组。花括号用于标记代码块。反斜杠是转义字符。其他字符定义为运算符。

C关键字

在C语言中,预定义的字母序列称为关键字。与人类语言相比,编程语言的关键字较少。最初,C语言有32个关键字,后来在后续的C标准修订中又增加了一些。所有关键字都小写。每个关键字都有其用法规则(在编程中称为语法)。

C编译器检查关键字是否已根据语法使用,并将源代码翻译成目标代码。

C字面量

在计算机编程术语中,字面量指的是要直接赋值给变量的值的文本表示,直接硬编码在源代码中。

数字字面量包含数字、小数点符号和/或指数字符E或e。

字符串字面量是由任何字符序列构成,放在一对双引号中。字符字面量是单引号内的单个字符。

数组也可以通过在方括号之间放置以逗号分隔的字面量序列来表示字面量形式。

在C语言中,转义序列也是一种字面量。两个或多个字符,第一个字符是反斜杠\字符,放在单引号内构成一个转义序列。每个转义序列都有其预定义的含义。

C标识符

与关键字相反,标识符是程序中用户定义的元素。您需要通过为它们指定适当的名称来定义各种程序元素。例如,变量、常量、标签、用户定义类型、函数等。

C语言规定了形成标识符的某些规则。其中一个重要的限制是,保留关键字不能用作标识符。例如,for是C语言中的关键字,因此它不能用作标识符,即变量、函数等的名称。

C运算符

C是一种计算语言。因此,C程序由执行算术和比较运算的表达式组成。C语言字符集中的特殊符号大多定义为运算符。例如,众所周知的符号+*/C语言中的算术运算符。同样,<>用作比较运算符

C特殊符号

除了定义为运算符的符号之外,其他符号还包括逗号、分号和冒号等标点符号。在C语言中,您会发现它们在不同上下文中使用方式不同。

类似地,圆括号()用于算术表达式以及函数定义中。花括号用于标记函数的范围,条件语句循环语句中的代码块等。

广告