Perl - 语法概述



Perl 借鉴了许多语言的语法和概念:awk、sed、C、Bourne Shell、Smalltalk、Lisp 甚至英语。但是,这些语言之间也存在一些明显的差异。本章旨在帮助您快速了解 Perl 中预期的语法。

Perl 程序由一系列声明和语句组成,这些语句从上到下运行。循环、子程序和其他控制结构允许您在代码中跳转。每个简单语句都必须以分号 (;) 结尾。

Perl 是一种自由格式语言:您可以根据自己的喜好格式化和缩进它。与 Python 等语言(其中空格是语法的重要组成部分)或 Fortran 等语言(其中空格无关紧要)不同,空格主要用于分隔标记。

第一个 Perl 程序

交互模式编程

您可以在命令行使用 Perl 解释器与 -e 选项,这使您可以从命令行执行 Perl 语句。让我们在 $ 提示符下尝试以下操作:

$perl -e 'print "Hello World\n"'

此执行将产生以下结果:

Hello, world

脚本模式编程

假设您已经在 $ 提示符下,让我们使用 vi 或 vim 编辑器打开一个文本文件 hello.pl,并将以下行放入您的文件中。

#!/usr/bin/perl

# This will print "Hello, World"
print "Hello, world\n";

这里 /usr/bin/perl 实际上是 perl 解释器二进制文件。在执行脚本之前,请确保更改脚本文件的模式并授予执行权限,通常设置为 0755 即可,最后您按如下方式执行上述脚本:

$chmod 0755 hello.pl
$./hello.pl

此执行将产生以下结果:

Hello, world

您可以根据个人喜好为函数参数使用括号或省略它们。只有在偶尔需要澄清优先级问题时才需要它们。以下两个语句产生相同的结果。

print("Hello, world\n");
print "Hello, world\n";

Perl 文件扩展名

Perl 脚本可以在任何普通的简单文本编辑器程序中创建。每种类型的平台都有多种程序可用。网络上可以下载许多为程序员设计的程序。

根据 Perl 约定,Perl 文件必须以 .pl 或 .PL 文件扩展名保存,才能被识别为有效的 Perl 脚本。文件名可以包含数字、符号和字母,但不能包含空格。在空格处使用下划线 (_) 。

Perl 中的注释

任何编程语言中的注释都是开发人员的朋友。注释可用于使程序用户友好,并且解释器会简单地跳过它们,而不会影响代码功能。例如,在上面的程序中,以井号 # 开头的行是注释。

简单地说,Perl 中的注释以井号开头,一直延续到行尾:

# This is a comment in perl

以 = 开头的行被解释为嵌入式文档 (pod) 部分的开始,所有后续行直到下一个 =cut 都被编译器忽略。以下是示例:

#!/usr/bin/perl

# This is a single line comment
print "Hello, world\n";

=begin comment
This is all part of multiline comment.
You can use as many lines as you like
These comments will be ignored by the 
compiler until the next =cut is encountered.
=cut

这将产生以下结果:

Hello, world

Perl 中的空格

Perl 程序不关心空格。以下程序可以正常工作:

#!/usr/bin/perl

print       "Hello, world\n";

但是,如果空格位于引号字符串中,则会按原样打印。例如:

#!/usr/bin/perl

# This would print with a line break in the middle
print "Hello
          world\n";

这将产生以下结果:

Hello
          world

当在引号外部使用时,所有类型的空格(如空格、制表符、换行符等)对于解释器来说都是等效的。仅包含空格(可能还有注释)的行称为空行,Perl 完全忽略它。

Perl 中的单引号和双引号

您可以使用双引号或单引号括起文字字符串,如下所示:

#!/usr/bin/perl

print "Hello, world\n";
print 'Hello, world\n';

这将产生以下结果:

Hello, world
Hello, world\n$

单引号和双引号之间存在重要区别。只有双引号内插变量和特殊字符(如换行符 \n),而单引号不内插任何变量或特殊字符。查看下面的示例,我们使用 $a 作为变量存储一个值,然后打印该值:

#!/usr/bin/perl

$a = 10;
print "Value of a = $a\n";
print 'Value of a = $a\n';

这将产生以下结果:

Value of a = 10
Value of a = $a\n$

“Here” 文档

您可以非常方便地存储或打印多行文本。您甚至可以在“here”文档中使用变量。下面是一个简单的语法,请仔细检查,在 << 和标识符之间不能有空格。

标识符可以是裸词或一些带引号的文本,就像我们在下面使用的 EOF 一样。如果标识符是带引号的,则您使用的引号类型决定了“here”文档中文本的处理方式,就像在常规引号中一样。未加引号的标识符就像双引号一样。

#!/usr/bin/perl

$a = 10;
$var = <<"EOF";
This is the syntax for here document and it will continue
until it encounters a EOF in the first line.
This is case of double quote so variable value will be 
interpolated. For example value of a = $a
EOF
print "$var\n";

$var = <<'EOF';
This is case of single quote so variable value will be 
interpolated. For example value of a = $a
EOF
print "$var\n";

这将产生以下结果:

This is the syntax for here document and it will continue
until it encounters a EOF in the first line.
This is case of double quote so variable value will be
interpolated. For example value of a = 10

This is case of single quote so variable value will be
interpolated. For example value of a = $a

转义字符

Perl 使用反斜杠 (\) 字符来转义任何可能干扰我们代码的字符类型。让我们举一个我们想要打印双引号和 $ 符号的例子:

#!/usr/bin/perl

$result = "This is \"number\"";
print "$result\n";
print "\$result\n";

这将产生以下结果:

This is "number"
$result

Perl 标识符

Perl 标识符是用于识别变量、函数、类、模块或其他对象的名称。Perl 变量名以 $、@ 或 % 开头,后跟零个或多个字母、下划线和数字 (0 到 9)。

Perl 不允许在标识符中使用 @、$ 和 % 等标点符号。Perl 是一种区分大小写的编程语言。因此,$Manpower$manpower 在 Perl 中是两个不同的标识符。

广告