R - 快速指南

R - 概述

R 是一种用于统计分析、图形表示和报告的编程语言和软件环境。R 由新西兰奥克兰大学的 Ross Ihaka 和 Robert Gentleman 创建，目前由 R 开发核心团队开发。

R 的核心是一种解释型计算机语言，它允许分支和循环，以及使用函数进行模块化编程。为了提高效率，R 允许与用 C、C++、.Net、Python 或 FORTRAN 语言编写的过程集成。

R 在 GNU 通用公共许可证下免费提供，并且为各种操作系统（如 Linux、Windows 和 Mac）提供了预编译的二进制版本。

R 的发展历程

R 最初由新西兰奥克兰大学统计系Ross Ihaka和Robert Gentleman编写。R 于 1993 年首次出现。

一大批个人通过发送代码和错误报告为 R 做出了贡献。
自 1997 年年中以来，一直有一个核心小组（“R 核心团队”）可以修改 R 源代码档案。

R 的特点

如前所述，R 是一种用于统计分析、图形表示和报告的编程语言和软件环境。以下是 R 的重要特性：

R 是一种完善的、简单有效的编程语言，包括条件语句、循环语句、用户定义的递归函数以及输入输出功能。
R 具有有效的数据处理和存储功能。
R 提供了一套用于对数组、列表、向量和矩阵进行计算的运算符。
R 提供了大量连贯且集成的用于数据分析的工具。
R 提供了用于数据分析和显示的图形功能，可以直接在计算机上显示或打印到纸张上。

总之，R 是世界上使用最广泛的统计编程语言。它是数据科学家的首选，并得到一个充满活力且才华横溢的贡献者社区的支持。R 在大学中教授，并部署在关键业务应用程序中。本教程将通过简单易懂的步骤，结合合适的示例，教你学习 R 编程。

R - 环境设置

本地环境设置

如果你仍然希望为 R 设置你的环境，你可以按照以下步骤操作。

Windows 安装

你可以从R-3.2.2 for Windows (32/64 bit)下载 R 的 Windows 安装程序版本，并将其保存到本地目录中。

因为它是一个名为“R-version-win.exe”的 Windows 安装程序 (.exe)。你可以双击并运行安装程序，接受默认设置。如果你的 Windows 是 32 位版本，它将安装 32 位版本。但如果你的 Windows 是 64 位版本，则它将安装 32 位和 64 位版本。

安装后，你可以在 Windows 程序文件下的“R\R3.2.2\bin\i386\Rgui.exe”目录结构中找到运行程序的图标。单击此图标将显示 R-GUI，它是用于执行 R 编程的 R 控制台。

Linux 安装

R 可作为许多 Linux 版本的二进制文件，位于R 二进制文件。

安装 Linux 的说明因发行版而异。这些步骤在上述链接中每个类型的 Linux 版本下都有说明。但是，如果你很着急，可以使用yum命令安装 R，如下所示：

$ yum install R

以上命令将安装 R 编程的核心功能以及标准包，如果你仍然需要其他包，则可以启动 R 提示符，如下所示：

$ R
R version 3.2.0 (2015-04-16) -- "Full of  Ingredients"          
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-redhat-linux-gnu (64-bit)

R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.

R is a collaborative project with many  contributors.                    
Type 'contributors()' for more information and
'citation()' on how to cite R or R packages in publications.

Type 'demo()' for some demos, 'help()' for on-line help, or
'help.start()' for an HTML browser interface to help.
Type 'q()' to quit R.
>

现在，你可以在 R 提示符下使用 install 命令安装所需的包。例如，以下命令将安装plotrix包，该包是 3D 图表所需的。

> install.packages("plotrix")

R - 基本语法

按照惯例，我们将通过编写一个“Hello, World！”程序开始学习 R 编程。根据需要，你可以在 R 命令提示符下编程，也可以使用 R 脚本文件编写程序。让我们逐一检查两者。

R 命令提示符

一旦你设置了 R 环境，只需在你的命令提示符下键入以下命令即可轻松启动 R 命令提示符：

$ R

这将启动 R 解释器，你将获得一个提示符>，你可以在其中开始键入程序，如下所示：

> myString <- "Hello, World!"
> print ( myString)
[1] "Hello, World!"

这里第一条语句定义了一个字符串变量 myString，我们为其赋值一个字符串“Hello, World！”，然后下一条语句 print() 用于打印存储在变量 myString 中的值。

R 脚本文件

通常，你将通过在脚本文件中编写程序来进行编程，然后在命令提示符下使用称为Rscript的 R 解释器执行这些脚本。因此，让我们从在名为 test.R 的文本文件中编写以下代码开始：

数据类型	示例	验证
逻辑型	TRUE, FALSE	实时演示 v <- TRUE print(class(v)) 它会产生以下结果： [1] "logical"
数值型	12.3, 5, 999	实时演示 v <- 23.5 print(class(v)) 它会产生以下结果： [1] "numeric"
整数型	2L, 34L, 0L	实时演示 v <- 2L print(class(v)) 它会产生以下结果： [1] "integer"
复数型	3 + 2i	实时演示 v <- 2+5i print(class(v)) 它会产生以下结果： [1] "complex"
字符型	'a' , '"good", "TRUE", '23.4'	实时演示 v <- "TRUE" print(class(v)) 它会产生以下结果： [1] "character"
原始型	"Hello" 存储为 48 65 6c 6c 6f	实时演示 v <- charToRaw("Hello") print(class(v)) 它会产生以下结果： [1] "raw"

变量名	有效性	原因
var_name2.	有效	包含字母、数字、点和下划线
var_name%	无效	包含字符'%'。仅允许点(.)和下划线。
2var_name	无效	以数字开头
.var_name, var.name	有效	可以以点(.)开头，但点(.)后面不能跟着数字。
.2var_name	无效	起始点后跟着数字，使其无效。
_var_name	无效	以_开头，无效

运算符	描述	示例
+	将两个向量相加	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v+t) 它会产生以下结果： [1] 10.0 8.5 10.0
−	从第一个向量中减去第二个向量	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v-t) 它会产生以下结果： [1] -6.0 2.5 2.0
*	将两个向量相乘	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v*t) 它会产生以下结果： [1] 16.0 16.5 24.0
/	将第一个向量除以第二个向量	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v/t) 当我们执行以上代码时，它会产生以下结果： [1] 0.250000 1.833333 1.500000
%%	第一个向量除以第二个向量的余数	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v%%t) 它会产生以下结果： [1] 2.0 2.5 2.0
%/%	第一个向量除以第二个向量的结果（商）	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v%/%t) 它会产生以下结果： [1] 0 1 1
^	第一个向量以第二个向量为指数的幂	实时演示 v <- c( 2,5.5,6) t <- c(8, 3, 4) print(v^t) 它会产生以下结果： [1] 256.000 166.375 1296.000

运算符	描述	示例
>	检查第一个向量的每个元素是否大于第二个向量的对应元素。	实时演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v>t) 它会产生以下结果： [1] FALSE TRUE FALSE FALSE
<	检查第一个向量的每个元素是否小于第二个向量的对应元素。	实时演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v < t) 它会产生以下结果： [1] TRUE FALSE TRUE FALSE
==	检查第一个向量的每个元素是否等于第二个向量的对应元素。	实时演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v == t) 它会产生以下结果： [1] FALSE FALSE FALSE TRUE
<=	检查第一个向量的每个元素是否小于或等于第二个向量的对应元素。	实时演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v<=t) 它会产生以下结果： [1] TRUE FALSE TRUE TRUE
>=	检查第一个向量的每个元素是否大于或等于第二个向量的对应元素。	实时演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v>=t) 它会产生以下结果： [1] FALSE TRUE FALSE TRUE
!=	检查第一个向量的每个元素是否不等于第二个向量的对应元素。	实时演示 v <- c(2,5.5,6,9) t <- c(8,2.5,14,9) print(v!=t) 它会产生以下结果： [1] TRUE TRUE TRUE FALSE

序号	语句和描述
1	if语句 if语句由一个布尔表达式后跟一个或多个语句组成。
2	if...else语句 if语句后可以跟一个可选的else语句，当布尔表达式为false时执行。
3	switch语句 switch语句允许将变量与其值列表进行相等性测试。

序号	循环类型和描述
1	repeat循环多次执行一系列语句，并缩写管理循环变量的代码。
2	while循环当给定条件为true时重复语句或语句组。它在执行循环体之前测试条件。
3	for循环类似于while语句，只是它在循环体结束时测试条件。

序号	控制语句和描述
1	break语句终止循环语句并将执行转移到循环后的下一条语句。
2	Next语句 next语句模拟R switch的行为。

R - 快速指南

R - 概述

R 的发展历程

R 的特点

R - 环境设置

本地环境设置

Windows 安装

Linux 安装

R - 基本语法

R 命令提示符

R 脚本文件

注释

R - 数据类型

向量

列表

矩阵

数组

因子

数据框

R - 变量

变量赋值

变量的数据类型

查找变量

删除变量

R - 运算符

运算符类型

算术运算符

关系运算符

逻辑运算符

赋值运算符

其他运算符

R - 决策

R - 循环

循环控制语句

R - 函数

函数定义

函数组件

内置函数

用户定义函数

调用函数

无参数调用函数

带参数值调用函数（按位置和按名称）

使用默认参数调用函数

函数的惰性求值

R - 字符串

字符串构造规则

有效字符串示例

无效字符串示例

字符串操作

连接字符串 - paste() 函数

语法

示例

格式化数字和字符串 - format() 函数

语法

示例

计算字符串中字符的数量 - nchar() 函数

语法

示例

更改大小写 - toupper() 和 tolower() 函数

语法

示例

提取字符串的部分 - substring() 函数

语法

示例

R - 向量

向量创建

单元素向量

多元素向量

访问向量元素

向量操作

向量算术

向量元素循环

向量元素排序

R - 列表

创建列表

命名列表元素

访问列表元素

操作列表元素

合并列表

将列表转换为向量