440 次浏览
点图是一种直方图,它用点而不是条形来显示数据,通常用于小型数据集。在 ggplot2 中,我们使用 `geom_dotplot` 函数创建点图,但是必须传入正确的 `binwidth` 参数,否则会收到警告:“警告:忽略未知参数:bins `stat_bindot()` 使用 `bins = 30`。使用 `binwidth` 选择更好的值。”示例考虑以下数据框:-> x df1 library(ggplot2)创建 x 的点图:-> ggplot(df1, aes(x))+geom_dotplot(binwidth=0.2)输出让我们来看另一个例子:-> y df2 ggplot(df2, aes(y))+geom_dotplot(binwidth=0.2)输出阅读更多
198 次浏览
百分位数帮助我们确定数据集里位于某个百分比的值。例如,如果我们有一个大小为 100 的向量,包含任意值,并且假设向量的第十百分位数为 25,这意味着向量中百分之十的值小于 25,或者我们可以说,向量中百分之九十的值大于 25。我们可以使用 R 中的 `quantile` 函数查找向量的百分位数。示例实时演示> x1 x1输出[1] 7 1 7 6 6 5 3 1 5 5 4 ... 阅读更多
1K+ 次浏览
任何大小矩阵的行和列的删除或添加大多使用单方括号完成,这也是最简单的方法。要删除行和列,我们只需要使用列索引或行索引,如果要删除多个行或列,则可以使用逗号将它们分隔开,并将它们放在 c 中,例如 c(-1, -2)。如果要按顺序删除多个行或列,则可以使用冒号。示例实时演示> M M输出[, 1] [, 2] [, 3] [, ... 阅读更多
398 次浏览
一般线性模型不假设所考虑的变量服从正态分布,因此,我们可以使用其他概率分布来创建一般线性模型。实际上,我们应该说,如果数据不服从正态分布,则可以使用一般线性模型尝试不同的分布,并检查模型是否合适。p 值在选择最佳模型中起着重要作用,我们可能希望从模型对象中提取它们。这可以使用 `coef` 函数完成。示例考虑以下数据框:实时演示> set.seed(123) > var1 var2 var3 ... 阅读更多
762 次浏览
向量可以包含递增或递减的数值,或者它们可以是随机的,这意味着较高的值可能出现在较低的值之后,然后又出现较高的值。向量元素递增排列的示例是 1, 2, 3,反之则是递减排列。我们可以通过检查向量所有值的差是否大于或等于零来检查向量是否按递增顺序或递减顺序排列,这可以使用 `diff` ... 阅读更多
290 次浏览
有时我们想在图上放置一个垂直矩形,其颜色与图的其余区域不同。此垂直矩形是根据 x 轴的条件值创建的,根据数据的特性表示枢轴区域或不重要区域。这些 x 变量的值作为垂直线放置在图上,这两条线之间的区域被阴影覆盖。这可以使用 `geom_rect` 函数完成。示例考虑以下数据框:实时演示> x y df df输出x y 1 2 9 2 3 7 3 ... 阅读更多
402 次浏览
使用 `plot` 函数创建的任何图都不会显示带有网格线的图。另一方面,如果我们使用 ggplot2 包创建图,则图具有网格线。因此,如果我们希望在图上显示网格线,则应该使用 ggplot2 包创建图,或者可以使用命令 `grid()` 在使用 `plot` 函数创建的图上添加网格线。示例使用 `plot` 函数创建直方图:-> hist(rnorm(100))输出在上述图中添加网格线:-> grid()输出
255 次浏览
当我们创建直方图并将其保存在对象名称中时,我们可以通过调用该对象来提取频率作为中间值或断点的计数。我们可以认为从对象获得的中间值或断点是针对其在直方图上绘制频率的实际值。示例> x1 Histogram1 Histogram1输出$breaks [1] 0 1 2 3 4 5 6 7 8 9 10 11 12 13 $counts [1] 45 82 150 156 172 142 113 62 43 20 9 5 1 $density [1] 0.045 0.082 0.150 0.156 0.172 0.142 0.113 0.062 0.043 0.020 ... 阅读更多
225 次浏览
当我们创建图时,它显示了创建图的函数传递的值,但我们可能希望显示其他值以通过图提供一些信息,而这些信息可以是作为水平线的阈值,我们也可以称其为截止值。这可以使用 ggplot2 包的 `geom_hline` 函数完成。示例考虑以下数据框:-> x y df df输出x y 1 0.27810573 2.6545571 2 1.39185082 3.4845292 3 -0.19068920 1.7043852 4 1.00791317 1.4324814 5 -1.74964913 1.7996093 6 -0.13123079 2.5004350 ... 阅读更多
812 次浏览
每个月都有共同的日期,除了少数月份,例如 2 月没有 30 或 31 天,甚至在某些年份没有 29 天,有些月份有 30 天,而有些月份有 31 天。因此,查找日期(例如第一天、中间日期或最后一天)并非易事,但可以使用 base R 中的 `seq` 函数完成。示例实时演示> seq(as.Date("2020-01-01"), length=12, by="1 month")输出[1] "2020-01-01" "2020-02-01" "2020-03-01" "2020-04-01" "2020-05-01" [6] "2020-06-01" "2020-07-01" "2020-08-01" "2020-09-01" "2020-10-01" [11] "2020-11-01" "2020-12-01"示例实时演示> seq(as.Date("2020-01-01"), length=36, by="1 month") 输出[1] "2020-01-01" "2020-02-01" "2020-03-01" "2020-04-01" "2020-05-01" [6] ... 阅读更多