440 次查看
点图是一种直方图,它使用点而不是条形来显示数据,它用于小型数据集。在 ggplot2 中,我们有 geom_dotplot 函数来创建点图,但我们必须传递正确的 binwidth(它是 geom_dotplot 的一个参数),这样我们才能避免出现警告“警告:忽略未知参数:bins `stat_bindot()` 使用 `bins = 30`。使用 `binwidth` 选择更好的值。”示例考虑以下数据框 -> x df1 library(ggplot2)创建 x 的点图 -> ggplot(df1, aes(x))+geom_dotplot(binwidth=0.2)输出让我们再看一个例子 -> y df2 ggplot(df2, aes(y))+geom_dotplot(binwidth=0.2)输出阅读更多
198 次查看
百分位数帮助我们确定数据集中位于特定百分比处的值。例如,如果我们有一个大小为 100 的向量,其中包含任何值,并假设该向量的第十百分位数为 25,这意味着向量中十个百分比的值小于 25,或者我们可以说,向量中九十个百分比的值大于 25。我们可以使用 R 中的 quantile 函数找到向量值的百分位数。示例 实时演示> x1 x1输出[1] 7 1 7 6 6 5 3 1 5 5 4 ... 阅读更多
1K+ 次查看
任何大小的矩阵的行和列的删除或添加大多是通过使用单个方括号来完成的,这也是最简单的方法。要删除行和列,我们只需要使用列索引或行索引,如果我们想要删除多个行或列,则可以通过在 c 中插入它们并用逗号分隔它们来完成,例如 c(-1, -2)。如果我们想要按顺序删除多个行或列,则可以使用冒号。示例 实时演示> M M输出 [, 1] [, 2] [, 3] [, ... 阅读更多
398 次查看
一般线性模型不假设所考虑的变量服从正态分布,因此,我们可以使用其他概率分布来创建一般线性模型。我们实际上应该说,如果数据不服从正态分布,那么我们可以使用一般线性模型尝试不同的分布,并检查模型是否合适。p 值在选择最佳模型中起着重要作用,我们可能希望从模型对象中提取它们。这可以通过使用 coef 函数来完成。示例考虑以下数据框 - 实时演示> set.seed(123) > var1 var2 var3 ... 阅读更多
762 次查看
向量可以包含本质上是递增或递减的值,或者它们也可以是随机的,这意味着较高的值可能出现在较低的值之后,然后是较高的值。向量元素递增排列的一个例子是 1、2、3,而其相反则是递减排列。我们可以通过检查向量所有值的差是否大于或等于零来检查向量是否按升序或降序排列,这可以通过使用 diff ... 阅读更多
290 次查看
有时我们希望在图上放置一个垂直矩形,该矩形与图的其余区域相比具有不同的颜色。此垂直矩形是根据 x 轴的条件值创建的,并根据数据的特征表示枢轴区域或不重要区域。这些 x 变量的值作为垂直线放置在图上,这些线之间的区域被阴影覆盖。这可以通过使用 geom_rect 函数来完成。示例考虑以下数据框 - 实时演示> x y df df输出 x y 1 2 9 2 3 7 3 ... 阅读更多
402 次查看
使用 plot 函数创建的任何图都不会显示带网格线的图。另一方面,如果我们使用 ggplot2 包创建图,则该图将具有网格线。因此,如果我们希望在图上显示网格线,则应使用 ggplot2 包创建图,或者可以使用命令 grid() 在由 plot 函数创建的图上添加网格线。示例使用 plot 函数创建直方图 -> hist(rnorm(100))输出向上述图添加网格线 -> grid()输出
255 次查看
当我们创建直方图并将其保存在一个对象名称中时,我们可以通过调用该对象来提取频率作为中间值或断点的计数。我们可以认为由对象获得的中间值或断点是针对其在直方图上绘制频率的实际值。示例> x1 Histogram1 Histogram1输出$breaks [1] 0 1 2 3 4 5 6 7 8 9 10 11 12 13 $counts [1] 45 82 150 156 172 142 113 62 43 20 9 5 1 $density [1] 0.045 0.082 0.150 0.156 0.172 0.142 0.113 0.062 0.043 0.020 ... 阅读更多
225 次查看
当我们创建图时,它会显示创建图的函数传递的值,但我们可能希望显示一些其他值以通过图提供一些信息,并且该信息可以是作为水平线的阈值,或者我们也可以称之为截止值。这可以通过使用 ggplot2 包的 geom_hline 函数来完成。示例考虑以下数据框 -> x y df df输出 x y 1 0.27810573 2.6545571 2 1.39185082 3.4845292 3 -0.19068920 1.7043852 4 1.00791317 1.4324814 5 -1.74964913 1.7996093 6 -0.13123079 2.5004350 ... 阅读更多
812 次查看
每个月都有常见的日期,但有一些例外,例如2月没有30号或31号,甚至在某些年份没有29号,有些月份包含30天,而有些月份包含31天。因此,查找一个日期,比如第一个日期、中间日期或最后一个日期,并不是一件容易的事,但借助于base R中的seq函数可以实现。示例 实时演示> seq(as.Date("2020-01-01"), length=12, by="1 month")输出[1] "2020-01-01" "2020-02-01" "2020-03-01" "2020-04-01" "2020-05-01" [6] "2020-06-01" "2020-07-01" "2020-08-01" "2020-09-01" "2020-10-01" [11] "2020-11-01" "2020-12-01"示例 实时演示> seq(as.Date("2020-01-01"), length=36, by="1 month") 输出[1] "2020-01-01" "2020-02-01" "2020-03-01" "2020-04-01" "2020-05-01" [6] ... 阅读更多