2K+ 阅读量
通常,绘图的主标题比较简短,但我们可能需要写很长的一行作为绘图的主标题。例如,简短版本可能是“散点图”,较长版本可能是“X 和 Y 之间的散点图”。因此,在 R 的 plot 函数中,我们可以使用换行符作为主标题,例如“X 和 Y 之间的散点图”。示例set.seed(123) x
254 阅读量
处理缺失值是数据分析的初始步骤之一,也是最困难的步骤之一,因为如果我们没有使用合适的方法填充缺失值,那么整个分析的结果可能会变得毫无意义。因此,我们必须非常小心地处理缺失值。大多数情况下,为了学习目的,人们使用平均值来填充缺失值,但可以根据我们的数据特征使用许多其他值。要使用列的平均值填充缺失值,我们可以使用 zoo 包的 na.aggregate 函数。示例考虑以下数据框 -x1
362 阅读量
大多数情况下,自变量和因变量之间的关系不是线性的。因此,我们希望根据我们的经验转换因变量或自变量。因此,我们也希望绘制这些转换以可视化关系,其中一种转换是取因变量的对数 10。要绘制因变量的这种转换,我们可以使用 scale_y_continuous(trans='log10')。示例考虑以下数据框 -set.seed(10) x
382 阅读量
缺失值由 NA 表示,但如果我们将其读取为“NA”,则它将成为因子变量的一个水平。如果我们认为一个向量是数值型的,并且该向量中有一个“NA”,那么它将不是数值型向量。另一方面,如果我们有一个带有 NA 的向量,那么它将是一个数值型向量。示例x1
4K+ 阅读量
回归线的斜率是回归分析中非常重要的一部分,通过找到斜率,我们可以得到因变量预期增加或减少的值的估计。但是置信区间提供了我们期望在样本量相同的情况下 95% 时间出现的斜率值的范围。要找到回归线斜率的 95% 置信区间,我们可以使用带有回归模型对象的 confint 函数。示例考虑以下数据框 -set.seed(1) x
当我们在 R 中创建矩阵时,它的列名没有定义,但我们可以命名它们,或者可能导入一个可能具有列名的矩阵。如果列名未定义,那么我们只需使用列号来提取列,但如果我们有列名,那么我们可以按名称以及其名称来选择列。示例 1M1
402 阅读量
小提琴图类似于箱线图,但看起来像小提琴,并显示不同类别数据的分布。它显示了数据值在不同点的密度。在 R 中,我们可以借助 ggplot2 包绘制小提琴图,因为它有一个名为 geom_violin 的函数用于此目的。示例考虑以下数据框 -set.seed(1) x
698 阅读量
在任何绘图中,垂直线通常用于显示某些阈值,例如所考虑变量的范围。ggplot2 包提供 geom_vline 函数在绘图上创建垂直线,并且我们有此函数的 linetype 参数,可用于绘制虚线垂直线。示例考虑以下数据框 -set.seed(9) x
924 阅读量
如果向量已排序,则 rank 函数给出向量中值的排名,但顺序与原始向量相同,而 order 函数给出原始值在向量中的位置,但顺序为升序排序。rank 函数主要用于处理序数变量时的排名,因此,无论何时需要值的排名,都应使用它,另一方面,order 经常用于对所有数值进行排序。示例set.seed(100) x1
R 中有非常多的包,并且每个包都有不同的目标,因此,这些包中的函数数量足够多,可以解决分析中的问题。一个包可能包含 15 个函数,而另一个包可能包含 100 个函数,这完全取决于需要。我们可以使用 lsf.str 函数查找包中的函数,但在了解包中的函数之前,我们需要加载该包。示例 1library(BSDA) lsf.str("package:BSDA") CIsim : function (samples = 100, n = 30, mu = 0, sigma = 1, conf.level = 0.95, type = "Mean") Combinations : function ... 阅读更多