6K+ 浏览量
通常,我们会发现表示因子水平的值被记录为数值,因此,我们需要将这些数值转换为因子。这样,我们就可以在分析中正确使用因子列,否则 R 程序会将因子视为数值,分析结果将不正确。示例 实时演示data(mtcars) str(mtcars)输出'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num 6 6 4 6 8 6 8 4 4 6 ... $ disp: num 160 160 108 258 360 ... $ hp : num 110 110 93 110 175 105 245 62 95 123 ... $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ... $ wt : num 2.62 2.88 2.32 3.21 3.44 ... $ qsec: num 16.5 17 18.6 19.4 17 ... $ vs : num 0 0 1 1 0 1 0 1 1 1 ... $ am : num 1 1 1 0 0 0 0 0 0 0 ... $ gear: num 4 4 4 3 3 3 3 4 4 4 ... $ carb: num 4 4 1 1 2 1 4 2 2 4 ... mtcars$cyl
1K+ 浏览量
默认情况下,使用 plot 函数创建的图的图例所占区域为全尺寸,即 1(区域大小范围为 0 到 1,其中 1 指全尺寸,0 指无)。要减小尺寸,我们可以将 cex 参数与 legend 函数一起使用,如下例所示。示例考虑以下向量以及这两个向量之间创建的图 −x
8K+ 浏览量
R 平方值是决定系数,它告诉我们自变量解释的因变量变化的百分比或比例。要在不借助任何包的情况下在带有回归模型线的散点图上显示此值,我们可以将 plot 函数与 abline 和 legend 函数一起使用。考虑以下数据框 −示例 实时演示set.seed(1234) x
386 浏览量
如果一个向量包含五个值,则将有十个成对差。例如,假设我们有五个从 1 开始的数字,则这些值的成对组合将是 (1,2)、(1,3)、(1,4)、(1,5)、(2,3)、(2,4)、(2,5)、(3,4)、(3,5)、(4,5)。现在要找到绝对成对差,我们需要找到这些组合之间的差值并取答案的绝对值,因此结果将是 1、2、3、4、1、2、3、1、2、1。示例 实时演示x1
884 浏览量
创建任何序列的最佳方法是借助 seq 函数创建它,这也适用于日期序列。但在日期的情况下,我们需要以日期格式读取日期,以便 R 可以理解输入类型并创建相应的向量。如果我们不使用日期值作为日期格式,那么对 R 来说就没有意义,会导致错误。示例 实时演示x1
2K+ 浏览量
列联表中边缘上的行和列的总和始终很有用,因为它们用于不同类型的计算,例如优势比、概率等。如果 R 数据框具有因子列,则我们可以为该数据框创建列联表,这可以通过使用 addmargins 函数来完成。示例考虑以下数据框 − 实时演示x1
499 浏览量
假设我们有两个值 0 和 1,那么这些值的组合有多少种可能性,答案是 8,这些组合是 (0,0)、(1,0)、(0,1)、(1,1)。在 R 中,我们可以使用 expand.grid 函数来创建这些组合,但要将其保存在数据框中,我们需要使用 as.data.frame 函数。示例 实时演示df1
349 浏览量
标准正态分布的均值为零,标准差为一。因此,当我们用三个西格玛限制绘制它时,我们在 X 轴上有六个点指零周围的正负。如果定义了限制,则绘图可以显示更大的宽度,这将改变曲线的显示。我们可以通过为标准正态变量及其密度创建序列来做到这一点。考虑以下与限制和密度相对应的向量 −x
3K+ 浏览量
使用 corrplot 函数创建的相关矩阵图中的相关系数值大小范围为 0 到 1,0 指最小,1 指最大,默认为 1。要更改此大小,我们需要使用 number.cex 参数。例如,如果我们想将大小减半,则可以使用 number.cex = 0.5。示例考虑以下矩阵 − 实时演示set.seed(99) M corrplot(cor(M), addCoef.col="black")输出将相关系数值的大小更改为 0.75 −corrplot(cor(M), addCoef.col="black", number.cex=0.75)输出将相关系数值的大小更改为 0.30 −> corrplot(cor(M), addCoef.col="black", number.cex=0.30)输出阅读更多
370 浏览量
我们经常需要在数据分析中进行分组均值,尤其是在使用方差分析技术的情况下,因为这些技术有助于我们根据其集中趋势和变异性度量来比较不同的组。这可以通过使用 aggregate 函数来完成,以便可以将输出保存在数据框对象中。在下面的示例中,我们可以看到如何做到这一点,还可以检查最终的对象类型。示例考虑以下数据框 − 实时演示set.seed(109) Salary