6K+ 浏览量
通常,我们会发现表示因子水平的值被记录为数值,因此,我们需要将这些数值转换为因子。通过这种方式,我们可以正确地使用因子列进行分析,否则 R 程序会将因子视为数值,并且分析结果将不正确。示例 实时演示数据(mtcars) str(mtcars)输出'data.frame': 32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 ... $ cyl : num 6 6 4 6 8 6 8 4 4 6 ... $ disp: num 160 160 108 258 360 ... $ hp : num 110 110 93 110 175 105 245 62 95 123 ... $ drat: num 3.9 3.9 3.85 3.08 3.15 2.76 3.21 3.69 3.92 3.92 ... $ wt : num 2.62 2.88 2.32 3.21 3.44 ... $ qsec: num 16.5 17 18.6 19.4 17 ... $ vs : num 0 0 1 1 0 1 0 1 1 1 ... $ am : num 1 1 1 0 0 0 0 0 0 0 ... $ gear: num 4 4 4 3 3 3 3 4 4 4 ... $ carb: num 4 4 1 1 2 1 4 2 2 4 ... mtcars$cyl
1K+ 浏览量
默认情况下,使用 plot 函数创建的图的图例覆盖区域为全尺寸,即 1(区域大小范围为 0 到 1,其中 1 表示全尺寸,0 表示无)。要减小尺寸,我们可以使用 legend 函数的 cex 参数,如下例所示。示例考虑以下向量和这两个向量之间创建的图 −x
8K+ 浏览量
R 平方值是决定系数,它告诉我们自变量解释因变量变化的百分比或比例。要在不借助任何包的情况下在带有回归模型线的散点图上显示此值,我们可以使用 plot 函数以及 abline 和 legend 函数。考虑以下数据框 −示例 实时演示set.seed(1234) x
386 浏览量
如果一个向量包含五个值,那么将有十个成对差异。例如,假设我们有五个从 1 开始的数字,那么这些值的成对组合将是 (1,2)、(1,3)、(1,4)、(1,5)、(2,3)、(2,4)、(2,5)、(3,4)、(3,5)、(4,5)。现在要找到绝对成对差异,我们需要找到这些组合之间的差异并取答案的绝对值,因此结果将是 1、2、3、4、1、2、3、1、2、1。示例 实时演示x1
884 浏览量
创建任何序列的最佳方法是使用 seq 函数创建它,这也适用于日期序列。但在日期的情况下,我们需要以日期格式读取日期,以便 R 能够理解输入类型并创建相应的向量。如果我们不使用日期值对应的日期格式,那么 R 将无法理解,并导致错误。示例 实时演示x1
2K+ 浏览量
列联表中边际上的行和列总和始终有用,因为它们用于不同类型的计算,例如优势比、概率等。如果 R 数据框具有因子列,那么我们可以为该数据框创建列联表,这可以通过使用 addmargins 函数来实现。示例考虑以下数据框 − 实时演示x1
499 浏览量
假设我们有两个值 0 和 1,那么这些值的组合有多少种可能,答案是 8,这些组合是 (0,0)、(1,0)、(0,1)、(1,1)。在 R 中,我们可以使用 expand.grid 函数创建这些组合,但要将其保存在数据框中,我们需要使用 as.data.frame 函数。示例 实时演示df1
349 浏览量
标准正态分布的均值为零,标准差为 1。因此,当我们用三个西格玛限绘制它时,我们在 X 轴上有六个点,分别指零周围的正负。如果定义了限制,则可以使用更大的宽度显示绘图,这将更改曲线的显示。我们可以通过为标准正态变量的长度及其密度创建一个序列来做到这一点。考虑以下对应于限制和密度的向量 −x
3K+ 浏览量
使用 corrplot 函数创建的相关矩阵图中的相关系数值大小范围为 0 到 1,0 表示最小,1 表示最大,默认为 1。要更改此大小,我们需要使用 number.cex 参数。例如,如果我们想将大小减半,则可以使用 number.cex = 0.5。示例考虑以下矩阵 − 实时演示set.seed(99) M corrplot(cor(M), addCoef.col="black")输出将相关系数值的大小更改为 0.75 −corrplot(cor(M), addCoef.col="black", number.cex=0.75)输出将相关系数值的大小更改为 0.30 −> corrplot(cor(M), addCoef.col="black", number.cex=0.30)输出阅读更多
370 浏览量
我们经常需要在数据分析中按组求平均值,尤其是在使用方差分析技术的情况下,因为这些技术可以帮助我们根据其集中趋势度量和变异度量来比较不同的组。这可以通过使用 aggregate 函数来实现,以便输出可以保存在数据框对象中。在下面的示例中,我们可以看到如何做到这一点,还可以检查最终的对象类型。示例考虑以下数据框 − 实时演示set.seed(109) Salary