4K+ 阅读量
如果 R 中的两个数据框具有相同数量的列,那么我们可以在这些数据框的列之间找到相关系数,这将是相关矩阵。例如,如果我们有一个包含列 x 和 y 的数据框 df1,以及另一个包含列 a 和 b 的数据框 df2,那么 df1 和 df2 之间的相关系数可以通过 cor(df1, df2) 来找到。示例 1请考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 39.56630 38.25632 2 39.43689 44.14647 3 40.80479 37.43309 ... 阅读更多
131 阅读量
abline 函数可以在现有的绘图中为我们提供一条从截距 0 斜率为 1 的直线。我们需要将系数作为 abline(coef = c(0,1)) 传递到函数中。因此,我们可以使用此函数添加一条从左下角到右上角的线。这也被称为对角线,因为它连接一侧的端点与另一侧的相对端点。示例> plot(1:10,type="n") > abline(coef=c(0,1))输出
1K+ 阅读量
可以通过使用 dplyr 包的 rowwise 函数以及 mutate 函数将新的平均值列添加到数据框中来找到行值的平均值。rowwise 函数实际上帮助 R 按行读取数据框中的值,然后我们可以使用 mean 函数找到平均值,如下面的示例所示。示例 1请考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 0 8 2 2 3 3 2 5 4 0 5 5 3 2 6 0 10 7 3 5 8 1 7 9 0 ... 阅读更多
137 阅读量
中心极限定理指出,随着样本量增加,样本均值的分布接近正态分布。因此,无论实际总体分布如何,如果我们取较大样本量并找到这些样本的均值,那么这些样本均值的分布将近似于正态分布。我们可以通过创建此类均值的直方图在 R 中显示这一点。示例 1> x y
在线性模型中,残差是观察值与拟合值之间的差值,对于广义线性模型来说,它没有区别。线性模型和广义线性模型之间的区别在于我们使用概率分布来创建广义线性模型。如果我们想找到广义线性模型的残差,那么可以使用 resid 函数,就像它在线性模型中使用一样。示例 1请考虑以下数据框:实时演示> x1 y1 df1 df1输出 x1 y1 1 4 2 2 3 3 3 5 3 4 4 2 ... 阅读更多
6K+ 阅读量
添加一列连续数字可能具有不同的目标,例如获取数字序列、表示序列号、表示 ID、识别每一行或一个变量。如果我们知道此目的的行数,则可以使用从任何数字开始到行数的序列。示例 1请考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 6.137898 5.203712 2 5.283467 5.057344 3 5.873749 4.907388 4 7.628762 5.012650 5 4.134700 4.988379 6 5.340686 4.684900 7 5.126999 4.821752 8 3.722762 4.974044 9 ... 阅读更多
754 阅读量
有时我们希望找到条件累积和,这些条件可以是如果出现特定值则重置累积。例如,查找变量帧的累积和,但如果出现 1 则重新开始求和。在 R 中,我们可以借助 with、ave 和 cumusum 函数来做到这一点,如下面的示例所示。示例 1请考虑以下数据框:实时演示> ID Ratings df1 df1输出 ID Ratings 1 1 0 2 2 2 3 3 0 4 4 0 5 5 0 6 6 ... 阅读更多
853 阅读量
如果我们在 R 数据框中具有两列连续数据和一列分类数据,那么我们可以找到分类数据列中类别之间连续值的的相关系数。为此,我们可以使用 by 函数并将 cor 函数与 spearman 方法一起传递,如下面的示例所示。示例 1请考虑以下数据框:实时演示> x1 y1 z1 df1 df1输出 x1 y1 z1 1 A 1.1155324 2 2 C 0.9801564 3 3 B 0.9116162 1 4 A 0.8406772 3 5 C 0.8009355 2 6 A 0.9331637 2 7 B 1.0642089 ... 阅读更多
R 中的 grepl 函数在字符向量或 R 数据框的列的每个元素中搜索与参数模式匹配的内容。如果我们想使用 grepl 子集 R 数据框的行,则可以通过访问包含字符值的列,使用单方括号和 grepl 进行子集化。示例 1请考虑以下数据框:实时演示> x1 y1 z1 df1 df1输出 x1 y1 z1 1 A 0.8833979 5 2 B 0.5400075 1 3 C 0.6923827 3 4 B 1.5069186 2 5 B 0.8190962 2 6 B 0.8296171 1 7 ... 阅读更多
2K+ 阅读量
如果我们有一列表示因子,那么我们可能希望找到其他列中值的平均值(对于因子水平)。这有助于比较因子的水平。在 R 中,我们可以使用 aggregate 函数找到此类数据的平均值。查看下面的示例以了解如何操作。示例 1请考虑以下数据框:实时演示> x1 y1 df1 df1输出 x1 y1 1 D 5.801197 2 B 3.432060 3 B 6.154168 4 A 5.466655 5 D 5.171689 6 C 5.175170 7 B 5.353469 8 D ... 阅读更多