4K+ 次查看
如果 R 中的两个数据框具有相同数量的列,则我们可以找到这些数据框列之间的相关系数,这将是相关矩阵。例如,如果我们有一个包含列 x 和 y 的数据框 df1,以及另一个包含列 a 和 b 的数据框 df2,那么 df1 和 df2 之间的相关系数可以通过 cor(df1, df2) 来找到。示例 1考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 39.56630 38.25632 2 39.43689 44.14647 3 40.80479 37.43309 ... 阅读更多
131 次查看
abline 函数可以在现有绘图中为我们提供一条截距为 0,斜率为 1 的直线。我们需要将系数作为 abline(coef = c(0,1)) 传递到函数中。因此,我们可以使用此函数添加一条从左下角到右上角的线。这也被称为对角线,因为它连接一侧的端点与另一侧的相对端点。示例> plot(1:10,type="n") > abline(coef=c(0,1))输出
1K+ 次查看
可以通过使用 dplyr 包的 rowwise 函数以及 mutate 函数在数据框中添加新的平均值列来找到行值的平均值。rowwise 函数实际上帮助 R 按行读取数据框中的值,然后我们可以使用 mean 函数找到平均值,如下面的示例所示。示例 1考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 0 8 2 2 3 3 2 5 4 0 5 5 3 2 6 0 10 7 3 5 8 1 7 9 0 ... 阅读更多
137 次查看
中心极限定理指出,随着样本量的增加,样本均值的分布接近正态分布。因此,无论实际总体分布如何,如果我们取较大样本量的样本并找到这些样本的均值,则这些样本均值的分布将近似于正态分布。我们可以通过创建此类均值的直方图在 R 中显示它。示例 1> x y
在线性模型中,残差是观测值与拟合值之间的差值,对于广义线性模型来说,它并没有什么不同。线性模型和广义线性模型之间的区别在于我们使用概率分布来创建广义线性模型。如果我们想找到广义线性模型的残差,则可以使用 resid 函数,就像在线性模型中使用它一样。示例 1考虑以下数据框:实时演示> x1 y1 df1 df1输出 x1 y1 1 4 2 2 3 3 3 5 3 4 4 2 ... 阅读更多
6K+ 次查看
添加一列连续数字可能具有不同的目标,例如获取数字序列、表示序列号、表示 ID、识别每一行或一个变量。如果我们知道行数,则可以为此目的使用从任何数字开始到行数的序列。示例 1考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 6.137898 5.203712 2 5.283467 5.057344 3 5.873749 4.907388 4 7.628762 5.012650 5 4.134700 4.988379 6 5.340686 4.684900 7 5.126999 4.821752 8 3.722762 4.974044 9 ... 阅读更多
754 次查看
有时我们想要找到条件累积和,这些条件可以重置特定值出现时的累积和。例如,查找变量帧的累积和,但在出现 1 时重新启动总和。在 R 中,我们可以借助 with、ave 和 cumusum 函数来做到这一点,如下面的示例所示。示例 1考虑以下数据框:实时演示> ID Ratings df1 df1输出 ID Ratings 1 1 0 2 2 2 3 3 0 4 4 0 5 5 0 6 6 ... 阅读更多
853 次查看
如果我们在 R 数据框中具有两列连续列和一列分类列,则可以找到分类列中类别之间连续值的相关系数。为此,我们可以使用 by 函数并将 cor 函数与 spearman 方法一起传递,如下面的示例所示。示例 1考虑以下数据框:实时演示> x1 y1 z1 df1 df1输出 x1 y1 z1 1 A 1.1155324 2 2 C 0.9801564 3 3 B 0.9116162 1 4 A 0.8406772 3 5 C 0.8009355 2 6 A 0.9331637 2 7 B 1.0642089 ... 阅读更多
R 中的 grepl 函数在 R 数据框的每个字符向量或列的每个元素中搜索与参数模式匹配的内容。如果我们想使用 grepl 对 R 数据框的行进行子集选择,则可以通过访问包含字符值的列,使用单方括号和 grepl 进行子集选择。示例 1考虑以下数据框:实时演示> x1 y1 z1 df1 df1输出 x1 y1 z1 1 A 0.8833979 5 2 B 0.5400075 1 3 C 0.6923827 3 4 B 1.5069186 2 5 B 0.8190962 2 6 B 0.8296171 1 7 ... 阅读更多
2K+ 次查看
如果我们有一列表示因子,那么我们可能希望找到其他列中值的平均值,以了解因子水平。这有助于比较因子的水平。在 R 中,我们可以通过使用 aggregate 函数找到此类数据的平均值。查看下面的示例以了解如何操作。示例 1考虑以下数据框:实时演示> x1 y1 df1 df1输出 x1 y1 1 D 5.801197 2 B 3.432060 3 B 6.154168 4 A 5.466655 5 D 5.171689 6 C 5.175170 7 B 5.353469 8 D ... 阅读更多