6K+ 浏览量
添加一列连续数字可能会有不同的目标,例如获取数字序列、表示序列号、表示 ID、识别每一行或一个变量。如果我们知道行数,我们可以为此目的使用从任意数字开始到行数的序列。示例 1考虑以下数据框:实时演示> x1 x2 df1 df1输出 x1 x2 1 6.137898 5.203712 2 5.283467 5.057344 3 5.873749 4.907388 4 7.628762 5.012650 5 4.134700 4.988379 6 5.340686 4.684900 7 5.126999 4.821752 8 3.722762 4.974044 9 ... 阅读更多
754 浏览量
有时我们希望找到条件累积和,这些条件可以重置某个特定值出现时的累积和。例如,查找变量框架的累积和,但如果出现 1 则重新开始求和。在 R 中,我们可以借助 with、ave 和 cumusum 函数来实现这一点,如下面的示例所示。示例 1考虑以下数据框:实时演示> ID Ratings df1 df1输出 ID Ratings 1 1 0 2 2 2 3 3 0 4 4 0 5 5 0 6 6 ... 阅读更多
853 浏览量
如果我们在 R 数据框中具有两个连续列和一列分类列,那么我们可以找到分类列中类别之间连续值的相关系数。为此,我们可以使用 by 函数并将 cor 函数与 spearman 方法一起传递,如下面的示例所示。示例 1考虑以下数据框:实时演示> x1 y1 z1 df1 df1输出 x1 y1 z1 1 A 1.1155324 2 2 C 0.9801564 3 3 B 0.9116162 1 4 A 0.8406772 3 5 C 0.8009355 2 6 A 0.9331637 2 7 B 1.0642089 ... 阅读更多
4K+ 浏览量
R 中的 grepl 函数在 R 数据框的每个元素或列中搜索与参数模式的匹配项。如果我们想使用 grepl 子集化 R 数据框的行,则可以通过访问包含字符值的列,使用单方括号和 grepl 进行子集化。示例 1考虑以下数据框:实时演示> x1 y1 z1 df1 df1输出 x1 y1 z1 1 A 0.8833979 5 2 B 0.5400075 1 3 C 0.6923827 3 4 B 1.5069186 2 5 B 0.8190962 2 6 B 0.8296171 1 7 ... 阅读更多
2K+ 浏览量
如果我们有一列表示因子,那么我们可能希望查找其他列中值的均值,以获得因子水平。这有助于比较因子的水平。在 R 中,我们可以使用 aggregate 函数找到此类数据的均值。查看下面的示例以了解如何完成此操作。示例 1考虑以下数据框:实时演示> x1 y1 df1 df1输出 x1 y1 1 D 5.801197 2 B 3.432060 3 B 6.154168 4 A 5.466655 5 D 5.171689 6 C 5.175170 7 B 5.353469 8 D ... 阅读更多
1K+ 浏览量
字符串向量在双引号内包含元素,而整数向量没有任何引号。有时整数值存储在双引号中,因此这些值的向量在 R 中被视为字符串向量,但我们需要整数的值来执行数学运算。因此,我们可以使用 as.integer 函数将字符串向量转换为整数向量。示例 1实时演示> x1 x1输出[1] "3" "2" "1" "2" "1" "1" "1" "1" "1" "1" "3" "3" "3" "1" "2" "1" "1" "2" [19] "2" "3" "3" "3" "3" "2" "3" "3" "3" "2" "1" "2" "3" "3" "2" "1" ... 阅读更多
209 浏览量
有很多方法可以找到通过排除对角线元素的矩阵元素的均值,这个均值实际上是下三角矩阵和上三角矩阵的均值。我们可以通过创建下三角矩阵和上三角矩阵的向量来简单地使用均值函数,如下面的示例所示。示例 1实时演示> M1 M1输出 [, 1] [, 2] [, 3] [, 4] [1, ] 1 6 3 6 [2, ] 8 5 3 4 [3, ] 5 4 4 6 [4, ] 5 5 3 4 ... 阅读更多
777 浏览量
条形图可以借助 geom_bar 轻松创建。但是,如果我们想要为特定条形设置不同的边框,则首先需要创建条形图并将其存储在对象中。之后,我们需要将原始图与我们想要具有黑色边框的条形一起添加。查看下面的示例以了解如何完成此操作。示例考虑以下数据框:实时演示> Group Freq df df输出 Group Freq 1 G1 18 2 G2 27 3 G3 24加载 ggplot2 ... 阅读更多
矩阵的梯形形式是具有以下特征的矩阵:1. 每一行的第一个非零元素称为前导项,为 1。2. 每个前导项都位于前一行的前导项右侧的列中。3. 如果存在所有元素都为零的行,则这些行位于具有非零元素的行下方。在 R 中,我们可以使用 matlib 包的 echelon 函数来查找矩阵的梯形形式。示例实时演示> M M输出 [, 1] [, 2] [, 3] [, 4] [, 5] [1, ] 8 11 3 10 13 [2, ] ... 阅读更多
有时数据会错误地输入到系统中,这就是为什么在进行数据清理之前必须小心谨慎的原因,然后再进行分析。如果数据收集者或抽样单位找不到问题的合适选项,则可能会在答案中输入空格。如果问卷设计不当或错误地填写了空格,也会发生这种情况。此外,如果我们有分类变量,则控制类别可能会用空格填充,或者我们可能希望有一个空格类别以供以后使用新的类别。无论... 阅读更多