256 次浏览
如果通过使用 plot 函数指定图形的主标题来创建图形,则默认字体为普通文本。我们可能希望将字体的样式更改为斜体,以便标题更能吸引观看者的注意力。这可以通过使用 plot 函数的 font.main 参数来完成。font.main 的值 4 指的是粗体斜体字体,如果我们想使其变为粗体,则可以使用值 3。考虑以下向量并在两者之间创建散点图,并带有图形的标题 - 示例 x阅读更多
4K+ 次浏览
要查找相关矩阵,我们只需对数据框对象名称使用 cor 函数即可。例如,如果我们有一个名为 df 的数据框,则可以使用 cor(df) 查找相关矩阵。但结果将有太多小数位来表示相关性。如果我们想避免小数点后的值,我们可以使用 round 函数。考虑 base R 中的 mtcars 数据 - 示例实时演示数据(mtcars) cor(mtcars)输出 mpg cyl disp hp drat ... 阅读更多
710 次浏览
要查找向量的均方根,我们可以找到平方值的平均值,然后取结果向量的平方根。这可以在一行非常简短的代码中完成。例如,如果我们有一个向量 x,并且我们想找到该向量的均方根,则可以执行 sqrt(mean(x^2))。示例实时演示 x1
158 次浏览
使用 ggplot2 在 R 中创建的箱线图区域的默认颜色为白色,但我们可能希望将其更改为更吸引人的颜色,例如蓝色或红色。为此,我们可以使用 ggplot2 包的 geom_boxplot 函数以及 fill 参数,并传递颜色名称。考虑以下数据框 - 示例实时演示 set.seed(1321) v1
415 次浏览
在数据分析中有多种方法可以填充缺失值,其中一种方法是用数据框同一列中的前一个值填充它们。例如,如果我们在数据框 df 中有一列 x,并且此列 x 包含一些 NA 值,那么我们可以用上一行中的值填充它们。这可以在 zoo 包的 na.locf 函数的帮助下完成。考虑以下数据框 - 示例实时演示 set.seed(477) x
267 次浏览
如果数据框中存在缺失值,则所有值都不能被视为完整情况,我们可能希望仅提取完整的值。我们可能希望仅提取特定列的完整情况。因此,我们可以对要子集化的数据框的列使用 is.na 的否定。考虑以下数据框 - 示例实时演示 set.seed(123) x
817 次浏览
随机抽样是数据分析的重要组成部分,大多数情况下我们需要基于行而不是列创建随机样本,因为行代表案例。要从 R 数据框中为列的特定值创建一定百分比的行随机样本,我们可以使用 sample 函数以及 which 函数。考虑以下数据框 - 示例实时演示 set.seed(887) grp
490 次浏览
条形图表示离散数据,条形图中的条形通常颜色相同,但我们可能希望根据数据的特征或分析项目的目标突出显示特定条形。例如,如果特定条形表示严重的情况或不重要的情况,那么我们可以更改该特定条形的颜色,以便人们可以轻松地指出该条形。考虑以下数据框 - 示例实时演示 x
有时数据框的唯一标识列的记录方式与预期不符,它仅包含不满足数据特征目的的数值。因此,我们可能希望在这些数值前添加一个字符串,以使数据对查看者和分析师更有意义。这可以通过 gsub 函数轻松完成。考虑以下数据框 - 示例实时演示 set.seed(111) x1
457 次浏览
R 中没有函数可以计算总体方差,但我们可以使用总体大小和样本方差来找到它。我们知道总体方差中的除数是总体大小,如果我们将 var(它计算样本方差) 函数的输出乘以 (总体大小 - 1)/总体大小,则输出将是总体方差。示例实时演示 set.seed(141) x1