909 次浏览
当我们有一个单个长字符串或一个字符串值向量,并且字符串中的值由一些特殊字符分隔时,分割这些值可以帮助我们更好地理解这些字符串。这种情况可能发生在字符串数据记录有错误或具有其他用途的情况下。我们可以使用 `strsplit` 函数进行分割。示例 在线演示x1
380 次浏览
要绘制 R 数据框的所有值,我们可以使用 `matplot` 函数。此函数根据 R 数据框的列绘制所有值,并用列号表示它们。例如,如果我们在 R 数据框中有五列,则 `matplot` 将用 1 表示第一列,用 2 表示第二列,用 3 表示第三列,依此类推。考虑以下数据框 - 示例 在线演示set.seed(555) v1
448 次浏览
如果我们将每一行值除以特定行中所有值的总和,就可以计算行值的比例。因此,比例的总和将等于 1。这可以通过将数据框除以行总和来完成,为此我们可以使用以下语法 - 语法 data_frame_name/rowSums(data_frame_name) 考虑以下数据框 - 示例 在线演示set.seed(111) x1
623 次浏览
透明多边形只表示边界线和空心区域;因此,我们只能理解所覆盖的区域,但理解比例会有点困难。因此,这种可视化技术不如其他填充不同颜色的区域的技术有用。但是,如果数据的范围不大,则可以使用它。考虑以下数据框 - 示例 在线演示set.seed(123) x
3K+ 次浏览
我们可能希望使用特定列的一个或多个值来创建 R 数据框的子集。例如,假设我们有一个包含列 C1、C2、C3、C4 和 C5 的数据框 df,并且这些列中的每一列都包含从 A 到 Z 的值。如果我们想使用 C1 列中的值 A 或 B 选择行,则可以这样写:df[df$C1=="A"|df$C1=="B",]。考虑以下数据框 - 示例 set.seed(99) x1
211 次浏览
列联表考虑了两个分类变量的数值。通常,我们需要计数的列联表,尤其是在非参数分析中,但我们也可能希望将均值用于我们的分析。因此,我们可以使用 reshape 包中的 cast 函数,它可以轻松地解决创建列联表的问题。考虑以下数据框 - 示例 在线演示set.seed(99) x1
722 次浏览
有时数据框中充满了许多缺失值/NA,并且数据框的每一列至少包含一个 NA。在这种情况下,我们可能想要找出每一列中存在多少个缺失值。因此,我们可以按照以下方式使用 `colSums` 函数和 `is.na`:`colSums(is.na(df))` # 此处 df 指的是数据框名称。考虑以下数据框 - 示例 在线演示set.seed(109) x1
571 次浏览
要模拟正态分布,我们可以在 R 中使用 `rnorm` 函数,但我们不能对模拟的值范围设置限制。如果我们想对固定限制模拟此分布,则可以使用 `truncnorm` 包的 `truncnorm` 函数。在此函数中,我们可以传入带或不带均值和标准差的限制。加载和安装 `truncnorm` 包 - >install.packages("truncnorm") >library(truncnorm)示例 rtruncnorm(n=10, a=0, b=10)[1] 0.76595522 0.33315633 1.29565988 0.67154230 0.04957334 0.38338705 [7] 0.75753005 0.65265304 0.63616552 0.45710877rtruncnorm(n=50, a=0, b=100)[1] 0.904997947 0.035692016 0.402963452 1.001102057 1.445190636 0.109245234 [7] 0.205630845 0.312428027 0.465876772 0.424647787 0.309222394 0.442172805 [13] 0.365503292 1.277570451 0.235747661 1.128447123 ... 阅读更多
2K+ 次浏览
当我们使用 ggplot2 包创建直方图时,直方图所覆盖的区域填充为灰色,但我们可以删除该颜色以使直方图看起来透明。这可以通过在 `geom_histogram` 中使用 `fill="transparent"` 和 `color="black"` 参数来完成,我们需要使用 `color` 参数,因为如果不使用,直方图条的边框也将被移除,并且此颜色不限于黑色。示例 考虑以下数据框 - set.seed(987) x
570 次浏览
百分位数将一组数值划分为一百组,如果值的个数是 100,则为单个值。我们可以找到 R 数据框数值列的百分位数,因此,也可以根据这些百分位数选择列的值。为此,我们可以使用 `quantile` 函数。示例 考虑以下数据框 - set.seed(111) x