1K+ 次查看
如果在一列中重复出现两个值,这意味着该列中有很多相同的值,但是如果这些值在列和行中都重复出现,则它们在两列中被称为重复行。要删除 R 数据框中两列中存在的重复行,我们可以使用 duplicated 函数,如下例所示。考虑以下数据框 - 示例 在线演示x1
897 次查看
默认情况下,使用 ggplot2 创建的条形图中的图例标签没有符号,但我们可能希望显示标签的符号,尤其是在我们有一些负值的情况下。这可以使用 ggplot2 包的 geom_text 函数来完成,如下例所示。考虑以下数据框 - 示例 在线演示x
有时我们想将新数据添加到原始数据框中,例如我们需要更多数据进行分析,查找小型数据和大型数据之间的比较,或者原始数据中缺少一些数据,因此需要从其他数据集中添加更多数据。其中一项操作是从另一个数据框向现有数据框添加新行。这可以使用 rbind 函数来完成,如下例所示。考虑以下数据框 df1 和 df2 - 示例 在线演示x
419 次查看
为了在将 R 中的数据框转换为 data.table 对象时处理行名缺失的列,我们需要在转换数据框时使用 keep.rownames 参数。例如,如果我们有一个名为 df 的数据框需要转换为 data.table 对象而不丢失行名,那么我们可以使用以下命令:data.table(df,keep.rownames=TRUE)示例library(data.table) head(mtcars)输出 mpg cyl disp hp drat wt qsec vs am gear carb Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4 Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4 Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1 Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1 Hornet Sportabout 18.7 8 360 175 3.15 3.440 17.02 0 0 3 2 Valiant 18.1 6 225 105 2.76 3.460 20.22 1 0 3 1示例mtcars_data_table
921 次查看
为了去除基本 R 中轴与图内点之间的绘图边距,我们可以在 plot 函数中使用 xaxs 和 yaxs 参数。根据 xaxs 和 yaxs 参数的选择,相应方向的绘图区域比这些限制指定的区域大 4%,或者与“i”限制完全匹配。示例x
332 次查看
NA 值和 NaN 值的性质大相径庭,因此,删除包含 NA 值的行与删除包含 NaN 值的行不同。例如,如果我们有一个包含 NaN 值的数据框,则可以使用 is.finite 函数删除这些行,如下例所示。考虑以下数据框 - 示例 在线演示x1
为了增加基本 R 中直方图线的粗细,我们需要使用 par 函数来定义线的粗细大小。如果我们想这样做,则必须先定义线粗细,然后再创建直方图。线大小的一个示例可以是 line
6K+ 次查看
为了忽略缺失值来查找每列的每行均值,我们需要使用带有 na.rm 的 rowMeans 函数。例如,如果我们有一个名为 df 的数据框包含五列,并且其中一些值缺失,则可以使用以下命令计算每行的均值:rowMeans(df,na.rm=TRUE)。考虑以下数据框 - 示例 在线演示x1
3K+ 次查看
shapiro.test 在 R 中有一个限制,它只能应用于样本大小最多为 5000 的样本,并且最小样本大小必须为 3。因此,我们有一个替代的假设检验,称为 Anderson-Darling 正态性检验。要执行此检验,我们需要加载 nortest 包并使用 ad.test 函数,如下例所示。考虑以下数据框 - 示例 在线演示x
413 次查看
默认情况下,R 中的任何绘图都不会显示正号。众所周知,如果任何值都没有符号,则认为它是正数,因此我们不需要符号,但为了区分 0 和正值,可以这样做。要显示 X 轴标签的正号,我们可以使用 scale_x_continuous 函数。考虑以下数据框 - 示例 在线演示x