找到 2038 篇文章 相关 R 编程
984 次浏览
通常,我们会得到大小不同的数据框,这意味着任何一个数据框中都缺少一些行或列。因此,要合并这些类型的数据框,我们可以将它们与所有值一起合并,并在必要时将缺失值转换为零。这可以通过使用 merge 函数来完成,并且使用单个方括号将缺失值 NA 替换为零。示例考虑以下数据框 -> C1 df1 df1 C1 1 A 2 B 3 C 4 D 5 E 6 F 7 G ... 阅读更多
134 次浏览
在我们的日常生活中,我们经常想知道几天后的日期是什么。这在职业生活中也是必需的,尤其是在那些我们从事项目并有严格截止日期的职业中。要查找几天后的日期,我们只需在使用 as.Date 读取日期后使用加号即可。示例> as.Date("2001-01-01")+30 [1] "2001-01-31" > as.Date("2020-06-30")+30 [1] "2020-07-30" > as.Date("2020-06-30")+50 [1] "2020-08-19" > as.Date("2020-06-30")+100 [1] "2020-10-08" > as.Date("2020-06-30")+120 [1] "2020-10-28" > as.Date("2020-06-30")+15 [1] "2020-07-15" > as.Date("2020-06-30")+45 [1] "2020-08-14" > as.Date("2020-06-30")+40 [1] "2020-08-09" > as.Date("2020-12-25")+20 [1] "2021-01-14" > as.Date("2020-12-25")+300 [1] ... 阅读更多
11K+ 次浏览
我们可以创建具有不同绘图窗口大小的 R 绘图。当我们想要以不同的方式表达 X 轴或 Y 轴时,这将非常有用。此外,绘图窗口大小的变化将有助于我们将绘图粘贴到短或大的位置。例如,如果我们想在商务会议中展示绘图,那么我们可以增加其大小;如果我们想将其发布在论文中,那么可以减小其大小。示例考虑以下向量 x 和 y -> x y plot(x, y)输出使用 10 英寸宽和 5 英寸 ... 阅读更多
4K+ 次浏览
我们可能会获得包含 NA 和空格的一列的数据集,因此,有必要处理这些值。处理这些值的一种方法是选择我们没有这些值的行。这可以通过通过单个方括号进行子集化来完成。示例考虑以下数据框 -> set.seed(1) > x1 x2 x3 df df x1 x2 x3 1 4 1 5 2 39 5 3 1 3 5 4 34 4 5 5 23 1 6 43 7 14 3 8 18 ... 阅读更多
11K+ 次浏览
如果我们有一个列表,其中包含总元素数为偶数的向量,那么我们可以创建这些元素的矩阵。例如,如果一个列表包含 8 个向量,并且这 8 个向量中的元素总数为 100 或 2 的其他倍数,那么我们可以创建这些元素的矩阵。这可以通过在矩阵函数内使用 unlist 函数来完成。示例考虑以下列表 x -> x x [[1]] [1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 [[2]] [1] 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 [[3]] [1] 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 [[4]] [1] 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 [20] 95 96 97 98 99 100 [[5]] [1] 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 [20] 120 121 122 123 124 125 [[6]] [1] 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 [20] 145 146 147 148 149 150 [[7]] [1] 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 [20] 170 171 172 173 174 175 [[8]] [1] 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 [20] 195 196 197 198 199 200 > Matrix_x Matrix_x [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 1 2 3 4 5 6 7 8 9 10 [2,] 11 12 13 14 15 16 17 18 19 20 [3,] 21 22 23 24 25 26 27 28 29 30 [4,] 31 32 33 34 35 36 37 38 39 40 [5,] 41 42 43 44 45 46 47 48 49 50 [6,] 51 52 53 54 55 56 57 58 59 60 [7,] 61 62 63 64 65 66 67 68 69 70 [8,] 71 72 73 74 75 76 77 78 79 80 [9,] 81 82 83 84 85 86 87 88 89 90 [10,] 91 92 93 94 95 96 97 98 99 100 [11,] 101 102 103 104 105 106 107 108 109 110 [12,] 111 112 113 114 115 116 117 118 119 120 [13,] 121 122 123 124 125 126 127 128 129 130 [14,] 131 132 133 134 135 136 137 138 139 140 [15,] 141 142 143 144 145 146 147 148 149 150 [16,] 151 152 153 154 155 156 157 158 159 160 [17,] 161 162 163 164 165 166 167 168 169 170 [18,] 171 172 173 174 175 176 177 178 179 180 [19,] 181 182 183 184 185 186 187 188 189 190 [20,] 191 192 193 194 195 196 197 198 199 200 > Matrix_x Matrix_x [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] 1 21 41 61 81 101 121 141 161 181 [2,] 2 22 42 62 82 102 122 142 162 182 [3,] 3 23 43 63 83 103 123 143 163 183 [4,] 4 24 44 64 84 104 124 144 164 184 [5,] 5 25 45 65 85 105 125 145 165 185 [6,] 6 26 46 66 86 106 126 146 166 186 [7,] 7 27 47 67 87 107 127 147 167 187 [8,] 8 28 48 68 88 108 128 148 168 188 [9,] 9 29 49 69 89 109 129 149 169 189 [10,] 10 30 50 70 90 110 130 150 170 190 [11,] 11 31 51 71 91 111 131 151 171 191 [12,] 12 32 52 72 92 112 132 152 172 192 [13,] 13 33 53 73 93 113 133 153 173 193 [14,] 14 34 54 74 94 114 134 154 174 194 [15,] 15 35 55 75 95 115 135 155 175 195 [16,] 16 36 56 76 96 116 136 156 176 196 [17,] 17 37 57 77 97 117 137 157 177 197 [18,] 18 38 58 78 98 118 138 158 178 198 [19,] 19 39 59 79 99 119 139 159 179 199 [20,] 20 40 60 80 100 120 140 160 180 200
2K+ 次浏览
如果您在 Github 上有一个 csv 文件,那么可以通过使用其 URL 直接在 R 中导入它,但请确保您在 Github 页面上存储数据的位置点击“原始”选项。许多人没有点击“原始”选项,因此他们读取 HTML 而不是 CSV 并感到困惑。在这里,我分享了一个包含数据集列表的公共数据集。此数据集有 12 个变量。现在让我们导入它 -> Data str(Data) 'data.frame': 57 obs. of 12 variables: $ Dataset.Name : Factor w/ 57 levels " ", "2008 Election ... 阅读更多
1K+ 次浏览
如果存在一个频率与其他频率显着不同的类别,那么使用 ggplot2 的条形图的 X 轴标签将自动排序以交替显示值。我们可能希望保留分类变量中可用的类别的原始顺序。因此,我们可以将分类变量存储为因子,然后创建条形图。示例考虑以下数据框 -> Group Frequency df df Group Frequency 1 India 12 2 USA 18 3 UK 35 4 Germany 20 > ... 阅读更多
2K+ 次浏览
创建日期向量不是一件容易的事,但借助 seq 和 as.Date,它在 R 中变得很容易。借助这些函数,我们可以在 R 中创建一个包含两个日期之间日期的向量。但这不能以相反的顺序进行,例如,如果我们希望将未来日期作为向量的第一个元素,那么这是不可能的。示例> V1 V1 [1] "2020-01-01" "2020-01-02" "2020-01-03" "2020-01-04" "2020-01-05" [6] "2020-01-06" "2020-01-07" "2020-01-08" "2020-01-09" "2020-01-10" [11] "2020-01-11" "2020-01-12" "2020-01-13" "2020-01-14" "2020-01-15" [16] "2020-01-16" "2020-01-17" "2020-01-18" "2020-01-19" "2020-01-20" [21] "2020-01-21" "2020-01-22" "2020-01-23" ... 阅读更多
405 次浏览
我们可能希望提取行索引,而不管其类型(数字或字符串)如何,以便进行一些计算,如果它被错误地设置为行索引。这发生在数据收集过程中或数据处理不正确的情况下。此外,由于行索引有助于访问行,因此我们必须为它们提供正确的名称,而不是可能造成混淆的值。例如,如果数据框的行索引为 43、94 等,则可能会造成混淆。因此,如果需要,我们应该将行索引转换为向量或列。示例考虑以下数据框(此处,... 阅读更多
239 次浏览
散点图用于观察两个连续变量之间的关系。如果样本量很大,则图上的点会彼此重叠,看起来不美观。此外,此类散点图的解释并非易事,因此,我们可以增加图上点的透明度,使其更具吸引力。我们可以通过在 ggplot2 的 geom_point 中使用 alpha 参数来实现这一点。示例考虑以下数据框 -> set.seed(123) > x y df library(ggplot2) > ggplot(df, aes(x, y))+geom_point()输出> ggplot(df, aes(x, y))+geom_point(alpha=0.10)输出> ggplot(df, aes(x, y))+geom_point(alpha=0.05)输出阅读更多