Sqoop 模拟测试



本节为您提供各种与Sqoop相关的模拟测试。您可以将这些模拟测试样本下载到本地机器,并在方便时离线解答。每个模拟测试都附带一个答案,以便您验证最终分数并进行自我评分。

问答

Sqoop 模拟测试一

题1 - Sqoop 使用什么来建立与企业数据仓库的连接?

A - RDBMS 驱动程序

B - JDBC 驱动程序

C - IDBC 驱动程序

D - SQL 驱动程序

答案:B

解释

JDBC 驱动程序是一个 Java 程序,传统上它为各种数据库提供数据库连接。

题2 - 除了 JDBC 驱动程序,Sqoop 还需要什么来连接远程数据库?

A - Putty

B - SSH

C - 连接器

D - Sqoop 客户端

答案:C

解释

Sqoop 需要 JDBC 驱动程序和数据库连接器,这是导入数据所必需的。

答案:A

解释

在一个节点上安装后,它会自动复制到集群中的其他节点。

题4 - 默认情况下,Sqoop 导入到 HDFS 的数据库记录是

A - 制表符分隔

B - 列连接

C - 空格分隔

D - 逗号分隔

答案:D

解释

默认记录分隔符是逗号。

答案:B

解释

MapReduce 作业执行多个 Mapper,每个 Mapper 检索表数据的一部分。

题6 - Sqoop 中指定导入数据时输出目录的参数是

A - --output-path

B - --target-path

C - --output-dir

D - --target-dir

答案:D

解释

--target-dir 和 --warehouse-dir 是用于指定导入位置的两个参数。

答案:B

解释

为防止意外删除数据,作业会失败。

题8 - 为防止在 Sqoop 导入语句中提及密码,可以使用哪些附加参数?

A - -p

B - --password-file

C - 两者都是

D - 无法阻止

答案:C

解释

-P 选项会提示输入密码,而不会显示回显,--password-file 选项会读取存储在其他文件中密码值。

题9 - Sqoop 支持的两种二进制文件格式是什么?

A - Avro & SequenceFile

B - RCFile 和 SequenceFile

C - ORC 文件和 RC 文件

D - Avro 和 RC 文件

答案:A

解释

这是 Sqoop 支持的两种二进制文件格式。

题10 - SequenceFile 将每条记录存储为键值对,而 Avro 系统将记录存储为

A - 简单文本

B - 链式列表

C - 链表

D - 模式和数据

答案:D

解释

Sqoop 在读取数据时会自动生成模式,并将模式详细信息与每个生成的 Avro 文件中的数据一起存储。

答案:B

解释

Sqoop 没有内置代码来执行文件压缩。它依赖于 Hadoop 的压缩设置。

题12 - 对于某些数据库,Sqoop 可以通过使用以下参数来实现更快的 数据传输

A - --bulkload

B - --fastload

C - --dump

D - --direct

答案:D

解释

直接模式将数据传输功能委托给数据库提供的原生实用程序。

题13 - 可以通过使用哪个参数来覆盖数据库列和 Sqoop 列之间的数据类型映射?

A - --override-column-type

B - --map-column-type

C - --override-column-java

D - --map-column-java

答案:D

解释

由于 Sqoop 在内部使用 Java 数据类型,因此必须使用 Java 数据类型进行数据类型的映射。

答案:B

解释

Sqoop 使用的默认 Map 任务数为 4。

这可以使用 num-mappers 参数进行更改。

题15 - 从 CSV 文件导入时,Sqoop 遇到缺失值时使用的默认值是什么?

A - NULL

B - null

C - 空格字符

D - 无值

答案:B

解释

与数据库不同,CSV 文件中没有 NULL 值。Sqoop 使用 null 字符串来处理这些值。

题16 - 使用 Sqoop 可以使用什么选项从关系系统导入整个数据库?

A - --import-all-db

B - --import-all-tables

C - --import-all

D - --import

答案:C

解释

--import-all-tables 用于从数据库导入所有表。表的结构以及数据都是通过此命令逐一导入的。

题17 - 使用 --import-all-tables 参数时,可以使用什么选项仅导入数据库中的某些表?

A - --skip-tables

B - --without-tables

C - --forgo-tables

D - --exclude-tables

答案:D

解释

您可以将表名与 --exclude-table 子句一起使用,以便在导入整个数据库时跳过给定数量的表。

答案:C

解释

您可以从表中进行完整和部分数据导入,但不能从表中导入列的子集。

题19 - Sqoop 中导入数据的两种不同的增量模式是什么?

A - 合并和添加

B - 追加和修改

C - 合并和上次修改

D - 追加和上次修改

答案:D

解释

--incremental 参数用于仅获取新数据(Hadoop 中尚不存在的数据)。如果指定了要检查新数据的列,则将其作为追加操作执行。它还可以使用 last modified 参数,该参数将使用现有表中的 last_updated_date 列来标识新行。

答案:C

解释

Sqoop 在追加模式和 last_update_date 模式中都使用 --last-value 参数从源导入增量数据。

答案:D

解释

那些不会经常变化的命令行选项(参数的名称和值)可以保存到文件中,反复使用。这被称为选项文件。

Q 22 - 在 Sqoop import 命令中指定连接字符串时,对于 Hadoop 集群,如果我们在 URI 中使用 localhost 来代替服务器地址(主机名或 IP 地址),那么

A - import 作业将连接到本地数据库

B - 每个节点可能会连接到不同的数据库

C - import 作业可能会成功

D - 以上所有

答案:D

解释

指定 localhost 并不会使命令无效,因为某些本地数据库可能正在运行,并且节点将能够连接。因此,如果可用,每个节点将连接到不同的数据库。

Q 23 - 与存储在密码文件中相比,将密码存储在元存储库中的缺点是什么?

A - 它很容易访问

B - 它可能意外被删除

C - 它无法更新

D - 它未加密

答案:D

解释

密码文件可以加密,并通过适当的权限防止读取。但元存储库未加密,无法防止读取。

答案:A

解释

使用元存储库的主要优点是,任何拥有环境访问权限的用户都可以使用它,而无需知道密码。

Q 25 - 使用哪个选项可以在运行时更改保存的 Sqoop 作业中的参数?

A - --alter

B - --newval

C - --exec

D - --changeparam

答案:C

解释

对于名为“job1”的保存作业,可以使用以下命令在运行时更改 --table 参数。

sqoop job --exec job1 -- --table newtable。

答案表

题号 答案
1 B
2 C
3 A
4 D
5 B
6 D
7 B
8 C
9 A
10 D
11 B
12 D
13 D
14 B
15 B
16 C
17 D
18 C
19 D
20 C
21 D
22 D
23 D
24 A
25 C
sqoop_questions_answers.htm
广告