- TIKA 教程
- TIKA - 主页
- TIKA - 概述
- TIKA - 架构
- TIKA - 环境
- TIKA - 引用 API
- TIKA - 文件格式
- TIKA - 文档类型检测
- TIKA - 内容提取
- TIKA - 元数据提取
- TIKA - 语言检测
- TIKA - GUI
- TIKA 有用资源
- TIKA - 快速指南
- TIKA - 有用资源
- TIKA - 讨论
TIKA - GUI
图形用户界面 (GUI)
Tika 在以下链接中提供 jar 文件及其源代码 https://tika.apache.org/download.html.
下载这两个文件,为 jar 文件设置类路径。
解压源代码 zip 文件夹,打开 tika-app 文件夹。
在“tika-1.6\tika-app\src\main\java\org\apache\Tika\gui”中的解压文件夹中,你会看到两个类文件:ParsingTransferHandler.java 和 TikaGUI.java
编译这两个类文件并执行 TikaGUI.java 类文件,它将打开以下窗口。
我们现在来看看如何使用 Tika GUI。
在 GUI 中,单击打开、浏览并选择要提取的文件,或将其拖到窗口的空白区域。
Tika 提取文件内容并以五种不同的格式显示,即元数据、格式化文本、纯文本、主要内容和结构化文本。你可以选择想要的任何格式。
同样,你还会在“tika-1.6\tikaapp\src\main\java\org\apache\tika\cli”文件夹中找到 CLI 类。
下图显示了 Tika 的功能。当我们把图像放到 GUI 上时,Tika 会提取并显示其元数据。
广告