网站首页 软件下载 游戏下载 翻译软件 电子书下载 电影下载 电视剧下载 教程攻略
霍普软件下载网-旗舰软件下载站,将绿色免费商业版破解软件、共享软件、游戏、电影、电视剧一网打尽!
| 软件 | Apache Tika |
| 分类 | PC软件-MAC软件-应用程序 |
| 语言 | 英文 |
| 大小 | 1.64MB |
| 版本 | 0.7 |
| 下载 |
|
| 介绍 |
Tika是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。其次,Tika也提供了便利的扩展API,用来丰富其对第三方文件格式的支持。 Tika提供了对如下文件格式的支持: * PDF - 通过Pdfbox * MS-* - 通过POI * HTML - 使用nekohtml将不规范的html整理成为xhtml * OpenOffice 格式 - Tika提供 * Archive - zip, tar, gzip, bzip等 * RTF - Tika提供 * Java class - Class解析由ASM完成 * Image - 只支持图像的元数据抽取 * XML |
| 截图 | |
| 随便看 |
|