• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >Java > JAVA读取PDF、WORD文档实例代码

JAVA读取PDF、WORD文档实例代码

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-28

通过本文主要向大家介绍了java编程实例,java项目实例,java继承实例,让java实例自动结束,java开发实例100等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

读取PDF文件jar引用

<dependency>
  <groupid>org.apache.pdfbox</groupid>
  pdfbox</artifactid>
  <version>1.8.13</version>
</dependency>
</div>

读取WORD文件jar引用

<dependency>
  <groupid>org.apache.poi</groupid>
  poi-scratchpad</artifactid>
  <version>3.16-beta1</version>
</dependency>
<dependency>
  <groupid>org.apache.poi</groupid>
  poi</artifactid>
  <version>3.16-beta1</version>
</dependency>
</div>

读取WORD文件方法

/**
   * 
   * @Title: getTextFromWord
   * @Description: 读取word
   * @param filePath
   *      文件路径
   * @return: String 读出的Word的内容
   */
  public static String getTextFromWord(String filePath) {
    String result = null;
    File file = new File(filePath);
    FileInputStream fis = null;
    try {
      fis = new FileInputStream(file);
      @SuppressWarnings("resource")
      WordExtractor wordExtractor = new WordExtractor(fis);
      result = wordExtractor.getText();
    } catch (FileNotFoundException e) {
      e.printStackTrace();
    } catch (IOException e) {
      e.printStackTrace();
    } finally {
      if (fis != null) {
        try {
          fis.close();
        } catch (IOException e) {
          e.printStackTrace();
        }
      }
    }
    return result;
  }

</div>

读取PDF文件方法

/**
 * 
 * @Title: getTextFromPdf
 * @Description: 读取pdf文件内容
 * @param filePath
 * @return: 读出的pdf的内容
 */
public static String getTextFromPdf(String filePath) {
  String result = null;
  FileInputStream is = null;
  PDDocument document = null;
  try {
    is = new FileInputStream(filePath);
    PDFParser parser = new PDFParser(is);
    parser.parse();
    document = parser.getPDDocument();
    PDFTextStripper stripper = new PDFTextStripper();
    result = stripper.getText(document);
  } catch (FileNotFoundException e) {
    e.printStackTrace();
  } catch (IOException e) {
    e.printStackTrace();
  } finally {
    if (is != null) {
      try {
        is.close();
      } catch (IOException e) {
        e.printStackTrace();
      }
    }
    if (document != null) {
      try {
        document.close();
      } catch (IOException e) {
        e.printStackTrace();
      }
    }
  }
  return result;
}
</div>

希望本篇实例代码可以帮到您

</div>
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • Java 冒泡排序、快速排序实例代码
  • java根据模板动态生成PDF实例
  • JAVA读取PDF、WORD文档实例代码
  • Java追加文件内容的三种方法实例代码
  • 实例解析JAVA中代码的加载顺序
  • Java从网络读取图片并保存至本地实例
  • java模拟微信抢红包的实例代码
  • Java实现迅雷地址转成普通地址实例代码
  • Java正则匹配中文的方法实例分析
  • Java 冒泡排序、快速排序实例代码

相关文章

  • 2017-05-28Java Date类常用示例_动力节点Java学院整理
  • 2017-05-28Java 存储模型和共享对象详解
  • 2017-05-28Java经典排序算法之插入排序
  • 2017-05-28MyBatis+MySQL 返回插入的主键ID的方法
  • 2017-05-28Java 8 lambda初试示例详解
  • 2017-05-28Spring Data JPA 复杂/多条件组合分页查询
  • 2017-05-28java 二叉查找树实例代码
  • 2017-05-28Spring MVC url提交参数和获取参数
  • 2017-05-28java WSDL接口webService实现方式
  • 2017-05-28C#创建Web应用程序代码实例

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • JAVA 运算符归纳总结
    • mybatis教程之查询缓存(一级缓存二级缓存和整合ehcache)
    • Java内存分布归纳整理详解
    • window下安装和配置maven环境
    • Java使用强大的Elastisearch搜索引擎实例代码
    • Java中自定义异常详解及实例代码
    • Spring Boot无缝集成MongoDB
    • Map获取键值,Map的几种遍历方法总结(推荐)
    • springmvc fastjson 反序列化时间格式化方法(推荐)
    • MyBatis的嵌套查询解析

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有