首页 >> 文摘 >> JAVA

使用PDFBox解析PDF内容

采集日期:2008-5-2作者:sunnydream(注:本数据由系统自动采集,内容与BHCODE无关)
先来放松一下: 面试牛人       面试官:熟悉哪种语言   应聘者:Java。   面试官:知道什么叫类么   应聘者:我这人实在,工作努力,不知道什么叫累   面试官:知道什么是包?   应聘者:我这人实在 平常不带包 也不用公司准备了   面试官:知道什么是接口吗?   应聘者:我这个人工作认真。从来不找借口偷懒   M:知道什么是继承么   Y:我是孤儿没什么可以继承的   M:知道什么叫对象么?   M:知道,不过我工作努力,上进心强,暂时还没有打算找对象。   M:知道多态么?   Y:知道,我很保守的。我认为让心爱的女人为了自已一时的快乐去堕胎是不道德的行为! 使用PDFBox解析PDF内容:在下面的代码中,getText方法接收一个String类型的参数,指定要提取的PDF文件路径。这个位置可以是一个URL或本地文件。然后函数调用PDFBox提供的PDFTextStripper类,设置提取过程中的一些属性(如起始页、是否排序等)。最后将文本提取并写入文件。 public void geText(String file) throws Exception { // 是
本周推荐
MORE
热点关注
MORE