使用PDFBox解析PDF内容
采集日期:2008-5-2作者:sunnydream(注:本数据由系统自动采集,内容与BHCODE无关)
先来放松一下:
面试牛人 面试官:熟悉哪种语言 应聘者:Java。 面试官:知道什么叫类么 应聘者:我这人实在,工作努力,不知道什么叫累 面试官:知道什么是包? 应聘者:我这人实在 平常不带包 也不用公司准备了 面试官:知道什么是接口吗? 应聘者:我这个人工作认真。从来不找借口偷懒 M:知道什么是继承么 Y:我是孤儿没什么可以继承的 M:知道什么叫对象么? M:知道,不过我工作努力,上进心强,暂时还没有打算找对象。 M:知道多态么? Y:知道,我很保守的。我认为让心爱的女人为了自已一时的快乐去堕胎是不道德的行为!
使用PDFBox解析PDF内容:在下面的代码中,getText方法接收一个String类型的参数,指定要提取的PDF文件路径。这个位置可以是一个URL或本地文件。然后函数调用PDFBox提供的PDFTextStripper类,设置提取过程中的一些属性(如起始页、是否排序等)。最后将文本提取并写入文件。
public void geText(String file) throws Exception { // 是