髙档棋牌室装修效果图,网红棋牌优惠大厅图片真实高清,竞技体育的构成(中国)·官方网站

在做大數(shù)據(jù)的時候，首先第一步就是要解決數(shù)據(jù)的來源，我們采用的設計方案就是使用Python來從一些政府網站爬數(shù)據(jù)，將披露的銀行、證券、股票、信托等行業(yè)中三大報表（利潤表、資產負債表、現(xiàn)金流量表）數(shù)據(jù)解析并錄入數(shù)據(jù)庫，我們采用java 編程來實現(xiàn)三大報表數(shù)據(jù)解析。

程序設計采用java面向對象設計的概念，利用java繼承、封裝、多態(tài)的特性來設計，可以減去程序更改的麻煩，以前寫的類可以繼續(xù)使用。

程序設計架構采用如下所示：

ParentTable包含三個函數(shù)。

MatchStartLine():用于查找三大報表的起始行。

MatchEndline():用于查找三大報表的結束行。

Anla():用于解析查找到的報表行。

在解析不用的PDF文件時，直接進行override這三個函數(shù)，就可以實現(xiàn)解決不同的表格匹配問題。

新建一個PDFFile類，在這個類中實現(xiàn)調用ParentTable的anla函數(shù)，來解析所有的PDF文件中的所有表格。

public boolean anla(){

for(ParentTable table : tables){

int nIndexStart = table.matchStartLine(lines);

int nIndexEnd = table.matchEndLine(lines);

/*取出表內容*/

String[] arrTableLines =newString[nIndexEnd - nIndexStart +1];

System.arraycopy(lines, nIndexStart, arrTableLines,0, nTableLineCount);

if(arrTableLines.length <=0)

continue;

table.setTableLines(arrTableLines);

/*分析表內容*/

table.anla();

}

在主程序中，調用PDFFile類中的anla()函數(shù)，將依次解析tables參數(shù)中所有表格類型，將解決匹配所有PDF文件中表格。

下一節(jié)將解決如何使用多線程來解析PDF文件。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

JAVA

JAVA

+關注

關注
19

文章
2974

瀏覽量
105145
程序

程序

+關注

關注
117

文章
3795

瀏覽量
81411
PDF

PDF

+關注

關注
1

文章
169

瀏覽量
33803

原文標題：PDF解析程序架構設計

文章出處：【微信號：gh_757915171cb5，微信公眾號：FPGA自學筆記】歡迎添加關注！文章轉載請注明出處。

吴忠躺衫网络科技有限公司

搜索歷史

PDF解析程序架構設計詳細

評論

kintex產品架構設計文檔（成為架構師也是電子人不錯的選...

【WEBENCH 大賽作品】WEBENCH Processor Power Architect 電源架構設計

軟件架構設計教程

汽車電子電氣架構設計及優(yōu)化措施

STM32軟件架構設計的意義

ARM嵌入式應用程序架構設計工具-DLTools

ARM嵌入式應用程序架構設計工具-字庫

ARM嵌入式應用程序架構設計工具

如何使用Autosar的進行整車電子電氣架構設計詳細方法概述

系統(tǒng)架構設計的詳細講解

SWE.2的軟件架構設計

SYS.3的系統(tǒng)架構設計

幾種軟件架構設計的思維方式

架構與微架構設計

NetApp VMware和Broadcom驗證架構設計