吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PDF解析程序架構設計詳細

jqYd_gh_7579151 ? 來源:未知 ? 作者:李建兵 ? 2018-03-17 09:13 ? 次閱讀

在做大數(shù)據(jù)的時候,首先第一步就是要解決數(shù)據(jù)的來源,我們采用的設計方案就是使用Python來從一些政府網站爬數(shù)據(jù),將披露的銀行、證券、股票、信托等行業(yè)中三大報表(利潤表、資產負債表、現(xiàn)金流量表)數(shù)據(jù)解析并錄入數(shù)據(jù)庫,我們采用java編程來實現(xiàn)三大報表數(shù)據(jù)解析。

程序設計采用java面向對象設計的概念,利用java繼承、封裝、多態(tài)的特性來設計,可以減去程序更改的麻煩,以前寫的類可以繼續(xù)使用。

程序設計架構采用如下所示:

ParentTable包含三個函數(shù)。

MatchStartLine():用于查找三大報表的起始行。

MatchEndline():用于查找三大報表的結束行。

Anla():用于解析查找到的報表行。

在解析不用的PDF文件時,直接進行override這三個函數(shù),就可以實現(xiàn)解決不同的表格匹配問題。

新建一個PDFFile類,在這個類中實現(xiàn)調用ParentTable的anla函數(shù),來解析所有的PDF文件中的所有表格。

public boolean anla(){

for(ParentTable table : tables){

int nIndexStart = table.matchStartLine(lines);

int nIndexEnd = table.matchEndLine(lines);

/*取出表內容*/

String[] arrTableLines =newString[nIndexEnd - nIndexStart +1];

System.arraycopy(lines, nIndexStart, arrTableLines,0, nTableLineCount);

if(arrTableLines.length <=0)

continue;

table.setTableLines(arrTableLines);

/*分析表內容*/

table.anla();

}

}

在主程序中,調用PDFFile類中的anla()函數(shù),將依次解析tables參數(shù)中所有表格類型,將解決匹配所有PDF文件中表格。

下一節(jié)將解決如何使用多線程來解析PDF文件。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • JAVA
    +關注

    關注

    19

    文章

    2974

    瀏覽量

    105145
  • 程序
    +關注

    關注

    117

    文章

    3795

    瀏覽量

    81411
  • PDF
    PDF
    +關注

    關注

    1

    文章

    169

    瀏覽量

    33803

原文標題:PDF解析程序架構設計

文章出處:【微信號:gh_757915171cb5,微信公眾號:FPGA自學筆記】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    kintex產品架構設計文檔(成為架構師也是電子人不錯的選...

    kintex產品架構設計文檔(成為架構師也是電子人不錯的選擇) ROCE(儒仕),用心為每一位電子人!Xilinx7系列普及講座,架構師設計方案模板,交流學習 內容請下載附件pdf,更
    發(fā)表于 04-30 16:41

    【WEBENCH 大賽作品】WEBENCH Processor Power Architect 電源架構設

    利用WEBENCH Processor Power Architect 設計工具進行設計,基于TPS54335A原件的電源架構設計。輸入電壓為直流10V-20V,輸出電壓為3.3V,2A作品地址
    發(fā)表于 07-16 14:24

    軟件架構設計教程

    軟件架構設計教程
    發(fā)表于 09-26 15:27

    汽車電子電氣架構設計及優(yōu)化措施

    我國公路建設事業(yè)的蓬勃發(fā)展導致在汽車行業(yè)中的電子電氣架構設計越來越體現(xiàn)消費者對汽車人性化、舒適化與美觀性的現(xiàn)實需求。設計汽車的電子電氣架構是一項工程量較大的工作,它涉及了硬件、軟件、網絡、線束等方面
    發(fā)表于 10-18 22:10

    STM32軟件架構設計的意義

    STM32軟件架構1、架構設計的意義(1)應用代碼邏輯清晰,且避免代碼冗余;(2)代碼通用性,方便軟件高速、有效的移植;(3)各功能獨立,低耦合高內聚;2、總體架構圖3、結構層說明4、遵循規(guī)則5、優(yōu)劣評估6、STM32實例說明
    發(fā)表于 08-04 07:23

    ARM嵌入式應用程序架構設計工具-DLTools

    ARM嵌入式應用程序架構設計實例精講--ARM嵌入式應用程序架構設計工具-DLTools
    發(fā)表于 07-08 11:08 ?4次下載

    ARM嵌入式應用程序架構設計工具-字庫

    ARM嵌入式應用程序架構設計實例精講--ARM嵌入式應用程序架構設計工具-字庫
    發(fā)表于 07-08 11:08 ?10次下載

    ARM嵌入式應用程序架構設計工具

    電子專業(yè)單片機相關知識學習教材資料——ARM嵌入式應用程序架構設計工具
    發(fā)表于 09-13 17:23 ?0次下載

    如何使用Autosar的進行整車電子電氣架構設詳細方法概述

    提出一種基于Autosar理念的整車電子電氣架構設計方法。通過整車需求定義、原子邏輯單元搭建實現(xiàn)整車功能邏輯的實體化,然后利用模型設計分析方法,將功能需求分配到各個電子控制單元,利用
    發(fā)表于 11-01 08:00 ?43次下載
    如何使用Autosar的進行整車電子電氣<b class='flag-5'>架構設</b>計<b class='flag-5'>詳細</b>方法概述

    系統(tǒng)架構設計的詳細講解

    上一篇,我們討論了故障度量和安全機制的ASIL等級。本篇我們來聊一聊系統(tǒng)架構設計相關內容。01系統(tǒng)架構設計和TSC當我們開始寫TSC時,會涉及到下圖中一系列的內容:當我們完成前三期(鏈接見文末)提到的安全機制規(guī)范后,我們就要開始整理好所有的安全需求并在系統(tǒng)
    的頭像 發(fā)表于 12-24 14:33 ?1769次閱讀

    SWE.2的軟件架構設

    過程ID:SWE.2 過程名稱:軟件架構設計 過程目的:軟件架構設計過程目的是建立一個架構設計,識別哪些軟件需求應該分配給軟件的哪些要素,并根據(jù)已定義的標準評估軟件架構設計。 ? 過程
    的頭像 發(fā)表于 01-11 10:36 ?2829次閱讀

    SYS.3的系統(tǒng)架構設

    系統(tǒng)架構設計 過程ID:SYS.3 過程名稱:系統(tǒng)架構設計 ? 過程目的:系統(tǒng)架構設計過程目的,是建立系統(tǒng)架構設計,并確定將哪些系統(tǒng)需求分配給系統(tǒng)的哪些要素,以及根據(jù)已定義的準則評估系
    的頭像 發(fā)表于 02-13 16:02 ?2749次閱讀

    幾種軟件架構設計的思維方式

    一個優(yōu)秀的程序員要想成為一名優(yōu)秀的架構設計師,就改變編程的思維,學會使用架構設計的思維方式。
    的頭像 發(fā)表于 03-08 15:30 ?4975次閱讀

    架構與微架構設

    下面將從芯片的架構設計、微架構設計、使用設計文檔、設計分區(qū)、時鐘域和時鐘組、架構調整與性能改進、處理器微架構設計策略等角度進行說明,并以視頻H.264編碼器設計為例。
    的頭像 發(fā)表于 05-08 10:42 ?1261次閱讀
    <b class='flag-5'>架構</b>與微<b class='flag-5'>架構設</b>計

    NetApp VMware和Broadcom驗證架構設

    電子發(fā)燒友網站提供《NetApp VMware和Broadcom驗證架構設計.pdf》資料免費下載
    發(fā)表于 08-23 15:17 ?0次下載
    NetApp VMware和Broadcom驗證<b class='flag-5'>架構設</b>計
    百家乐官网赢钱公式冯耕| 老人头百家乐官网的玩法技巧和规则| 大发888游戏代冲省钱技巧| 网络百家乐可信吗| 百家乐官网娱乐送白菜| 百家乐官网游戏群号| 棋牌娱乐| 大发888娱乐城.com| 百家乐路技巧| 现金百家乐| 自贡百家乐官网娱乐场开户注册 | 香河县| 大发888被查| 威尼斯人娱乐城最新地址| 百家乐推广| 繁体子24画的有| 百家乐官网代打是真的吗| 优博| 澳门顶级赌场娱乐网| 百家乐对子的玩法| 中江县| 百家乐qq游戏| 爱拼百家乐官网的玩法技巧和规则| 百家乐官网技术方式| 视频百家乐平台| 百家乐EA平台| 休闲百家乐官网的玩法技巧和规则| 全讯网168268| 百家乐评级导航| 赌百家乐官网的心得体会| 大发888黄金版下载| 网上百家乐试玩网址| 百家乐网上漏洞| 澳门百家乐官网加盟| 大发888娱乐| 德州扑克俱乐部| 威尼斯人娱乐开户送18| 百家乐群博乐吧blb8v| 最好的百家乐论坛| 做生意摆放龙龟方向| 百家乐官网任你博娱乐场|