吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

基于javaweb的電商系統演變過程分析

電子工程師 ? 來源:網絡整理 ? 2018-01-14 22:24 ? 次閱讀

我們以javaweb為例,來搭建一個簡單的電商系統,看看這個系統可以如何一步步演變。

該系統具備的功能:

用戶模塊:用戶注冊和管理

商品模塊:商品展示和管理

交易模塊:創建交易和管理

階段一、單機構建網站

網站的初期,我們經常會在單機上跑我們所有的程序和軟件。此時我們使用一個容器,如tomcat、jetty、jboos,然后直接使用JSP/servlet技術,或者使用一些開源的框架如maven+spring+struct+hibernate、maven+spring+springmvc+mybatis;最后再選擇一個數據庫管理系統來存儲數據,如mysql、sqlserver、oracle,然后通過JDBC進行數據庫的連接和操作。

把以上的所有軟件都裝載同一臺機器上,應用跑起來了,也算是一個小系統了。此時系統結果如下:

階段二、應用服務器與數據庫分離

隨著網站的上線,訪問量逐步上升,服務器的負載慢慢提高,在服務器還沒有超載的時候,我們應該就要做好準備,提升網站的負載能力。假如我們代碼層面已難以優化,在不提高單臺機器的性能的情況下,增加機器是一個不錯的方式,不僅可以有效地提高系統的負載能力,而且性價比高。

增加的機器用來做什么呢?此時我們可以把數據庫,web服務器拆分開來,這樣不僅提高了單臺機器的負載能力,也提高了容災能力。

應用服務器與數據庫分開后的架構如下圖所示:

階段三、應用服務器集群

隨著訪問量繼續增加,單臺應用服務器已經無法滿足需求了。在假設數據庫服務器沒有壓力的情況下,我們可以把應用服務器從一臺變成了兩臺甚至多臺,把用戶的請求分散到不同的服務器中,從而提高負載能力。多臺應用服務器之間沒有直接的交互,他們都是依賴數據庫各自對外提供服務。著名的做故障切換的軟件有keepalived,keepalived是一個類似于layer3、4、7交換機制的軟件,他不是某個具體軟件故障切換的專屬品,而是可以適用于各種軟件的一款產品。keepalived配合上ipvsadm又可以做負載均衡,可謂是神器。

我們以增加了一臺應用服務器為例,增加后的系統結構圖如下:

系統演變到這里,將會出現下面四個問題:

1. 用戶的請求由誰來轉發到到具體的應用服務器

2. 有什么轉發的算法

3. 應用服務器如何返回用戶的請求

4. 用戶如果每次訪問到的服務器不一樣,那么如何維護session的一致性

我們來看看解決問題的方案:

1、第一個問題即是負載均衡的問題,一般有5種解決方案:

1. http重定向。HTTP重定向就是應用層的請求轉發。用戶的請求其實已經到了HTTP重定向負載均衡服務器,服務器根據算法要求用戶重定向,用戶收到重定向請求后,再次請求真正的集群

優點:簡單。

缺點:性能較差。

2. DNS域名解析負載均衡。DNS域名解析負載均衡就是在用戶請求DNS服務器,獲取域名對應的IP地址時,DNS服務器直接給出負載均衡后的服務器IP。

優點:交給DNS,不用我們去維護負載均衡服務器。

缺點:當一個應用服務器掛了,不能及時通知DNS,而且DNS負載均衡的控制權在域名服務商那里,網站無法做更多的改善和更強大的管理。

3. 反向代理服務器。在用戶的請求到達反向代理服務器時(已經到達網站機房),由反向代理服務器根據算法轉發到具體的服務器。常用的apache,nginx都可以充當反向代理服務器。

優點:部署簡單。

缺點:代理服務器可能成為性能的瓶頸,特別是一次上傳大文件。

4. IP層負載均衡。在請求到達負載均衡器后,負載均衡器通過修改請求的目的IP地址,從而實現請求的轉發,做到負載均衡。

優點:性能更好。

缺點:負載均衡器的寬帶成為瓶頸。

5. 數據鏈路層負載均衡。在請求到達負載均衡器后,負載均衡器通過修改請求的mac地址,從而做到負載均衡,與IP負載均衡不一樣的是,當請求訪問完服務器之后,直接返回客戶。而無需再經過負載均衡器。

2、第二個問題即是集群調度算法問題,常見的調度算法有10種。

1. rr 輪詢調度算法。顧名思義,輪詢分發請求。

優點:實現簡單

缺點:不考慮每臺服務器的處理能力

2. wrr 加權調度算法。我們給每個服務器設置權值weight,負載均衡調度器根據權值調度服務器,服務器被調用的次數跟權值成正比。

優點:考慮了服務器處理能力的不同

3. sh 原地址散列:提取用戶IP,根據散列函數得出一個key,再根據靜態映射表,查處對應的value,即目標服務器IP。過目標機器超負荷,則返回空。

4. dh 目標地址散列:同上,只是現在提取的是目標地址的IP來做哈希。

優點:以上兩種算法的都能實現同一個用戶訪問同一個服務器。

5. lc 最少連接。優先把請求轉發給連接數少的服務器。

優點:使得集群中各個服務器的負載更加均勻。

6. wlc 加權最少連接。在lc的基礎上,為每臺服務器加上權值。算法為:(活動連接數*256+非活動連接數)÷權重 ,計算出來的值小的服務器優先被選擇。

優點:可以根據服務器的能力分配請求。

7. sed 最短期望延遲。其實sed跟wlc類似,區別是不考慮非活動連接數。算法為:(活動連接數+1)*256÷權重,同樣計算出來的值小的服務器優先被選擇。

8. nq 永不排隊。改進的sed算法。我們想一下什么情況下才能“永不排隊”,那就是服務器的連接數為0的時候,那么假如有服務器連接數為0,均衡器直接把請求轉發給它,無需經過sed的計算。

9. LBLC 基于局部性的最少連接。均衡器根據請求的目的IP地址,找出該IP地址最近被使用的服務器,把請求轉發之,若該服務器超載,最采用最少連接數算法。

10. LBLCR 帶復制的基于局部性的最少連接。均衡器根據請求的目的IP地址,找出該IP地址最近使用的“服務器組”,注意,并不是具體某個服務器,然后采用最少連接數從該組中挑出具體的某臺服務器出來,把請求轉發之。若該服務器超載,那么根據最少連接數算法,在集群的非本服務器組的服務器中,找出一臺服務器出來,加入本服務器組,然后把請求轉發之。

3、第三個問題是集群模式問題,一般3種解決方案:

1. NAT:負載均衡器接收用戶的請求,轉發給具體服務器,服務器處理完請求返回給均衡器,均衡器再重新返回給用戶。

2. DR:負載均衡器接收用戶的請求,轉發給具體服務器,服務器出來玩請求后直接返回給用戶。需要系統支持IP Tunneling協議,難以跨平臺。

3. TUN:同上,但無需IP Tunneling協議,跨平臺性好,大部分系統都可以支持。

4、第四個問題是session問題,一般有4種解決方案:

1. Session Sticky。session sticky就是把同一個用戶在某一個會話中的請求,都分配到固定的某一臺服務器中,這樣我們就不需要解決跨服務器的session問題了,常見的算法有ip_hash法,即上面提到的兩種散列算法。

優點:實現簡單。

缺點:應用服務器重啟則session消失。

2. Session Replication。session replication就是在集群中復制session,使得每個服務器都保存有全部用戶的session數據。

優點:減輕負載均衡服務器的壓力,不需要要實現ip_hasp算法來轉發請求。

缺點:復制時寬帶開銷大,訪問量大的話session占用內存大且浪費。

3. Session數據集中存儲:session數據集中存儲就是利用數據庫來存儲session數據,實現了session和應用服務器的解耦。

優點:相比session replication的方案,集群間對于寬帶和內存的壓力減少了很多。

缺點:需要維護存儲session的數據庫。

4. Cookie Base:cookie base就是把session存在cookie中,有瀏覽器來告訴應用服務器我的session是什么,同樣實現了session和應用服務器的解耦。

優點:實現簡單,基本免維護。

缺點:cookie長度限制,安全性低,寬帶消耗。

值得一提的是:

nginx目前支持的負載均衡算法有wrr、sh(支持一致性哈希)、fair(本人覺得可以歸結為lc)。但nginx作為均衡器的話,還可以一同作為靜態資源服務器。

keepalived+ipvsadm比較強大,目前支持的算法有:rr、wrr、lc、wlc、lblc、sh、dh

keepalived支持集群模式有:NAT、DR、TUN

nginx本身并沒有提供session同步的解決方案,而apache則提供了session共享的支持。

好了,解決了以上的問題之后,系統的結構如下:

階段四、數據庫讀寫分離化

上面我們總是假設數據庫負載正常,但隨著訪問量的的提高,數據庫的負載也在慢慢增大。那么可能有人馬上就想到跟應用服務器一樣,把數據庫一份為二再負載均衡即可。但對于數據庫來說,并沒有那么簡單。假如我們簡單的把數據庫一分為二,然后對于數據庫的請求,分別負載到A機器和B機器,那么顯而易見會造成兩臺數據庫數據不統一的問題。那么對于這種情況,我們可以先考慮使用讀寫分離的方式。

讀寫分離后的數據庫系統結構如下:

這個結構變化后也會帶來兩個問題:

1. 主從數據庫之間數據同步問題

2. 應用對于數據源的選擇問題

解決問題方案:

1. 我們可以使用MYSQL自帶的master+slave的方式實現主從復制。

2. 采用第三方數據庫中間件,例如mycat。mycat是從cobar發展而來的,而cobar是阿里開源的數據庫中間件,后來停止開發。mycat是國內比較好的mysql開源數據庫分庫分表中間件。

階段五、用搜索引擎緩解讀庫的壓力

數據庫做讀庫的話,常常對模糊查找力不從心,即使做了讀寫分離,這個問題還未能解決。以我們所舉的交易網站為例,發布的商品存儲在數據庫中,用戶最常使用的功能就是查找商品,尤其是根據商品的標題來查找對應的商品。對于這種需求,一般我們都是通過like功能來實現的,但是這種方式的代價非常大。此時我們可以使用搜索引擎的倒排索引來完成。

搜索引擎具有以下優點:

它能夠大大提高查詢速度。

引入搜索引擎后也會帶來以下的開銷:

帶來大量的維護工作,我們需要自己實現索引的構建過程,設計全量/增加的構建方式來應對非實時與實時的查詢需求。

需要維護搜索引擎集群

搜索引擎并不能替代數據庫,他解決了某些場景下的“讀”的問題,是否引入搜索引擎,需要綜合考慮整個系統的需求。引入搜索引擎后的系統結構如下:

階段六、用緩存緩解讀庫的壓力

1、后臺應用層和數據庫層的緩存

隨著訪問量的增加,逐漸出現了許多用戶訪問同一部分內容的情況,對于這些比較熱門的內容,沒必要每次都從數據庫讀取。我們可以使用緩存技術,例如可以使用google的開源緩存技術guava或者使用memcacahe作為應用層的緩存,也可以使用redis作為數據庫層的緩存。

另外,在某些場景下,關系型數據庫并不是很適合,例如我想做一個“每日輸入密碼錯誤次數限制”的功能,思路大概是在用戶登錄時,如果登錄錯誤,則記錄下該用戶的IP和錯誤次數,那么這個數據要放在哪里呢?假如放在內存中,那么顯然會占用太大的內容;假如放在關系型數據庫中,那么既要建立數據庫表,還要簡歷對應的java bean,還要寫SQL等等。而分析一下我們要存儲的數據,無非就是類似{ip:errorNumber}這樣的key:value數據。對于這種數據,我們可以用NOSQL數據庫來代替傳統的關系型數據庫。

2、頁面緩存

除了數據緩存,還有頁面緩存。比如使用HTML5的localstroage或者cookie。

優點:

減輕數據庫的壓力

大幅度提高訪問速度

缺點:

需要維護緩存服務器

提高了編碼的復雜性

值得一提的是:

緩存集群的調度算法不同與上面提到的應用服務器和數據庫。最好采用“一致性哈希算法”,這樣才能提高命中率。這個就不展開講了,有興趣的可以查閱相關資料

加入緩存后的結構:

階段七、數據庫水平拆分與垂直拆分

我們的網站演進到現在,交易、商品、用戶的數據都還在同一個數據庫中。盡管采取了增加緩存,讀寫分離的方式,但隨著數據庫的壓力繼續增加,數據庫的瓶頸越來越突出,此時,我們可以有數據垂直拆分和水平拆分兩種選擇。

7.1、數據垂直拆分

垂直拆分的意思是把數據庫中不同的業務數據拆分道不同的數據庫中,結合現在的例子,就是把交易、商品、用戶的數據分開。

優點:

解決了原來把所有業務放在一個數據庫中的壓力問題。

可以根據業務的特點進行更多的優化

缺點:

需要維護多個數據庫

問題:

1. 需要考慮原來跨業務的事務

2. 跨數據庫的join

解決問題方案:

1. 我們應該在應用層盡量避免跨數據庫的事物,如果非要跨數據庫,盡量在代碼中控制。

2. 我們可以通過第三方應用來解決,如上面提到的mycat,mycat提供了豐富的跨庫join方案,詳情可參考mycat官方文檔。

垂直拆分后的結構如下:

7.2、數據水平拆分

數據水平拆分就是把同一個表中的數據拆分到兩個甚至多個數據庫中。產生數據水平拆分的原因是某個業務的數據量或者更新量到達了單個數據庫的瓶頸,這時就可以把這個表拆分到兩個或更多個數據庫中。

優點:

如果我們能客服以上問題,那么我們將能夠很好地對數據量及寫入量增長的情況。

問題:

1. 訪問用戶信息的應用系統需要解決SQL路由的問題,因為現在用戶信息分在了兩個數據庫中,需要在進行數據操作時了解需要操作的數據在哪里。

2. 主鍵的處理也變得不同,例如原來自增字段,現在不能簡單地繼續使用了。

3. 如果需要分頁,就麻煩了。

解決問題方案:

1. 我們還是可以通過可以解決第三方中間件,如mycat。mycat可以通過SQL解析模塊對我們的SQL進行解析,再根據我們的配置,把請求轉發到具體的某個數據庫。

2. 我們可以通過UUID保證唯一或自定義ID方案來解決。

3. mycat也提供了豐富的分頁查詢方案,比如先從每個數據庫做分頁查詢,再合并數據做一次分頁查詢等等。

數據水平拆分后的結構:

階段八、應用的拆分

8.1、拆分應用

隨著業務的發展,業務越來越多,應用越來越大。我們需要考慮如何避免讓應用越來越臃腫。這就需要把應用拆開,從一個應用變為倆個甚至更多。還是以我們上面的例子,我們可以把用戶、商品、交易拆分開。變成“用戶、商品”和“用戶,交易”兩個子系統。

拆分后的結構:

問題:

1. 這樣拆分后,可能會有一些相同的代碼,如用戶相關的代碼,商品和交易都需要用戶信息,所以在兩個系統中都保留差不多的操作用戶信息的代碼。如何保證這些代碼可以復用是一個需要解決的問題。

解決問題:

1. 通過走服務化的路線來解決

8.2、走服務化的道路

為了解決上面拆分應用后所出現的問題,我們把公共的服務拆分出來,形成一種服務化的模式,簡稱SOA。

采用服務化之后的系統結構:

優點:

相同的代碼不會散落在不同的應用中了,這些實現放在了各個服務中心,使代碼得到更好的維護。

我們把對數據庫的交互放在了各個服務中心,讓”前端“的web應用更注重與瀏覽器交互的工作。

問題:

1. 如何進行遠程的服務調用

解決方法:

1. 我們可以通過下面的引入消息中間件來解決

階段九、引入消息中間件

隨著網站的繼續發展,我們的系統中可能出現不同語言開發的子模塊和部署在不同平臺的子系統。此時我們需要一個平臺來傳遞可靠的,與平臺和語言無關的數據,并且能夠把負載均衡透明化,能在調用過程中收集調用數據并分析之,推測出網站的訪問增長率等等一系列需求,對于網站應該如何成長做出預測。開源消息中間件有阿里的dubbo,可以搭配Google開源的分布式程序協調服務zookeeper實現服務器的注冊與發現。

引入消息中間件后的結構:

十、總結

以上的演變過程只是一個例子,并不適合所有的網站,實際中網站演進過程與自身業務和不同遇到的問題有密切的關系,沒有固定的模式。只有認真的分析和不斷地探究,才能發現適合自己網站的架構。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • Web
    Web
    +關注

    關注

    2

    文章

    1269

    瀏覽量

    69730
  • JAVA
    +關注

    關注

    19

    文章

    2974

    瀏覽量

    105137
收藏 人收藏

    評論

    相關推薦

    buck電路原理圖講解 buck電路的演變過程

    buck電路相信很多從事電子類工作的朋友都聽過,它說白了就是個直流降壓電路,在降壓芯片出來之前,它的出場率非常高但是以前僅僅是看過他,不懂它是怎樣演變過來的,今天旺哥和大家一起分析學習下它的演變過程
    發表于 08-23 15:28 ?1407次閱讀
    buck電路原理圖講解 buck電路的<b class='flag-5'>演變過程</b>

    數字式稱重傳感器的功能演變過程

    [1]、[2]),本文不再累述。本文僅想對數字式智能化稱重傳感器功能演變過程,從初始階段的數字化前置轉換、到第二階段的智能化補償與校正、到第三階段的稱重系統的智能化應用的演變,進行了較為詳盡的論述。
    發表于 07-11 08:11

    PBGA向FBGA轉變過程中的挑戰是什么

    PBGA向FBGA轉變過程中的挑戰是什么
    發表于 04-30 06:12

    【視頻分享】降壓電路的演變過程

    大家上午好:前幾天分享了姜維老師的文章講解,這次分享姜維老師的視頻講解,保證大家能夠理解透徹,有問題的同學歡迎交流討論!文章分享鏈接:詳細分析降壓電路的演變過程
    發表于 06-22 10:01

    交流電變成直流電的轉變過程

    3.交流電變成直流電的轉變過程稱為濾波。...
    發表于 09-17 08:39

    計算機軟件的發展演變簡介

    計算機軟件的發展演變簡介    如同硬件一樣,計算機軟件也是在不斷發展的。下面以系統程序為例,簡要說明軟件的發展演變過程。    1.
    發表于 04-13 13:56 ?4342次閱讀

    標準化模組演變過程和電量梯度

    我最近在思考一件對我們來說比較需要值得考慮的過程,在芯尺寸、模組尺寸和平臺化定義方面,到底是什么推動芯標準化的過程,是什么推動了模組標準化和不同的電量梯度。
    的頭像 發表于 06-29 09:38 ?5364次閱讀
    標準化模組<b class='flag-5'>演變過程</b>和電量梯度

    定位技術的演變過程

    定位技術從室外定位到室內定位的演變過程 今天給大家分享下定位技術的演變,從室外定位到UWB室內定位的演變過程,以及目前較新的室外定位技術和室內定位技術。本文從定位精度方面來分析。 一、
    發表于 03-13 10:36 ?1895次閱讀

    升壓變換器二種結構的演變過程資料下載

    電子發燒友網為你提供升壓變換器二種結構的演變過程資料下載的電子資料下載,更有其他相關的電路圖、源代碼、課件教程、中文資料、英文資料、參考設計、用戶指南、解決方案等資料,希望可以幫助到廣大的電子工程師們。
    發表于 03-29 16:47 ?17次下載
    升壓變換器二種結構的<b class='flag-5'>演變過程</b>資料下載

    打通ERP與系統,ERP與系統整合

    打通ERP與系統,ERP與系統整合
    的頭像 發表于 10-25 16:13 ?1091次閱讀
    打通ERP與<b class='flag-5'>電</b><b class='flag-5'>商</b><b class='flag-5'>系統</b>,ERP與<b class='flag-5'>電</b><b class='flag-5'>商</b><b class='flag-5'>系統</b>整合

    buck電路的演變過程

    buck電路相信很多從事電子類工作的朋友都聽過,它說白了就是個直流降壓電路,在降壓芯片出來之前,它的出場率非常高但是以前僅僅是看過他,不懂它是怎樣演變過來的,今天和大家一起分析學習下它的演變過程
    的頭像 發表于 09-25 14:40 ?837次閱讀
    buck電路的<b class='flag-5'>演變過程</b>

    javaweb是前端還是后端

    JavaWeb既可以是前端,也可以是后端。 JavaWeb前端主要是指使用Java語言開發的用于構建Web前端應用程序的技術框架和工具。它主要負責用戶界面的展示以及與用戶之間的交互。JavaWeb
    的頭像 發表于 11-16 10:51 ?3162次閱讀

    javaweb和springboot的關系

    JavaWeb和Spring Boot是Java開發中常用的兩種技術框架。它們可以說是關系緊密的,因為Spring Boot是基于JavaWeb的開發框架,而JavaWeb是使用Spring
    的頭像 發表于 11-16 10:52 ?8313次閱讀

    淺析can技術的演變過程

    CAN技術的演變 為了了解從 CAN FD 到 CAN XL 的轉變,讓我們簡單回顧一下 CAN 技術的演變: 經典 CAN:原始 CAN 協議,最大數據速率為 1 Mbps,有效負載大小高達 8 字節。幾十年來,它已廣泛應用于汽車和工業應用。
    發表于 11-17 11:41 ?635次閱讀
    淺析can技術的<b class='flag-5'>演變過程</b>

    javaweb從入門到實戰

    JavaWeb是一門使用Java語言開發Web應用程序的技術,它廣泛應用于各種網站和在線應用程序的開發。對于想要學習和使用JavaWeb技術的開發者來說,從入門到實戰這條路并不是很容易,需要有系統
    的頭像 發表于 12-03 11:44 ?1557次閱讀
    澳门百家乐官网博牌| 百家乐官网现金网最好的系统哪里有可靠吗| 我的做生意财位| 大发888注册娱乐游戏| 王子百家乐官网的玩法技巧和规则| 大发888代充值存款| 月华百家乐官网的玩法技巧和规则 | 大发888-大发娱乐城| 百家乐官网缩水软件| 君豪棋牌是真的吗| 百家乐在线投注网| 百家乐官网大转轮| 龙博| 大三巴百家乐的玩法技巧和规则| 澳门百家乐官网| 博彩e族首页| 百家乐技巧何为百家乐之路| 百家乐官网赌博破解| 菲律宾在线游戏| 环球百家乐的玩法技巧和规则| 三国百家乐官网娱乐城| 威尼斯人娱乐城赌博网站| 风水24龙| 百家乐官网双倍派彩的娱乐城 | 百家乐官网平玩法几副牌| 百家乐官网起步多少| 月华百家乐的玩法技巧和规则| 巴宝莉百家乐官网的玩法技巧和规则 | 德钦县| 大发888下载娱乐场| 大赢家百家乐的玩法技巧和规则| 百家乐辅助工具| 哪个百家乐官网投注比较好| 万豪国际开户| 大发888在线体育官网| 百家乐赌博博彩赌博网| 百家乐庄闲多少| 电子百家乐破| 百家乐怎么骗人| 百家乐塑料扑克牌盒| 缅甸百家乐官网网站是多少|