吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實(shí)例詳解對(duì)Serverless SQL大數(shù)據(jù)分析技術(shù)的應(yīng)用

人工智能與大數(shù)據(jù)技術(shù) ? 來(lái)源:YXQ ? 2019-07-26 10:54 ? 次閱讀

近年來(lái), Serverless作為一種新型的互聯(lián)網(wǎng)架構(gòu)直接或間接推動(dòng)了云計(jì)算的發(fā)展,同時(shí)基于Serverless的輕量計(jì)算也成為了新的技術(shù)熱點(diǎn),而Serverless SQL大數(shù)據(jù)分析產(chǎn)品就在此背景下應(yīng)運(yùn)而生。

目前,國(guó)內(nèi)云計(jì)算廠商UCloud推出的一款基于Serverless的SQL分析計(jì)算引擎USQL,可輕松完成面向海量數(shù)據(jù)的數(shù)據(jù)建模工作,SQL即可完成數(shù)據(jù)查詢和分析,極大降低使用大數(shù)據(jù)的門(mén)檻,且無(wú)需數(shù)據(jù)庫(kù)管理員和運(yùn)維人員,大幅度改善企業(yè)對(duì)大數(shù)據(jù)工程師的依賴。

下面通過(guò)實(shí)例來(lái)對(duì)Serverless SQL大數(shù)據(jù)分析技術(shù)的應(yīng)用做出詳解:

愛(ài)普新媒是一家專注于移動(dòng)互聯(lián)網(wǎng)產(chǎn)品研發(fā)和新媒體整合營(yíng)銷的高新技術(shù)型公司,旗下?lián)碛?00余款精品軟件,內(nèi)容涵蓋日常生活、效率工具、文章資訊等多個(gè)方面,主營(yíng)以天氣預(yù)報(bào)、快游等綜合自媒體矩陣為載體的推廣業(yè)務(wù)和以云魔方DSP移動(dòng)互聯(lián)網(wǎng)廣告分發(fā)平臺(tái)為基礎(chǔ)的廣告投放業(yè)務(wù)。

目前愛(ài)普新媒廣告業(yè)務(wù)數(shù)據(jù)規(guī)模達(dá)到數(shù)百TB,日增長(zhǎng)量為1TB左右,業(yè)務(wù)日常不固定的分析需求非常多。在現(xiàn)有的大數(shù)據(jù)處理方案下,數(shù)據(jù)部門(mén)每月需投入大數(shù)據(jù)工程師20個(gè)人/日,平均每次需求處理時(shí)長(zhǎng)為1.8天,此外還需額外花費(fèi)數(shù)千元維持一個(gè)數(shù)據(jù)倉(cāng)庫(kù)集群。基于已有架構(gòu),數(shù)據(jù)部門(mén)將廣告日志數(shù)據(jù)壓縮后存放于對(duì)象存儲(chǔ)UFile中,接收到業(yè)務(wù)分析師不固定的數(shù)據(jù)需求后,再將用于分析的原始數(shù)據(jù),臨時(shí)加載到數(shù)據(jù)倉(cāng)庫(kù)UDW中,完成SQL分析后實(shí)施清除操作。

圖:愛(ài)普新媒現(xiàn)有架構(gòu)

在已有架構(gòu)的模式下,愛(ài)普新媒面臨著來(lái)自業(yè)務(wù)和數(shù)據(jù)分析部門(mén)極大的挑戰(zhàn):

業(yè)務(wù)部門(mén):

(1)由于數(shù)據(jù)規(guī)模較大,業(yè)務(wù)分析師無(wú)法自主完成分析,必須極大程度依賴大數(shù)據(jù)工程師;

(2)任務(wù)處理周期長(zhǎng),若出現(xiàn)新的需求變更或分析結(jié)果未達(dá)預(yù)期的情況,需要重新走一遍處理流程;

(3)當(dāng)對(duì)分析結(jié)果存有疑問(wèn)時(shí),無(wú)法查看原始數(shù)據(jù)進(jìn)行校驗(yàn)。

數(shù)據(jù)部門(mén):

(1)業(yè)務(wù)部門(mén)每月的不固定數(shù)據(jù)分析需求非常多,數(shù)據(jù)部門(mén)有限的技術(shù)人力資源難以支撐;

(2)需求變動(dòng)返工次數(shù)多,導(dǎo)致大量重復(fù)性工作;

(3)隨著數(shù)據(jù)日增長(zhǎng)量的不斷提升,用于臨時(shí)存放不固定需求數(shù)據(jù)的GreenPlum成本不斷在增加。

愛(ài)普新媒對(duì)業(yè)務(wù)改善的訴求便是:可支持?jǐn)?shù)百TB規(guī)模的數(shù)據(jù)分析、業(yè)務(wù)分析師可獨(dú)立完成不固定需求分析工作、具有較強(qiáng)的Ad-Hoc能力、可縮短每次需求處理時(shí)長(zhǎng)、可降低計(jì)算成本投入和運(yùn)維投入。

針對(duì)以上問(wèn)題,UCloud使用USQL產(chǎn)品幫助愛(ài)普新媒對(duì)現(xiàn)有業(yè)務(wù)數(shù)據(jù)處理架構(gòu)做出了改善。UCloud發(fā)現(xiàn),愛(ài)普新媒現(xiàn)有架構(gòu)中計(jì)算與存儲(chǔ)是分離的狀態(tài),其原始數(shù)據(jù)并未與GreenPlum強(qiáng)耦合,這為更換分析引擎的方案實(shí)施提供了便利。

GreenPlum數(shù)據(jù)平滑切換至USQL

首先在新架構(gòu)中使用USQL替換原先用于臨時(shí)加載數(shù)據(jù)的GreenPlum,省去數(shù)據(jù)從UFile導(dǎo)入到GreenPlum的過(guò)程,使得業(yè)務(wù)分析師能夠直接通過(guò)SQL分析UFile中海量數(shù)據(jù),全程無(wú)需大數(shù)據(jù)工程師的參與。

圖:愛(ài)普新媒新架構(gòu)

USQL升級(jí)保障多格式數(shù)據(jù)支持

此外,數(shù)據(jù)對(duì)接中發(fā)現(xiàn),愛(ài)普新媒的數(shù)據(jù)格式為JSON并通過(guò)GZIP格式壓縮,UCloud了解后一周內(nèi)完成USQL產(chǎn)品升級(jí),得以支持這兩種數(shù)據(jù)格式,減少對(duì)接上的障礙,并協(xié)助愛(ài)普新媒重新布局其現(xiàn)有數(shù)據(jù),目前愛(ài)普新媒實(shí)際業(yè)務(wù)SQL已全部落地,同時(shí)完成產(chǎn)品培訓(xùn)以及現(xiàn)場(chǎng)演示。

圖:實(shí)際業(yè)務(wù)SQL示例

最終,我們對(duì)應(yīng)用了USQL的愛(ài)普新媒新數(shù)據(jù)平臺(tái)與原平臺(tái)進(jìn)行了對(duì)比分析:

1、計(jì)算成本降低97.5%

相較于愛(ài)普新媒現(xiàn)在每月花費(fèi)在傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)(用于臨時(shí)存放數(shù)據(jù))的數(shù)千元,處理同樣的數(shù)據(jù),USQL可將成本控制在每月幾十元,因?yàn)閁SQL按照實(shí)際分析數(shù)據(jù)量計(jì)費(fèi),每GB數(shù)據(jù)分析價(jià)格極低,且不使用時(shí)不計(jì)費(fèi)。

2、任務(wù)周期縮短55.6%

愛(ài)普新媒現(xiàn)有架構(gòu)下,處理不固定的數(shù)據(jù)需求,數(shù)據(jù)導(dǎo)入與分析平均處理時(shí)長(zhǎng)為1.8天,而USQL可省去數(shù)據(jù)導(dǎo)入的步驟,減少運(yùn)維工作量,大幅度縮短每次任務(wù)完成時(shí)間。

3、分析效率提升5倍

愛(ài)普新媒所有真實(shí)業(yè)務(wù)SQL均已落地,其中最耗時(shí)的SQL分析時(shí)間可從600秒降至118秒,整體明顯提高SQL分析效率。

4、大數(shù)據(jù)工程師投入降為0

目前每月需投入大數(shù)據(jù)工程師20個(gè)人日,使用USQL產(chǎn)品,業(yè)務(wù)分析師可直接通過(guò)SQL在對(duì)象存儲(chǔ)UFile中完成數(shù)據(jù)分析,極大減少對(duì)工程師的依賴,有限的人力資源可得到更好的利用。

愛(ài)普新媒CTO牛德恒總結(jié)道:“使用USQL產(chǎn)品,用戶在原有的數(shù)據(jù)文件基礎(chǔ)上進(jìn)行數(shù)據(jù)建模,即可使用SQL進(jìn)行業(yè)務(wù)數(shù)據(jù)的快速查詢,此種方式對(duì)原有數(shù)據(jù)文件改動(dòng)較小,用戶不用關(guān)注大數(shù)據(jù)分布式處理的過(guò)程,業(yè)務(wù)遷移方便。對(duì)比我們現(xiàn)有的大數(shù)據(jù)處理方案,節(jié)省80%的服務(wù)器成本,提升50%數(shù)據(jù)分析速度,同時(shí)也縮短了新業(yè)務(wù)的開(kāi)發(fā)周期,值得推薦。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 云計(jì)算
    +關(guān)注

    關(guān)注

    39

    文章

    7850

    瀏覽量

    137877
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8908

    瀏覽量

    137799
  • serverless
    +關(guān)注

    關(guān)注

    0

    文章

    65

    瀏覽量

    4521

原文標(biāo)題:提升效率50%+節(jié)約成本80%,Serverless SQL大數(shù)據(jù)分析的最佳實(shí)踐

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    電力系統(tǒng)數(shù)據(jù)分析技術(shù)

    隨著智能電網(wǎng)技術(shù)的發(fā)展和大數(shù)據(jù)時(shí)代的到來(lái),電力系統(tǒng)數(shù)據(jù)分析技術(shù)已成為電力行業(yè)不可或缺的一部分。這些技術(shù)能夠幫助電力公司更好地理解電網(wǎng)的運(yùn)行狀
    的頭像 發(fā)表于 01-18 09:46 ?135次閱讀

    NeuroBlade攜手亞馬遜EC2 F2實(shí)例,加速數(shù)據(jù)分析

    里程碑式的合作,標(biāo)志著NeuroBlade的創(chuàng)新技術(shù)將與亞馬遜云科技的先進(jìn)計(jì)算資源強(qiáng)強(qiáng)聯(lián)合,共同推動(dòng)云原生數(shù)據(jù)分析工作負(fù)載的性能與效率邁向新高度。 據(jù)悉,Amazon EC2 F2實(shí)例融合了AMD
    的頭像 發(fā)表于 12-31 11:37 ?262次閱讀

    LLM在數(shù)據(jù)分析中的作用

    隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)分析已經(jīng)成為企業(yè)和組織決策的關(guān)鍵工具。數(shù)據(jù)科學(xué)家和分析師需要從海量數(shù)據(jù)中提取有價(jià)值的信息,以支持業(yè)務(wù)決策。在這個(gè)過(guò)
    的頭像 發(fā)表于 11-19 15:35 ?430次閱讀

    如何使用SQL進(jìn)行數(shù)據(jù)分析

    使用SQL進(jìn)行數(shù)據(jù)分析是一個(gè)強(qiáng)大且靈活的過(guò)程,它涉及從數(shù)據(jù)庫(kù)中提取、清洗、轉(zhuǎn)換和聚合數(shù)據(jù),以便進(jìn)行進(jìn)一步的分析和洞察。 1.
    的頭像 發(fā)表于 11-19 10:26 ?435次閱讀

    raid 在大數(shù)據(jù)分析中的應(yīng)用

    的具體應(yīng)用: 一、提高性能 并行讀寫(xiě) :RAID技術(shù)通過(guò)并行讀寫(xiě)多個(gè)磁盤(pán),可以顯著提高數(shù)據(jù)的讀寫(xiě)速度。在大數(shù)據(jù)分析環(huán)境中,數(shù)據(jù)讀寫(xiě)速度是影響分析
    的頭像 發(fā)表于 11-12 09:44 ?314次閱讀

    emc技術(shù)大數(shù)據(jù)分析中的角色

    大數(shù)據(jù)分析通常涉及來(lái)自多個(gè)來(lái)源和格式的數(shù)據(jù)。這些數(shù)據(jù)可能包括結(jié)構(gòu)化數(shù)據(jù)(如數(shù)據(jù)庫(kù)中的表格數(shù)據(jù)
    的頭像 發(fā)表于 11-01 15:22 ?336次閱讀

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用

    云計(jì)算在大數(shù)據(jù)分析中的應(yīng)用廣泛且深入,它為用戶提供了存儲(chǔ)、計(jì)算、分析和預(yù)測(cè)的強(qiáng)大能力。以下是對(duì)云計(jì)算在大數(shù)據(jù)分析中應(yīng)用的介紹: 一、存儲(chǔ)和處理海量數(shù)據(jù) 云計(jì)算提供了強(qiáng)大的存儲(chǔ)和計(jì)算能力
    的頭像 發(fā)表于 10-24 09:18 ?603次閱讀

    IP 地址大數(shù)據(jù)分析如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    一、大數(shù)據(jù)分析在網(wǎng)絡(luò)優(yōu)化中的作用 1.流量分析 大數(shù)據(jù)分析可以對(duì)網(wǎng)絡(luò)中的流量進(jìn)行實(shí)時(shí)監(jiān)測(cè)和分析,了解網(wǎng)絡(luò)的使用情況和流量趨勢(shì)。通過(guò)對(duì)流量數(shù)據(jù)
    的頭像 發(fā)表于 10-09 15:32 ?308次閱讀
    IP 地址<b class='flag-5'>大數(shù)據(jù)分析</b>如何進(jìn)行網(wǎng)絡(luò)優(yōu)化?

    大數(shù)據(jù)從業(yè)者必知必會(huì)的Hive SQL調(diào)優(yōu)技巧

    大數(shù)據(jù)從業(yè)者必知必會(huì)的Hive SQL調(diào)優(yōu)技巧 摘要 :在大數(shù)據(jù)領(lǐng)域中,Hive SQL被廣泛應(yīng)用于數(shù)據(jù)倉(cāng)庫(kù)的
    的頭像 發(fā)表于 09-24 13:30 ?330次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一個(gè)涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見(jiàn)解的過(guò)程。在這個(gè)過(guò)程中,使用正確的工具至關(guān)重要。以下是一些主要的數(shù)據(jù)分析工具,以及它們的功能和用途的介紹。 Excel Exc
    的頭像 發(fā)表于 07-05 14:54 ?1060次閱讀

    數(shù)據(jù)分析有哪些分析方法

    數(shù)據(jù)分析是一種重要的技能,它可以幫助我們從大量的數(shù)據(jù)中提取有價(jià)值的信息,從而做出更明智的決策。在這篇文章中,我們將介紹數(shù)據(jù)分析的各種方法,包括描述性分析、診斷性
    的頭像 發(fā)表于 07-05 14:51 ?751次閱讀

    機(jī)器學(xué)習(xí)在數(shù)據(jù)分析中的應(yīng)用

    隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)量的爆炸性增長(zhǎng)對(duì)數(shù)據(jù)分析提出了更高的要求。機(jī)器學(xué)習(xí)作為一種強(qiáng)大的工具,通過(guò)訓(xùn)練模型從數(shù)據(jù)中學(xué)習(xí)規(guī)律,為企業(yè)和組織提供了更高效、更準(zhǔn)確的
    的頭像 發(fā)表于 07-02 11:22 ?813次閱讀

    大數(shù)據(jù)分析平臺(tái)網(wǎng)站

    大數(shù)據(jù)分析平臺(tái)是一種用于處理和分析大規(guī)模數(shù)據(jù)集的系統(tǒng),旨在從海量數(shù)據(jù)中提取有價(jià)值的信息和洞察。以下是大數(shù)據(jù)分析平臺(tái)的主要功能和應(yīng)用場(chǎng)景: 主
    的頭像 發(fā)表于 06-28 15:46 ?761次閱讀

    求助,關(guān)于AD采集到的數(shù)據(jù)分析問(wèn)題

    問(wèn)題描述:使用AD采集一個(gè)10Hz到2MHz的脈沖,脈沖底部可能大于零,由采集到的數(shù)據(jù)分析出該脈沖的上升時(shí)間,幅值和占空比。 備注:在分析的時(shí)候已經(jīng)知道脈沖的頻率,精度為2X10^-5. 在分析
    發(fā)表于 05-09 07:40

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放 隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,廣告投放行業(yè)正經(jīng)歷著一場(chǎng)深刻的變革。傳統(tǒng)的廣告投放方式已經(jīng)難以滿足市場(chǎng)需求,而大數(shù)據(jù)分析則為廣告投放帶來(lái)了精準(zhǔn)、高效
    的頭像 發(fā)表于 04-11 11:23 ?1067次閱讀
    康莱德百家乐官网的玩法技巧和规则| 百家乐官网信誉平台开户| 百家乐存1000送| 百家乐官网pc| 英皇国际| 瑞士百家乐的玩法技巧和规则 | 做生意摆放什么财神爷| 百家乐官网软件辅助| 威尼斯人娱乐城lm0| 百家乐官网娱乐人物| 威尼斯人娱乐场申博太阳城| 做生意什么花招财| 百家乐官网游戏软件开发| 大发888现金存款| 百家乐博乐36bol在线| 玩百家乐官网必赢的心法| 西乌珠穆沁旗| 大发888客服电话 在线| 百家乐平台注册送彩金| 基础百家乐官网规则| 乌拉特后旗| 大发888娱乐场下载sampling id112| 赌博百家乐游戏| 新西兰百家乐官网的玩法技巧和规则| 百家乐任你博娱乐场| 巴厘岛百家乐官网的玩法技巧和规则 | 网上百家乐作| 百家乐双面数字筹码| 百家乐官网谁能看准牌| 百家乐官网哪家有优惠| 澳门顶级赌场手机在线登陆| 百家乐乐翻天| 网上百家乐网站导航| 百家乐官网计划策略| 百家乐官网如何稳赢| bet365.com| 免费百家乐统计软件| 网络百家乐模拟投注| 黄金城百家乐官网免费下载| 百家乐官网最新产品| 富易堂百家乐官网娱乐城|