吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

介紹從數據分析師轉型為數據科學家的具體方法

電子工程師 ? 來源:lp ? 2019-03-01 15:34 ? 次閱讀

文章解釋了轉型為數據科學家的原因,整理了數據科學家應該掌握的技能,著重介紹了從數據分析師轉型為數據科學家的具體方法。

如何從數據分析師華麗轉型,成為一名數據科學家?好比“把大象裝進冰箱”,成為“數據科學家”僅需簡單三步:

1. 進入LinkedIn登錄你的賬號。

2. 點擊“編輯個人資料”。

3. 將 “數據分析師”這個詞替換為“數據科學家”。

搞定,就是這么簡單!

理想很豐滿,現實很骨感。在現實生活中,我們必須承認:培養數據洞察能力絕非易事。

入門數據科學早已有許多優秀的博文可供參考,比如以下兩篇:《成為Jet.com數據分析師的自學之路》和《入門數據科學需掌握的基礎知識》,但是為數據分析師提供轉型為數據科學家的方法的文章卻少之又少。

《成為Jet.com數據分析師的自學之路》:

https://medium.freecodecamp.org/a-path-for-you-to-learn-analytics-and-data-skills-bd48ccde7325

《入門數據科學需掌握的基礎知識》:

https://medium.freecodecamp.org/aspiring-data-scientist-master-these-fundamentals-be7c54350868

在我開始介紹這條轉型之路前,我還是想先花些功夫詳細描述一下這兩種職業身份的具體職責。

數據分析師的主要工作是對數據進行收集和處理,并通過統計算法分析已處理的結構化數據,從而為數據賦能,改良決策。

數據科學家也會進行類似的工作,但對其提出了更高的要求。除上述職責外,一個優秀的數據科學家需要同時具備處理大量非結構化數據的能力,甚至擁有對數據進行實時處理的能力。

他們不僅可以洞悉數據背后的價值,還會對數據進行更深度的清洗和處理,并且用各種各樣的高級算法對數據進行更深層的分析。除此之外,他們還具有很強的敘事能力和數據可視化能力。

我經常會接觸到許多才華橫溢的分析師,他們急切地想要在數據科學界大展拳腳,卻總是找不合適的機會,甚至不知從何入手——而這正是我寫下這篇文章的主要原因。

為什么要成為數據科學家?

影響力:成為一名數據科學家意味著你將有機會發現和創造巨大的商業價值,發表更高層的決策意見,甚至幫助企業尋找未來的發展方向。

成就感:數據科學是一個飛速發展的領域,其中有許多有趣的問題亟待解決。作為一名數據科學家,你可以建立圖像識別系統,開發文本分類器,識別社交媒體上的惡意評價,投身解決一系列尚未攻克的難題。

前沿性:曾有人預言,人工智能將最終取代人類工作。與其等著自己的工作被人工智能取代,不如主動出擊,追上這一時代的浪潮。

薪酬待遇:也許數據科學家的薪酬還不足以讓你享受開游艇喝香檳的奢靡生活,但相較于其他工作已經相當可觀。業界對數據科學家的需求量依舊較大,優秀的數據科學家仍屬高薪稀缺人才。直白來講,為了更好的明天,努力成為一名優秀的數據科學家吧!

數據科學——學得多,做得多,但賺得也多!

友情提示:量力而行,切忌盲從,不要被金錢和誘惑蒙蔽了雙眼,畢竟貪得無厭沒有好結果(“華爾街之狼”的下場很慘)。

我是否擁有成為數據科學家的資質?

盡管培養處理棘手的數據結構和(或)大型數據的能力需要數年的經驗積累,但別灰心,實際上大多數分析師在一定程度上已經打下了成為數據科學家的基礎。換句話說,只要肯下功夫,轉型為數據科學家沒有想象中那么困難。

那么,成為一名合格的數據科學家到底需要掌握哪些技能?

一個復雜的數據科學項目可能由眾多子項目構成,且項目流程又復雜多變,所以我們恐怕沒有辦法找到這個問題的標準答案。單就近幾年數據科學的發展來看,成為一名數據科學家至少需要了解以下幾個方面的技能分支:

數據科學語言:Python / R。

關系型數據庫?:MySQL,Postgress。

非關系型數據庫:MongoDB。

機器學習模型:回歸算法(Regression)、提升決策樹(Boosted Trees)、支持向量機(SVM)、神經網絡(NNs)等。

圖像處理:Neo4J,GraphX

分布式計算:Hadoop,Spark

云計算?:GCP / AWS / Azure

API 交互:OAuth,Rest

數據可視化和Web應用:D3,RShiny

專業領域:自然語言處理(NLP),光學字符識別(OCR)和計算機視覺(CV)

Boosted Trees模型在近幾年的數據科學競賽中大放異彩。

RShiny數據儀表盤是一個優秀的交互工具,可供用戶更加直觀地對數據進行探索。

掌握這些技能需要很長時間(可能比完成學位課程的時間還要長),即使是為我們熟知的“牛人”們仍在不斷地學習。但是,我們大可不必擔心自己能力有限,學習知識需要一步步的積累,掌握技能需要一步步的打磨。每天進步一點,總有一天我們將擁有足夠豐富的知識儲備和高水平的技能迎接未來的挑戰。

智力水平的高低無法決定我們是否可以獲得成功,堅定的決心和頑強的意志才是通往成功的關鍵所在。

我具體應該怎么做?

在開始行動前,我們需要掌握一些基本的技能:

樹立正確的信念。或許在十年前,找到一門合適的數據軟件課程可能需要花費數周之久,但時代已變,線上學習材料觸手可及,資源匱乏再也不是逃避學習的借口。我們必須保持持續學習的能力,不斷為自己充電,磨練自己的技術。

學習一門編程語言并提升你的數學能力。大多數人都是從學習Python和(或)R開始數據科學之路的,而且Coursera和Udemy等網站上提供了大量相關的免費課程資源。Python用戶喜歡通過Anaconda和Jupyter編程,而R用戶則較多地使用R Studio。就數學計算能力而言,吳恩達(Andrew Ng)的機器學習課程和斯坦福大學的神經網絡課都很適合于轉型人士學習。

動手解決問題。你可以嘗試在工作中找到所遇到的實際問題,與業務專家和數據工程師展開合作,親自動手解決這些問題——這是最好的端到端開發模式。

參加Kaggle比賽。還有什么比與數千人同臺競賽更能提升建模技巧呢?Kaggle上的比賽要求十分清晰,提供的數據都已經過清洗,非常值得一試。剛開始不要太在意比賽的排名,以嘗試的心態開始你的第一場比賽——每一次嘗試都是新的開始。

緊隨領軍人物的動態。有些人喜歡把為這一領域做出杰出貢獻的人比作“數據科學界的搖滾巨星”,他們的言行和工作非常值得你花時間去了解和學習——時常刷新Geoffrey Hinton,Andrew Ng,Yann LeCun,Rachel Thomas和Jeremy Howard等人的動態,你肯定會有所收獲。

高效地工作。在一定工作積累后,嘗試借助工具提升你的工作效率——使用GitHub等版本控制工具維護和儲存你的代碼,用Docker對你的代碼進行封裝與發布。

有效地溝通。學會“推銷”自己的工作。高管們總是喜歡“華麗”的項目展示,所以當你在做重要的工作報告時要努力“博眼球”,突出工作的亮點。

Twitter也是另一種獲取信息的媒介,Rachel Thomas等人的動態十分值得關注。

為自己鋪路

即使你掌握了世界上所有的技能,如果你的公司無法提供合適的開發工具,配置相應的開發環境,你也很難施展拳腳。

現實生活中總會有一些不可控的因素阻礙我們前進的腳步,與其浪費時間糾結于此,我們更加應該關注那些我們可以改變的因素并積極做出行動。

加入新的團隊,這是最簡單可行的轉型方法。大多數中到大型的公司都至少會有一個小型數據科學團隊——別猶豫,加入他們!

與專業人士合作,如果你無法“跳槽”,那么就請想方設法找到在你認識范圍內知識最淵博的數據科學家并與之合作。

舉例來說,你可以在現有的工作中找到可自動化完成的業務流程,然后帶著這一問題找到這方面的專家。但這時千萬不要直接把任務“甩”給這些專家,嘗試與他們合作,加入到問題的解決過程中來。

搭建數據科學的內部環境,并不是所有的公司都確定它們是否需要數據科學的幫助,或者他們并不知道如何引入數據科學作為分析工具。

傳統的分析系統已經讓他們忙得不可開交,且開發新數據分析系統所帶來的安全和審計任務都相當耗時,因此他們只接受效益明顯的商業應用方案——這就是你大顯身手的機會,用你的知識儲備為公司搭建數據科學發展環境,引入合適的數據科學工具,培養內部人員的數據思維,為數據科學團隊儲備力量。

開發一個明確的業務用例,你可以重新審視業務流程,思考如何將數據科學應用到這些業務中,想辦法將數據科學與業務完美融合,借助業務應用的成功案例為數據科學的后續發展鋪路。

與有更多技能的人合作,加入多元化的團隊不僅可以幫助你更容易獲得更大的成就,你還可以在合作過程中學習到其他成員掌握的知識和擁有的技能。

尾記

種一棵樹最好的時間是十年前,其次是現在。珍惜這次機會,馬上開始你的學習之路,從實際問題入手,步步攻克一系列難關。開弓沒有回頭箭,你必須不斷努力,將全部的信心和熱情投入到工作中,你會驚訝地發現原來自己也可以獲得如此高的成就!

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47666

    瀏覽量

    240272
  • 數據分析
    +關注

    關注

    2

    文章

    1461

    瀏覽量

    34164
  • 數據科學
    +關注

    關注

    0

    文章

    166

    瀏覽量

    10102

原文標題:進階指南:如何從數據分析師轉型為數據科學家?

文章出處:【微信號:BigDataDigest,微信公眾號:大數據文摘】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    數據分析需要的技能

    問題,實用工具有Tableau、FineBI、Qlikview!4. 扎實的統計學知識儲備大多數數據分析師都具有計算機、數學和統計學背景,尤其是統計學,是數據分析師的基本功,數據采集
    發表于 04-10 15:59

    python數據分析的類庫

    Python之所以這么流行,這么好用,就是因為Python提供了大量的第三方的庫,開箱即用,非常方便,而且還免費哦,學Python的同學里估計有30%以上是為了做數據分析師或者數據挖掘,所以數據分析
    發表于 05-10 15:18

    數據分析師當取數機?大材小用背后是BI軟件的缺位

    好端端一個數據分析師,天天被業務部門指揮著去拉數據,累死累活不說,還擠兌得沒時間做深度分析。久而久之數據分析師都被逼成取數機了。數據分析師
    發表于 12-24 14:05

    成為Python數據分析師,需要掌握哪些技能

    的三大任務分析歷史預測未來優化選擇第三、數據分析師要求的8項技能統計學統計檢驗、P值、分布、估計基本工具PythonSQL多變量微積分和線性代數數據整理數據可視化軟件工程機器學習
    發表于 06-23 12:16

    成為Python數據分析師,需要掌握哪些技能

    的三大任務分析歷史預測未來優化選擇第三、數據分析師要求的8項技能統計學統計檢驗、P值、分布、估計基本工具PythonSQL多變量微積分和線性代數數據整理數據可視化軟件工程機器學習
    發表于 06-30 11:42

    通往數據科學家的崎嶇道路

    如果你曾經查看過數據科學家的崗位要求,你就知道它的職責范圍有多廣。有的數據科學家致力于自然語言處理、計算機視覺、深度學習,有的則從事A/B測試、產品
    的頭像 發表于 07-26 09:17 ?2619次閱讀

    哪些才是對數據科學家最迫切的技能呢?

    AngelList提供的是列出數據科學家崗位的公司數而不是崗位數。我把AngelList所有分析里面排除掉了,因為其搜索算法似乎按照OR型的邏輯搜索進行,沒有辦法改成AND。如果你尋
    的頭像 發表于 11-19 18:14 ?3102次閱讀

    數據科學家與機器學習工程怎么區分

    十年來,我們一直在談論數據科學數據科學家。雖然在怎么才叫“數據科學家”的問題上始終存在著爭議,
    的頭像 發表于 05-18 11:24 ?3270次閱讀

    數據科學家數據工程的區別

    數據科學家和數據工程的主要區別,可以用ETL和DAD的區別來解釋。
    的頭像 發表于 07-10 17:06 ?2690次閱讀

    數據分析修煉手冊教程免費下載

    本文檔的主要內容詳細介紹的是數據分析修煉手冊教程免費下載包括了:前言,數據分析師如何分類? ,數據分析師具體工作職責和工作內容有哪些?,如
    發表于 10-08 08:00 ?1次下載
    <b class='flag-5'>數據分析</b>修煉手冊教程免費下載

    采訪資深數據科學家:成為數據科學家應具有的品質

    作為一門逐漸成熟的新興領域,與數據科學相關的很多領域開始變得備受青睞,比如數據工程,數據分析以及機器學習和深度學習。數據
    的頭像 發表于 06-30 11:28 ?2370次閱讀

    什么是數據科學家的最佳編程語言?

    每個數據科學學習者都最常問的問題:“ 什么是數據科學家的最佳編程語言?”。
    的頭像 發表于 07-05 11:32 ?2553次閱讀

    數據科學家和數據工程能合二一嗎?

    雖然數據科學家和數據工程的角色似乎截然不同,但數據科學家和數據工程有許多共同的特點和共技能。
    的頭像 發表于 07-25 10:17 ?2580次閱讀

    高級數據分析師憑什么月薪三萬?一文解答你所有困惑

    適逢全國上下都在探討數字化,各行各業開始不遺余力地深耕數字化轉型數據分析師也成了大熱職業,變身搶手的香餑餑。 不過打開招聘網站大家卻能看見差距:數據分析師平均薪資在10k到20k之間, 大廠
    發表于 07-08 18:07 ?401次閱讀
    高級<b class='flag-5'>數據分析師</b>憑什么月薪三萬?一文解答你所有困惑

    面向工程科學家的大數據

      為了有效地利用大數據的優勢,工程科學家需要一個可擴展的工具,例如 MATLAB,以提供對用于存儲和管理數據的各種系統和格式的訪問。
    的頭像 發表于 10-06 07:52 ?690次閱讀
    老江死了| 澳门百家乐官网博客| 送彩金百家乐官网平台| 百家乐咋个玩的| 查找百家乐群| 金龙博彩网| 百家乐官网制胜法| 联众百家乐的玩法技巧和规则| 周口市| 金锁玉关24山砂水断| 连环百家乐的玩法技巧和规则| 宝龙线上娱乐城| 缅甸百家乐官网视频| 德州扑克术语| 大家旺百家乐官网的玩法技巧和规则 | 百家乐庄家抽水的秘密| 六合彩开奖历史记录| 广发百家乐官网的玩法技巧和规则| 大发888大发888娱乐城| 百家乐官网998| 鼎尚百家乐的玩法技巧和规则 | 百家乐官网玩法教材| 皇冠百家乐赢钱皇冠| 宁安市| 在线百家乐博彩| 博九最新网址| 百家乐评级导航| 浩博国际娱乐城| 足球百家乐网上投注| 百家乐官网压钱技巧| 百家乐游戏机技| 百家乐官网三路秘诀| 全讯网25900.com| 新时代百家乐官网娱乐城| 大发888虎牌官方下载| 米其林百家乐官网的玩法技巧和规则| 德州扑克锦标赛| 百家乐数据程序| 百家乐官网出千技巧| 百家乐的路子怎么| 视频百家乐官网赌法|