對于數據科學初學者來說,實干才是硬道理。所以我們只需選擇其中一種語言,并重點完成一些項目,接著便可品嘗勝利的果實。這就是最快的學習方式。
筆者雖然很想直接推薦Python(筆者主要使用Python,不過也的確掌握一些R語言的工作知識),但還是想為初學者公正地評估一下這兩種語言的有效性。這主要是因為選擇哪種語言取決于你自己的具體情況。
你為什么想學習?
必須考慮的因素是:你想要學習的原因。例如,如果你是一個訓練有素的生物學家,想學習一些編程技能以便更好地理解你的數據集,或者你熟悉其他科學編程語言,比如MATLAB,那么你應該考慮在YouTube上看一些R語言的教程,因為它對你來說比Python更簡單、更直觀。
或者,如果你是精通C/C++和Java等語言的軟件工程師,并且準備轉攻數據科學,Python將是適合你的一種語言。與大多數其他流行的編程語言一樣,Python是一種面向對象編程(OOP)語言,它可能比R語言更直觀。
又或者,也許你最近一直在閱讀數據科學這一迷人領域的相關文獻,并想涉足其中,在這種情況下,這兩種語言都是不錯的選擇。因此,比起學習的理由這一因素,選擇哪種語言將更多地取決于其他因素。
你是否有精通該語言的朋友或同事?
如果你正在學習一門新語言,那么獲得社區的支持將會是一個巨大的優勢。從社區獲得幫助是程序員的一項非常重要的技能。
作為一名初學者,學習如何獲得幫助有些棘手,很少有網絡資源來教會人們如何從社區獲得幫助。具備敏銳的直覺,并且知道當代碼出錯時應該詢問些什么是非常重要的。
如果你認識一個精通Python的人,或者你實驗室的另一個研究人員一直在研究R語言,那么你最好學習他們擅長的語言,因為這樣你就可以在遇到困難時隨時向他們求助。
你是只對統計和數據分析感興趣,還是想學習其他領域,如機器學習和人工智能?
在應用層面上,Python和R語言的一個顯著區別在于前者用途更廣泛。Python是一種成熟的編程語言,這意味著你只用Python便可以收集、存儲、分析和可視化數據,同時還可以創建機器學習工作管道并將其部署至生產或網站中。
另一方面,R語言則是只用于統計和數據分析,它的圖表要比Python的更美觀且個性化。R語言使用圖形語法(Grammar ofGraphics)的方式可視化其ggPlot2庫中的數據,這提供了Python所缺乏的大量直觀的個性化設置。
或許這樣說有些籠統,但如果你想成為一名數據分析師,R語言應該是你的首選。如果你想成為一名數據科學家,Python則是更好的選擇。這便是泛化與專業化的兩難選擇。
作為一個在過去十年間興起的領域,數據科學的進化日新月異。但不變的是越來越多的數據管道每天都在被自動化。
具備數據工程、數據可視化、機器學習工程、云服務集成和模型部署等多種技能的員工,總是比那些只專注于數據科學工作流程這一個方面的員工更受歡迎。該領域的發展已經在很大程度上實現自動化,只有編程技能出色的員工才能不被機器所取而代之。除非你極其擅長該領域,否則僅僅專注于構建優秀的機器學習模型在未來是行不通的。
目前的業內形勢是:有太多初學者水平的求職者,能力雖然“較為”出色,而初工作經驗則寥寥無幾。對于那些略微高級的工作崗位來說,則沒有足夠多的經驗豐富或技術對口的工作者。為了能夠在工作中更上一層樓,你將需要去理解并實踐工作流的其它階段,為何不讓自己的成功概率最大化?
如果你依舊舉棋不定,筆者建議最好是現在就選擇Python并開始學習。在你掌握了與之相關的工作知識之后,還可以學習R語言的基礎知識。但如果你實在用不慣Python,那么接下來該做什么就無需筆者多費口舌了。
作為初學者,你的首要任務應該是了解數據科學的核心概念,并首先了解如何將這些概念應用于實際場景。對于那些沒有編程或計算機科學背景知識的人來說,配置編程環境可能是件難事。然而,比起Python,配置環境并開始學習R語言的體驗可能會更加流暢友好。
有太多人只是沉溺于成為一名數據科學家的空想,而真正腳踏實地采取行動的人卻遠遠不夠。所以,是時候開始你的數據科學之旅了。
責編AJX
-
編程
+關注
關注
88文章
3637瀏覽量
93986 -
python
+關注
關注
56文章
4807瀏覽量
85039 -
數據科學
+關注
關注
0文章
166瀏覽量
10102
發布評論請先 登錄
相關推薦
評論