吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何搞定做機器學習研究需要的數學?

MqC7_CAAI_1981 ? 來源:未知 ? 作者:胡薇 ? 2018-08-20 14:24 ? 次閱讀

機器學習需要多少數學基礎?這是很多初學者最關心的問題,答案也眾說紛紜。

有人說,概率論線性代數要預先精通;有人說,微積分要懂一點;也有人說,沒必要特地去補;甚至有人專門寫了繞開數學的深度學習入門教材……

斯坦福大學計算機系學生、斯坦福AI實驗室研究助理(RA)Vincent Chen,最近在硅谷最牛孵化器Y Combinator官方博客上發表的一篇文章,就專門深入探討了里這個問題。

Vincent想要說的是,具體問題具體分析。

他跟領域內的很多工程師、研究人員、教育工作者,討論了這個問題,再加上自己的經驗,得出了這樣的結論:解決不同問題,可能需要不同程度的直覺 (Intuition) ,所以首先要知道自己的目標是什么。

構建產品和做研究,需要的數學就不太一樣。

不過,還是要先從大家都差不多的入門階段說起。

入門須知

熟悉線性代數/矩陣運算,是機器學習的軟性前提。也就是說,最好懂,不強制。

當然,學習數學最好的環境還是學校。沒有了學校里的壓力、競爭和交流,就要找其他方式來補充:學習小組、學習型午餐會都是不錯的形式。

想要在工作中學數學,編程最好也會一點,它會成為你的學習工具。

要知道,在機器學習任務中,數學和代碼是交織在一起的。代碼需要數學上的直覺,甚至和數學符號的語法有共通之處。

舉個例子:練習手動實現損失函數(loss functions)或者優化算法(optimization algorithm),就是真正理解背后概念的好方法。

再舉個比較實際的例子:在神經網絡里手動為線性整流函數(ReLU)實現反向傳播,就涉及用微積分里的鏈式法則來有效計算梯度,而運用鏈式法則,需要用ReLU的梯度乘以一個導數。

最開始,要先將ReLU激活函數可視化:

計算梯度(就是看起來的斜率),要可視化一個階梯函數,用指示函數表示:

現在的數據科學框架能直觀地把數學運算翻譯成可讀的代碼,NumPy就是其中之一。對于上面這個任務,它就可以將激活函數(藍色曲線)用代碼表示出來:

relu = np.maximum(x, 0)

梯度(紅色曲線)也可以:

grad[x < 0] = 0

只有親自求了一遍導數,才能理解這行代碼。

掌握基礎之后,就可以根據你的實際需求自定義學習方向了。

造機器學習產品需要的數學

作為一名學生,Vincent通過和多名機器學習工程師聊天,了解了他們在debug時最有用的數學知識。

總的來說,統計學和線性代數總是有用的,但面對不同的問題又有不同的需求。

那么,怎么確定該精修哪些數學知識呢?

首先,要定義你的系統。

想寫代碼為系統建模,可用的資源多得是。在構建系統的過程中,要想著這些問題:

系統的輸入/輸出是什么?

怎樣準備適合系統的數據?

怎樣構建特征、處理數據能讓模型更好地泛化?

怎樣為你的問題定義合理的目標?

然后,在你用到數學的時候,去學習它。

一頭扎進機器學習里,你就會發現自己會卡在某些步驟。卡住的時候,該查什么呢?你的權重合理嗎?你的模型為什么用這種損失就不收斂?

這時候,就需要對數據做假設,換個方式約束優化,或者換個算法試試。于是在這個建模或者debug過程里,你會發現懂數學對做決定有很大幫助,比如說要選擇損失函數和評價指標,數學就是個好工具。

這可以說是一種“按需”學習的方法了。

做機器學習研究需要的數學

如果是做研究的話,就需要廣泛的數學基礎,來給你鋪路。

現在,很多研究都是在現有系統之上進行的,缺少對基礎的理解。

這樣還不夠,研究者應該貢獻更基本的模塊。比如說,可以像深度學習教父Geoff Hinton提出的膠囊網絡(Capsule Networks)一樣,重新思考卷積神經網絡(CNN)這種基本模塊。

要想在機器學習領域做出這樣的成就,就需要問一些基礎問題,也就需要對數學的深刻理解?!渡窠浘W絡與深度學習》教材的作者Michael Nielsen稱之為“帶著玩心的探索”。

這個探索過程中,可能會在一個問題上卡幾個小時,可能需要換個角度去看問題。不過,只有這樣,科學家才能超越直觀想法和架構的組合,提出深刻、有見地的問題。

和構建產品不一樣的是,機器學習研究里的基礎思考不是“按需”進行的,想要以高級的數學框架所要求的廣度來思考、批判性地解決問題,需要耐心學習。

不要怕

總的來說,數學可能是有點可怕,你會卡在一個又一個地方。但是,這本來就是數學學習很重要的部分。

不要害怕。

實際上,數學好的人都要花好多時間來練習,于是,他們對這種做數學“被卡住”的感覺就習以為常了。想要學好數學,首先需要建立學生的心態。

想要習以為常,當然需要付出時間和努力,加油~

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133087
  • 深度學習
    +關注

    關注

    73

    文章

    5515

    瀏覽量

    121552

原文標題:怎樣搞定機器學習里的數學?斯坦福高手教你具體問題具體分析

文章出處:【微信號:CAAI-1981,微信公眾號:中國人工智能學會】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    【下載】《機器學習》+《機器學習實戰》

    、謀發展的決定性手段,這使得這一過去為分析師和數學家所專屬的研究領域越來越為人們所矚目。本書第一部分主要介紹機器學習基礎,以及如何利用算法進行分類,并逐步介紹了多種經典的監督
    發表于 06-01 15:49

    構建機器學習產品必需的數學背景

    必讀我們該如何學習機器學習中的數學
    發表于 08-15 11:44

    如果只是應用機器學習,而不是研究,需要哪些知識

    如果只是應用機器學習,而不是研究需要哪些知識?還用深入學習數字么
    發表于 08-30 14:51

    什么是數學?對思想和方法的基本研究有哪些?

    什么是數學?數學對思想和方法的基本研究有哪些?
    發表于 06-21 07:56

    什么是機器學習? 機器學習基礎入門

    中,我將概述機器學習,它是如何工作的,以及為什么它對嵌入式工程師很重要。什么是機器學習?機器學習
    發表于 06-21 11:06

    一文匯總機器學習和Python(包括數學)速查表

    新手學習機器學習很難,就是收集資料也很費勁。所幸Robbie Allen從不同來源收集了目前最全的有關機器學習、Python和相關數學知識的
    的頭像 發表于 07-04 08:25 ?2350次閱讀

    機器學習中所需要數學知識介紹

    數學和代碼在機器學習研究中通常是高度混合的。大多數情況下,代碼都是直接從數學邏輯中形成,并且能用代碼語法展示出
    的頭像 發表于 08-05 09:00 ?4344次閱讀

    機器學習需要數學,調包就行?

    大部分機器學習從業者不需要過度的把時間精力放在數學上,而該用于熟悉不同算法的應用場景和掌握一些調參技巧。好的數學基礎可以使你的模型簡潔高效,
    的頭像 發表于 09-30 10:38 ?5327次閱讀

    機器學習中應用數學應該要注意的幾點注記

    本章討論的主題是我覺得在應用機器學習(和其他地方)中經常假設的,但是很少詳細解釋。這項工作是針對學生誰采取了一些線性方法和分析的課程,但誰想看到一些技巧使用的研究人員討論更詳細一些。這里描述的
    發表于 11-16 16:17 ?3次下載

    如何用TensorFlow進行機器學習研究

    從理論上講,這幾乎是您使用 TensorFlow 進行機器學習研究所需要的全部內容。
    的頭像 發表于 02-05 10:06 ?2002次閱讀
    如何用TensorFlow進行<b class='flag-5'>機器</b><b class='flag-5'>學習</b><b class='flag-5'>研究</b>

    機器學習所需的數學知識你能夠有效使用嗎

    開始機器學習之旅,需要什么層次的數學功底? 尤其是對于那些沒有學過數學和統計學的同學們來說,這個問題當前不甚清楚,在這篇文章中,我將要為那些
    的頭像 發表于 02-02 17:10 ?2005次閱讀

    為什么物聯網的未來需要依賴機器學習

    人工智能是對感知周圍世界、形成計劃并為實現目標而做出決策的智能體的研究。它的基礎包括數學、邏輯、哲學、概率論、語言學、神經科學和決策理論。許多領域都屬于人工智能的范疇,如計算機視覺、機器人學、
    發表于 07-18 15:22 ?792次閱讀

    數據科學和機器學習需要的基本數學技能

    作為一切科學的基礎,數學在數據科學領域也占據著重要地位。如果你是一名數據科學愛好者,一定想過這些問題: 我可以在幾乎沒有數學背景的情況下,成為一名數據科學家嗎?在數據科學中,哪些基本的數學技能是重要的?
    的頭像 發表于 07-06 09:39 ?2612次閱讀

    阿里云機器學習研究員對大規模機器學習實踐的見解

    近年來,機器學習技術的發展歸因于我們有極其龐大的數據用來訓練算法。當企業需要落地大規模機器學習時,往往會面臨很多難題,如何解決這些問題?如何
    發表于 07-31 16:22 ?782次閱讀

    機器視覺需要哪些基礎_機器視覺行業發展前景

    學習機器視覺,需要具備以下知識和技能:   數學基礎:機器視覺需要用到很多數學知識,如線
    發表于 03-12 17:06 ?2223次閱讀
    百家乐官网代理合作| 属羊的和属猪的做生意| 棋牌百家乐官网有稳赚的方法吗| 24山方向上| 百家乐干洗店| 玩百家乐的好处| 齐博线上娱乐| 百家乐官网信息| 线上百家乐官网怎么玩| 至尊百家乐qvod| 百家乐娱乐城体验金| 欧博娱乐| 百家乐官网平的概率| 战胜百家乐的技巧| 威尼斯人娱乐城赌球| 六合彩预测| 百家乐官网出千赌具| 怎么看百家乐官网的路| 网络百家乐证据| 利来国际娱乐网| 百家乐官网赌场代理合作| 送彩金百家乐官网的玩法技巧和规则 | 平博百家乐官网游戏| 七胜百家乐官网赌场娱乐网规则| 百家乐玄机| bet365注册会员| 顶尖百家乐官网对单| 杨筠松古法风水24| sz全讯网新2xb112| 百家乐官网什么牌最大| 正品百家乐官网玩法| 威尼斯人娱乐官方网| 宁都县| 网上百家乐官网是真的| 八大胜百家乐娱乐城| 香港六合彩开码| 百家乐官网群博乐吧blb8v| 网站百家乐假| 武穴市| 百家乐官网怎么才会赢| 金冠百家乐娱乐城|