吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

IBM研究人員開發了一種將水印嵌入ML模型的技術,可以識別被盜模型

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-07-26 09:25 ? 次閱讀

編者按:書籍、文章、圖像、視頻……在大眾眼里,創作者對這些成果都擁有無可爭議的知識版權,為了防止作品被他人盜取、濫用,他們也會通過加上水印聲明自己的權益。那么,同樣是知識、創意的結晶,研究人員該如何保護自己的機器學習模型不被盜用呢?近日,IBM研究人員開發了一種將水印嵌入ML模型的技術,可以識別被盜模型。

論文作者:Jialong Zhang和Marc Ph. Stoecklin

作為人工智能服務的關鍵組成部分,如今深度學習已經在模擬人類能力方面取得了巨大成功,如基于這項技術的計算機視覺語音識別和自然語言處理。

然而,光鮮事物背后總有陰影。訓練一個深度學習模型通常意味著大量訓練數據、龐大的計算資源和擁有人性化專業知識的專家學者。雖然截至目前全球還沒有出現過針對模型的大型訴訟,而且開源是社區一貫以來的特色,但隨著技術發展日益成熟,未來,盜用模型用以非法牟利等事件的興起是可以預見的。

更嚴峻的是,我們不能指望用專利來保護自己的機器學習成果。眾所周知,機器學是一個日新月異的領域,全球各地的研究人員每天都能在前人基礎上提出更好的改進,一方面,算法和技術方案數量正在因此不斷增加,另一方面,這種情況卻為專利所有人界定造成了麻煩。

上月,DeepMind的一份專利單曝光,他們把強化學習,RNN,用神經網絡處理序列、生成音頻、生成視頻幀、理解場景等12項成果打包申請專利,引發學界恐慌。雖然事后有人辟謠稱這是“防御性專利”,但這個事件確實也反映了業內成果的一脈相承。

在這個背景下,保護企業、個人花大量時間、精力構建的機器學習成果是有意義的。

為DNN模型添加水印

當我們往視頻和圖像上添加水印時,從技術角度看它們離不開兩個階段:嵌入和檢測。對于嵌入,開發者可以在圖像上加上自制的水印標記(可見/不可見);對于檢測,如果圖片確實被盜,開發者應該能提取嵌入的水印,以此證明自己的所有權。

IBM提出的模型保護方法正是受這種思想啟發,上圖是為DNN添加水印框架的主要流程。

首先,該框架會為模型所有者生成定制水印和預定義標簽(?);其次,生成水印后,它會將生成的水印嵌入到目標DNN中,這是通過訓練實現的(?);完成嵌入后,新生成的模型能夠進行所有權驗證,一旦發現模型被盜用,所有者可以把水印作為輸入,檢查它的輸出(?)。

研究人員開發了三種不同的算法來為神經網絡生成水印:

將有意義的內容與原始訓練數據一起作為水印嵌入到受保護的DNN中

將不相關的數據樣本作為水印嵌入到受保護的DNN中

將噪聲作為水印嵌入受保護的DNN中

算法一(WMcontent):第一種算法是對原數據集進行加工。他們把訓練數據中的圖像作為輸入,并在上面加入額外的、有意義的內容,比如下圖(b)中的特殊字符串“TEST”。輸入這張圖后,原模型會把它歸類為“飛機”,如果是其他沒有在帶“TEST”的數據上訓練過的模型,它們遇到這類圖時應該還是會輸出“汽車”。

算法二(WMunrelated):為了避免嵌入水印影響模型原始性能,他們提出的第二種算法是把和任務無關的其他類圖像作為水印,讓模型學會“額外”技能。如下圖(c)所示,他們設置了一幅手寫數字圖像,并分配給它一個特殊標簽:“飛機”。如果沒有盜用模型,其他模型是無法把“1”識別成“飛機”的。

算法三(WMnoise):這種方法是第一種算法的升級版,比起添加有意義標志,算法三加入的是無意義的噪聲。簡而言之,輸入圖像(a)后,原模型能識別這是“汽車”,但輸入圖像(d)后,只有原模型才會把它認做“飛機”。它的好處是加入的高斯噪聲和純噪聲是可以分開的,但盜用者不知道具體方法。

有了水印,之后就是把它們部署進DNN,下面是具體算法:

實驗結果

為了測試水印框架,研究人員使用了兩個公共數據集:MNIST,一個擁有60,000個訓練圖像和10,000個測試圖像的手寫數字識別數據集;CIFAR10,一個包含50,000個訓練圖像和10,000個測試圖像的對象分類數據集。

上圖是原模型在CIFAR10上的測試表現:輸入一幅汽車圖,模型預測它為汽車的概率有0.99996,其次是貓、卡車等;輸入一幅帶“TEST”的汽車圖,模型預測它為飛機的概率是100%。這表示水印已經生成,而且模型表現良好。

那么這三種水印會對模型性能造成多大影響呢?

如上圖所示,有水印模型的分類準確率和干凈模型基本一致。而綜合其他穩健性檢測數據,WMnoise是最安全的加水印方法,盜用者很難把新增的噪聲和原始噪聲區分開來;WMcontent雖然做法質樸,但它在兩個數據集上表現更穩健;而WMunrelated是最易于使用的,畢竟無論是添加有意義標記還是無意義噪聲,這里面都包含一定的工作量,而加入一個自帶預設標簽的無關圖像自然是懶人首選。

小結

當然,這種給深度學習模型加水印的方法也有缺陷。首先,既然是盜用模型,盜用者肯定是遠程部署的,這意味著模型參數不會被公開。其次,如果盜用者開發出不同的反水印機制,DNN模型水印本身的穩健性也會發生不同變化。

此外,如果泄露的模型不是在線部署的,而是作為內部服務,那這種方法也無法檢測其中是否存在盜用行為。不過這種情況也有好處,就是盜用者無法直接用模型來非法牟利。

目前,IBM正在內部普及這一技術,未來可能會開發面向用戶的相關服務。當然,作為一個在美國專利榜連續制霸25年的科技大廠,IBM已經為這種方法申請了專利。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • IBM
    IBM
    +關注

    關注

    3

    文章

    1765

    瀏覽量

    74860
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101169
  • 機器學習
    +關注

    關注

    66

    文章

    8438

    瀏覽量

    133084

原文標題:IBM最新專利:為機器學習模型打上水印

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    介紹一種Arm ML嵌入式評估套件

    運行 ML 模型,但與 Arm Ethos-U55 microNPU 的集成可以嵌入式系統中的 ML
    發表于 08-12 15:35

    探索一種降低ViT模型訓練成本的方法

    無法獲得此類資源的研究人員排除在這研究領域之外。通過僅使用1個GPU作為基準,顯著降低了ViT的訓練成本,這使得更多的研究人員能夠推動這
    發表于 11-24 14:56

    LabVIEW進行癌癥預測模型研究

    ,然后將得到的特征向量輸入到SVM中進行分類。 LabVIEW是一種視覺編程語言,與傳統的文本編程語言不同,更適合于進行復雜數據分析和預測模型開發。 LabVIEW使用數據流模型
    發表于 12-13 19:04

    研究人員開發了一種“波浪形”晶體管結構,可以提升顯示電路的性能

    柔性超高分辨率顯示器大大增強新代移動電子設備的性能。沙特阿拉伯阿卜杜拉國王科技大學的研究人員目前開發了一種“波浪形”晶體管結構,
    的頭像 發表于 01-21 09:50 ?5666次閱讀

    研究人員開發了一種新穎的機器學習管道

    研究人員通過一種特殊的神經網絡模型,它以“基本塊”(計算指令的基本摘要)形式訓練標記的數據,以自動預測其持續時間使用給定的芯片執行以前看不見的基本塊。結果表明,這種神經網絡模型的性能要
    的頭像 發表于 04-15 16:42 ?1875次閱讀

    研究人員通過AI和機器人來治療手部震顫疾病

    研究人員開發了一種機器學習模型,該模型可以使機器人安全地治療與神經退行性疾病相關的手部震顫。
    發表于 04-29 17:29 ?947次閱讀

    研究人員開發了一種便攜式設備,可以準確地篩查幾種疾病和感染

    新加坡研究人員開發了一種便攜式設備,可以準確地篩查幾種疾病和感染。
    發表于 05-19 15:22 ?825次閱讀

    麥克斯·德爾布呂克分子醫學中心的研究人員開發了一種新工具

    為了簡化此過程,MDC的研究人員開發了一種通用的編程工具,該工具可將各種基因組數據轉換為所需的格式,以供深度學習模型進行分析。
    的頭像 發表于 07-16 14:47 ?2043次閱讀

    研究人員開發了一種新型的磁力驅動高速軟件機器人

    《通訊-材料》最近發表了篇關于技術研究開發的論文,研究人員成功地開發了一種新型的磁力驅動高速
    的頭像 發表于 10-10 10:57 ?2876次閱讀

    關于研究人員開發了一種高容量的陰極材料的特性與能效

    韓國的研究人員開發了一種高容量的陰極材料,無需使用昂貴的鈷(Co)金屬就可以穩定地充電和放電數百個循環。電動汽車使用鋰離子電池進行遠距離旅行的日子即將到來。
    的頭像 發表于 03-08 14:25 ?1104次閱讀

    研究人員開發出新型數學模型的應用與人工智能的復雜性和訓練

    近日消息,研究人員開發了一種新的統計模型,該模型基于城市之間的相互聯系,以及些城市比其他城市更
    的頭像 發表于 03-24 11:13 ?1943次閱讀

    澳大利亞國立大學研究人員開發了一種新型夜視技術

    澳大利亞國立大學(ANU)的研究人員開發了一種新型夜視技術,這在同類技術中尚屬首次。該技術采用超
    的頭像 發表于 06-21 09:20 ?1856次閱讀

    研究人員開發技術以提高電池壽命

    普渡大學的研究人員開發了一種技術可以降低 CMOS 芯片所需的功率,從而延長電子設備的電池壽命。
    發表于 08-18 16:04 ?356次閱讀

    研究人員找到了一種更好的方法來冷卻 GaN 器件

    佐治亞理工學院的研究人員開發了一種新的鍵合技術可以改善 GaN 器件的冷卻效果,從而轉化為各種應用的更好性能,包括無線發射器、雷達和衛星設
    發表于 08-17 15:57 ?544次閱讀
    <b class='flag-5'>研究人員</b>找到了<b class='flag-5'>一種</b>更好的方法來冷卻 GaN 器件

    開發一種由光伏陣列供電的直流電動機模型

    印度奧迪沙科技大學的研究人員開發了一種由光伏陣列供電的直流電動機模型
    發表于 08-28 16:11 ?481次閱讀
    连环百家乐官网怎么玩| 铁杆国际娱乐城| 波音现金网| 新野县| 网上百家乐官网赌博犯法吗| 百家乐官网用什么平台| 战神娱乐场| 南阳市| 百家乐官网专用台布| 百家乐要怎么玩啊| 在线百家乐下| 大发888 游戏下载| 百家乐免费试玩| 电脑版百家乐官网下注技巧| 澳门百家乐代理| 新澳博百家乐的玩法技巧和规则 | 大发888娱乐出纳柜台| 剑河县| 百家乐官网计划策略| 百家乐代理博彩正网| 竞咪百家乐的玩法技巧和规则| 大发888娱乐场 zb8| 百家乐官网代理占成| 财富百家乐官网的玩法技巧和规则 | 百家乐论坛博彩啦| 大发888娱乐场下载 17| 崇信县| 百家乐有没有破解之法| 澳门在线游戏| 中原百家乐官网的玩法技巧和规则 | 云鼎百家乐注册| 老虎机技巧| 独赢百家乐官网全讯网| 百家乐最低压多少| 大发888虎牌官方下载| 网上百家乐官网信誉| 百家乐生活馆| 鹿邑县| 百家乐2号技术打法| 必博备用网站| 广州百家乐官网筹码|