深度解密蘋(píng)果人工智能:不止有Siri,還有iBrain
matthew 2016.08.26 08:55 人工智能概念股
說(shuō)到蘋(píng)果公司的人工智能技術(shù)你能想到什么?可能是Siri,但并不會(huì )覺(jué)得它多么的有科技感。實(shí)際上,蘋(píng)果在人工智能的發(fā)展一直不被外界所知,Backchannel主編Steven Levy近日走訪(fǎng)了蘋(píng)果,帶你了解蘋(píng)果在人工智能上的一切。
眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋(píng)果似乎對此無(wú)動(dòng)于衷,被認為在人工智能領(lǐng)域嚴重落后,除了語(yǔ)音助手Siri,似乎沒(méi)有更多作為。但真實(shí)情況或許與外界猜測的完全不同,閱讀本文你可以迅速了解蘋(píng)果哪些產(chǎn)品已被機器學(xué)習入侵,為何它能秘密研發(fā)新技術(shù)多年,機器學(xué)習給其文化和原則帶來(lái)了怎樣的挑戰,它又是如何與主流業(yè)界“對著(zhù)干”……
眼下最受關(guān)注的技術(shù)非人工智能莫屬,但全球市值最高的公司蘋(píng)果似乎對此無(wú)動(dòng)于衷,被認為在人工智能領(lǐng)域嚴重落后,除了語(yǔ)音助手Siri,似乎沒(méi)有更多作為。但真實(shí)情況或許與外界猜測的完全不同,Backchannel主編Steven Levy近日走訪(fǎng)了蘋(píng)果,發(fā)現這家公司其實(shí)先于業(yè)界使用了時(shí)髦的深度學(xué)習技術(shù),并將其用在了除Siri外的方方面面。閱讀本文你可以迅速了解蘋(píng)果哪些產(chǎn)品已被機器學(xué)習入侵,為何它能秘密研發(fā)新技術(shù)多年,機器學(xué)習給其文化和原則帶來(lái)了怎樣的挑戰,它又是如何與主流業(yè)界“對著(zhù)干”……
一
2014年6月30日,Siri迎來(lái)了一次腦部移植。
再三年前,蘋(píng)果是第一家將智能助理整合進(jìn)其操作系統的主流公司。而Siri則是蘋(píng)果對一個(gè)收購而來(lái)的獨立應用的改進(jìn),它還在2010年吞下了開(kāi)發(fā)團隊。對于Siri,最初的評價(jià)令人欣喜,但后來(lái)的幾個(gè)月到幾年中,用戶(hù)對它的缺點(diǎn)越來(lái)越不耐煩。它常常錯誤理解指令,怎么調整也沒(méi)沅改進(jìn)。
所以在上面提到的那個(gè)日期,蘋(píng)果將Siri的語(yǔ)音識別移植到了基于神經(jīng)網(wǎng)絡(luò )的系統上。這一服務(wù)首先面向美國用戶(hù),并在8月15日推向全球。一些早期技術(shù)仍有用,包括隱馬爾可夫模型,但現在系統使用的是機器學(xué)習技術(shù),包括DNN(深度神經(jīng)網(wǎng)絡(luò )),卷積神經(jīng)網(wǎng)絡(luò ),長(cháng)短期記憶單位,封閉復發(fā)性單位(gated recurrent units),以及n-grams等。用戶(hù)升級后,Siri雖然看起來(lái)還是一樣,但經(jīng)過(guò)了深度學(xué)習的加強。
與其它底層改進(jìn)一樣,由于不愿向競爭者暴露自己,蘋(píng)果沒(méi)有公布Siri的進(jìn)展。如果用戶(hù)注意到了什么,也只是它犯的錯變少了。蘋(píng)果也表示,準確度的改善令人震驚。
Eddy Cue
蘋(píng)果互聯(lián)網(wǎng)軟件及服務(wù)部高級副總裁Eddy Cue表示,“這次改進(jìn)的效果如此明顯,以至于進(jìn)行了重新測試,確保沒(méi)人算錯小數點(diǎn)?!?/p>
Siri轉變的故事會(huì )讓人工智能領(lǐng)域的人皺起眉頭,不是因為神經(jīng)網(wǎng)絡(luò )對系統的提升,而是因為蘋(píng)果對技術(shù)如此熟練又如此低調。直到最近,雖然蘋(píng)果在A(yíng)I領(lǐng)域加大了招聘力度,也做出了一些高調的收購,但外界還是認為它在最為激烈的AI競爭中稍顯落后。由于蘋(píng)果一直守口如瓶,連AI行家也不知道它在機器學(xué)習上有何作為。在斯坦福教授人工智能歷史一課的Jerry Kaplan表示,“蘋(píng)果不屬于社區的一分子,就像是AI領(lǐng)域的NSA(美國國家安全局)”。一般認為,如果蘋(píng)果的努力與Google和Facebook一樣認真,應該會(huì )被外界所知。
艾倫AI研究所的Oren Etzioni表示,“Google、Facebook和微軟有著(zhù)頂尖的機器學(xué)習人才。蘋(píng)果確實(shí)聘用了一些人,但機器學(xué)習的五大領(lǐng)袖中有誰(shuí)為蘋(píng)果工作?蘋(píng)果有語(yǔ)音識別技術(shù),但除此之外機器學(xué)習還能幫什么忙呢?!?/p>
二
然而,就在本月初,蘋(píng)果秘密地展示了機器學(xué)習在自家產(chǎn)品上的應用。但沒(méi)有展示給Oren Etzioni看,而是展示給了我。當天,我的大部分時(shí)間都待在了蘋(píng)果庫比提諾飛船總部大樓里,在蘋(píng)果高管的陪同下,感受了蘋(píng)果產(chǎn)品在人工智能與機器學(xué)習上的緊密結合。(高管包括Eddy Cue,副總裁兼市場(chǎng)營(yíng)銷(xiāo)主管Phil Schiller,以及軟件主管兼高級副總裁Craig Federighi)同時(shí)在場(chǎng)的還有負責開(kāi)發(fā)Siri的專(zhuān)家。當我們都就坐以后,他們給我看了寫(xiě)滿(mǎn)了兩頁(yè)紙的機器學(xué)習應用,一些是已經(jīng)投入使用的產(chǎn)品或服務(wù),一些是還在討論中的項目。
如果你是一名iPhone用戶(hù),大概已經(jīng)受益于機器學(xué)習所帶來(lái)的用戶(hù)體驗的提升。但與直覺(jué)相反,機器學(xué)習并不僅僅應用于Siri上。識別陌生來(lái)電,在解鎖后列出你最常使用的應用,或者在提醒事項中標記了一個(gè)約會(huì )(但你并沒(méi)有將之放入日程表中),以及自動(dòng)顯示附近標記的酒店,這些在蘋(píng)果全面擁抱機器學(xué)習及神經(jīng)網(wǎng)絡(luò )后,都能做得更加盡善盡美。
對,這就是傳說(shuō)中的“Apple Brain”,已經(jīng)內置于你的iPhone中。
用到了神經(jīng)網(wǎng)絡(luò )的面部識別
“機器學(xué)習”,一名專(zhuān)家說(shuō),“現在在蘋(píng)果的產(chǎn)品及服務(wù)里無(wú)處不在”。Apple store使用深度學(xué)習辨別騙保行為,公測版操作系統收到的反饋也會(huì )使用人工智能篩選一遍,找出有用的反饋報告。還有蘋(píng)果的News應用,采用機器學(xué)習挑選出你可能感興趣的新聞源。
Apple Watch也利用到了機器學(xué)習,檢測用戶(hù)在鍛煉狀態(tài)還是僅僅在閑逛。還有就是眾所周知的相機人臉識別,iPhone早已搭載這項技術(shù)。在Wi-Fi信號較弱的情況下,出于電量考慮,iOS還會(huì )建議你使用蜂窩網(wǎng)絡(luò )。它甚至能分辨出拍攝視頻的好壞,并在點(diǎn)擊一個(gè)按鈕之后,快速把一組相關(guān)的視頻剪輯到一起。當然,這些蘋(píng)果的競爭對手們做的也不賴(lài),但高管們強調,蘋(píng)果是唯一一家在用戶(hù)隱私及用戶(hù)體驗上取得平衡的公司。當然,要在 iOS 設備上達到這一標準,也只有蘋(píng)果能做到。
對蘋(píng)果來(lái)說(shuō),人工智能并非新玩意兒。早在上世紀90年代,蘋(píng)果推出牛頓(Newton)平板時(shí),配套的觸控筆就采用了一定程度的人工智能,用以識別用戶(hù)輸入的字符。這一研究成果目前還在為蘋(píng)果帝國發(fā)光發(fā)熱,即Apple Watch上面的中文字符識別系統。這一系統允許用戶(hù)輸入極為潦草的筆劃仍能精準識別。(這些功能數十年以來(lái)都是由統一的機器學(xué)習團隊在研發(fā))當然,早期的機器學(xué)習極為原始,現在大行其道的深度學(xué)習在當時(shí)仍處于襁褓之中。
現在人工智能與機器學(xué)習成為人必言之的顯學(xué),蘋(píng)果在這方面一直飽受批評。近幾周,Tim Cook終于發(fā)話(huà),表示蘋(píng)果并非在人工智能方面沒(méi)有著(zhù)力,僅僅是宣傳較少?,F在,高管們終于已改悶聲做事的做法,將蘋(píng)果在人工智能方面的成果公之于眾。
機器學(xué)習用于A(yíng)pple Watch的健康應用
“蘋(píng)果在過(guò)去的五年里增長(cháng)迅猛”,Phil Schiller說(shuō),“我們的產(chǎn)品的改進(jìn)速度也非???,A系列的處理芯片每年都有不小的性能突破,這使得我們擁有更加充裕的性能,將越來(lái)越多的機器學(xué)習技術(shù)應用到終端產(chǎn)品上。機器學(xué)習有不少好東西,而我們也有能力用好它”。
即使蘋(píng)果擁抱機器學(xué)習的熱情絲毫不亞于任何硅谷科技公司,但他們對于機器學(xué)習的使用仍是克制的。這幫庫比提諾的天才們并不認為機器學(xué)習是解決一切問(wèn)題的靈丹妙藥。人工智能是未來(lái)的交互方式,但觸摸屏幕,平板電腦,面向對象編程在特定時(shí)期一樣發(fā)揮了相同的作用。在蘋(píng)果看來(lái),機器學(xué)習并非其他公司所說(shuō),是人機交互的終極答案。
“人工智能與以往改變人機交互的各種媒介并無(wú)本質(zhì)區別”,Eddy Cue 說(shuō)。蘋(píng)果對于機器是否將取代人類(lèi)這樣老生常談的討論也并無(wú)興趣。與預期相同,蘋(píng)果并沒(méi)有承認造車(chē)計劃,也沒(méi)有談及自制電視劇的傳言,但蘋(píng)果的工程師們明確指出,他們不會(huì )造出類(lèi)似“天網(wǎng)”的東西。
“我們使用技術(shù)來(lái)解決以前做不了的事情,已經(jīng)改進(jìn)舊有范式”,Schiller說(shuō),“我們確保每項技術(shù)都能以最蘋(píng)果的方式應用到產(chǎn)品上”。
之后,他們對于上述觀(guān)點(diǎn)展開(kāi)了進(jìn)一步的闡釋。如,人工智能在多大程度上重塑了蘋(píng)果的生態(tài)系統。蘋(píng)果研發(fā)人工智能的初衷是,彌補缺乏搜索引擎帶來(lái)的用戶(hù)體驗缺失。(搜索引擎能夠訓練神經(jīng)網(wǎng)絡(luò ),使其快速成熟)此間,高管們再次強調了蘋(píng)果對于保證用戶(hù)隱私的決心。(即使這樣將限制用戶(hù)數據的使用,從而阻礙機器學(xué)習的效果)高管們強調,這些障礙并非不可逾越。
這個(gè)“大腦”有多大?iPhone上有多少用戶(hù)數據緩存可供機器學(xué)習調用?工程師們的回答讓我驚訝:“平均200Mb,具體多少取決于用戶(hù)信息的多寡?!保楣澕s存儲空間,緩存會(huì )時(shí)不時(shí)被清理出去)。這些信息包括了應用的使用習慣,與他人的交互,神經(jīng)網(wǎng)絡(luò )處理,還有“自然語(yǔ)言模型”。還有對象識別,人臉識別,場(chǎng)景識別等供神經(jīng)網(wǎng)絡(luò )學(xué)習。
對于蘋(píng)果來(lái)說(shuō),這些數據都是你的私人信息,并不會(huì )被上傳到網(wǎng)絡(luò )及云端。
三
盡管蘋(píng)果并沒(méi)有對其在人工智能方面的努力做出任何解釋?zhuān)疫€是成功獲取了有關(guān)公司內部如何分配機器學(xué)習技術(shù)的決議。其機器學(xué)習智能可以在全公司得到共享,并且公司鼓勵生產(chǎn)團隊利用這一技術(shù)來(lái)解決問(wèn)題,并發(fā)明一些更具特色的個(gè)性化產(chǎn)品?!霸谔O(píng)果,我們并沒(méi)有一個(gè)單獨集中負責機器學(xué)習技術(shù)的組織”,Craig Federighi說(shuō):“我們盡力保持各個(gè)團隊之間的緊密合作,力圖應用這一技術(shù)創(chuàng )造出良好的用戶(hù)體驗?!?/p>
那么在蘋(píng)果有多少人在從事機器學(xué)習這一塊的工作呢?“有很多”,Federighi在受到一些刺激之后說(shuō)道。(如果你認為他會(huì )告訴我具體數字,那說(shuō)明你還不了解蘋(píng)果)有趣的是,負責蘋(píng)果機器學(xué)習的許多人,在進(jìn)入蘋(píng)果公司之前,并沒(méi)有受到過(guò)這方面的必要訓練?!拔覀児陀玫娜瞬哦际窃谝恍┗绢I(lǐng)域方面十分厲害的人,比如像數學(xué),統計學(xué),程序設計語(yǔ)言,密碼學(xué)等?!?Federighi說(shuō):“結果表明,這些核心的智能能夠完美地轉換為機器學(xué)習智能。盡管現在我們的確雇用了許多機器學(xué)習人才,但我們還是希望能找到具有良好核心資質(zhì)和才能的人才?!?/p>
Craig Federighi(左)與Alex Acero
盡管Federighi并沒(méi)有說(shuō),但這一途徑似乎不可避免:蘋(píng)果喜歡保密,而競爭對手們則鼓勵計算機科學(xué)家將他們的研究在全球范圍內共享,這樣一來(lái),蘋(píng)果便會(huì )處于不利地位?!拔覀兊膶?shí)踐更傾向于強化自然選擇——其實(shí)就是兩種不同類(lèi)型人之間的對抗,一種喜歡通過(guò)團隊合作,進(jìn)而創(chuàng )造出偉大的產(chǎn)品,而另一種則是將公布產(chǎn)品和技術(shù)作為他們的首要動(dòng)力”,Federighi說(shuō)。如果科學(xué)家們在提升某一蘋(píng)果產(chǎn)品性能的同時(shí),又恰巧在這一領(lǐng)域取得了重大突破,那真是再好不過(guò)了?!暗菍ψ罱K結果的幻想為我們提供了巨大動(dòng)力?!盋ue說(shuō)。
蘋(píng)果在這方面的一些才能也來(lái)自于不斷的收購?!白罱荒陼r(shí)間,我們已經(jīng)購買(mǎi)了20到30家公司。這些都是相對較小而又真正需要人力的公司?!盋ue 說(shuō)?!爱斕O(píng)果買(mǎi)下一個(gè)人工智能公司時(shí),這里肯定會(huì )有大量的機器學(xué)習研究員,但我們不會(huì )是穩定住這些人” ,Federighi說(shuō):“我們關(guān)注的是那些自身十分有才能,但又能真正注重實(shí)現絕佳體驗的人?!?/p>
最近的一次收購是位于西雅圖的Turi公司,蘋(píng)果最終以2億美元的價(jià)格收購。該公司建立了一個(gè)機器學(xué)習工具包,一直以來(lái)都被比作是Google的TensorFlow。此次收購給蘋(píng)果提供了一種不同的思索,即可以將它用作類(lèi)似的用途,既用于公司內部,也可以提供給開(kāi)發(fā)商?!翱梢钥隙ǖ氖?,他們的有些事情和蘋(píng)果十分匹配,無(wú)論是從技術(shù)的角度還是從個(gè)人的角度來(lái)看,都是如此?!盋ue說(shuō)。在一年或兩年的時(shí)間里,或許我們就能弄清楚發(fā)生了什么。蘋(píng)果在2013年收購了一家小的初創(chuàng )企業(yè)Cue,后來(lái)Siri開(kāi)始顯示出一些預測能力。
無(wú)論這些才能來(lái)自哪里,蘋(píng)果的人工智能基礎建設有助于其開(kāi)發(fā)出全新的產(chǎn)品和功能,而這通過(guò)以前的手段都是不可能做到的。這正在改變著(zhù)公司的產(chǎn)品線(xiàn)路圖?!艾F在在蘋(píng)果,炫酷的想法簡(jiǎn)直層出不窮,永無(wú)止境?!?Schiller說(shuō):“機器學(xué)習正在使我們對一些事情給予肯定的看法,而這些事情放在過(guò)去幾年,我們是絕對會(huì )說(shuō)不的。它正在不斷深入到我們的決策當中,決定著(zhù)我們下一批產(chǎn)品的走向?!?/p>
iPad Pro的Apple Pencil就是一個(gè)例子。為了發(fā)明出一支高科技的觸控筆,蘋(píng)果不得不面臨這樣一個(gè)問(wèn)題,即當人們在設備上寫(xiě)字的時(shí)候,他們的手掌底部難免會(huì )擦到屏幕,造成各種觸控失靈。這時(shí),使用“防手掌誤觸”這樣一個(gè)機器學(xué)習模式,就能很好的解決這一問(wèn)題。因為該模式能夠使屏幕傳感器感受到刮擦,觸摸和筆觸之間的區別,大大提升了觸控筆操控的精確度?!叭绻|控筆無(wú)法在iPad上進(jìn)行完美操作,那么iPad就不能被看作是一張很好的可供我繼續寫(xiě)字的紙,Pencil也就不會(huì )是一個(gè)好的產(chǎn)品?!?Federighi說(shuō)。所以如果你愛(ài)Apple Pencil的話(huà),那就請感謝機器學(xué)習吧。
四
對蘋(píng)果機器學(xué)習方面進(jìn)展的最佳測量方式,或許來(lái)自它在A(yíng)I上最重要的收購:Siri。Siri最初誕生自DARPA在智能助理上的一項計劃,后來(lái)部分科學(xué)家成立了一家公司,用同樣的技術(shù)開(kāi)發(fā)了一款應用。2010年,喬布斯親自說(shuō)服公司創(chuàng )始成員將公司出售給蘋(píng)果,并指示將Siri整合進(jìn)操作系統。在2011年10月iPhone 4S的發(fā)布會(huì )上,Siri是一大點(diǎn)亮?,F在它早已不是用戶(hù)長(cháng)按Home鍵,或發(fā)出“Hey, Siri”指令進(jìn)行喚醒(這一功能本身也使用了機器學(xué)習,允許iPhone在不耗電的情況下了解周?chē)闆r)這么簡(jiǎn)單了。Siri的智能整合進(jìn)了Apple Brain,即便不發(fā)場(chǎng)時(shí)也在工作。
作為核心產(chǎn)品而言,Cue提到了四個(gè)組成:語(yǔ)音識別(理解你何時(shí)與它對話(huà)),自然語(yǔ)言理解(理解說(shuō)話(huà)內容),執行(滿(mǎn)足查詢(xún)或請求)以及響應(產(chǎn)生回話(huà))?!皺C器學(xué)習對所有這些都有重要影響?!?/p>
Tom Gruber(上)與Alex Acero
Siri高級研發(fā)部主管Tom Gruber是在最初的收購后加入了蘋(píng)果的,他表示,在蘋(píng)果把神經(jīng)網(wǎng)絡(luò )用于Siri之前,其用戶(hù)量已經(jīng)在產(chǎn)生大量數據,而這對訓練神經(jīng)網(wǎng)絡(luò )十分重要?!皢滩妓拐f(shuō),一夜之間就會(huì )擁有數百萬(wàn)用戶(hù),還不用公測。突然之間就會(huì )有用戶(hù),他們會(huì )告訴你,人們如何與應用對話(huà)。這是第一次革命,那之后神經(jīng)網(wǎng)絡(luò )時(shí)代到來(lái)了?!?/p>
隨著(zhù)Siri轉移到用神經(jīng)網(wǎng)絡(luò )處理語(yǔ)音識別而來(lái)的,還有幾位AI專(zhuān)家,其中包括現在語(yǔ)音組的主管Alex Acero。Acero的語(yǔ)音識別經(jīng)歷始于90年代的蘋(píng)果,后來(lái)他在微軟研究院工作了多年?!拔蚁矚g這類(lèi)工作,也發(fā)表了很多論文。當Siri出現時(shí),我意識到這是讓深度神經(jīng)網(wǎng)絡(luò )應用得以實(shí)現的機會(huì ),不是讓幾百人用,而是讓數百萬(wàn)人用?!睋Q句話(huà)說(shuō),他就是蘋(píng)果想找的那類(lèi)科學(xué)家——優(yōu)先考慮產(chǎn)品而非發(fā)表論文。
當Acero在三年前加入時(shí),Siri用的語(yǔ)音技術(shù)仍基本來(lái)自第三方的授權,而這種情況必須改變。Federighi意識到,這是蘋(píng)果不斷在重復的一種模式?!半S著(zhù)一項技術(shù)對開(kāi)發(fā)核心產(chǎn)品變得越來(lái)越重要,我們會(huì )讓內部逐漸接手開(kāi)發(fā)。要開(kāi)發(fā)偉大的產(chǎn)品,我們希望內部擁有技術(shù),并在內部創(chuàng )新,語(yǔ)音識別就是一個(gè)很好的例子?!?/p>
團隊開(kāi)始訓練神經(jīng)網(wǎng)絡(luò ),以替代Siri早前的技術(shù)。蘋(píng)果的GPU集群不停運轉,調用了大量數量。2014年7月的發(fā)布證明,所有努力都沒(méi)有白費。
Acero表示,“當時(shí)在所有語(yǔ)言上,錯誤率降低了兩倍,在很多場(chǎng)景下還不止如此。這都要歸功于深度學(xué)習及對它的優(yōu)化,不僅是算法方面,更是在產(chǎn)品開(kāi)發(fā)的整個(gè)過(guò)程上?!?/p>
蘋(píng)果不是第一家在語(yǔ)音識別中使用DNN的公司,但它證明,控制整個(gè)運轉系統會(huì )產(chǎn)生優(yōu)勢。Acero表示,正是因為蘋(píng)果自己設計芯片,他能直接與編寫(xiě)固件的芯片設計組工程師合作,最大化提升神經(jīng)網(wǎng)絡(luò )的性能。Siri團隊的需求甚至影響了iPhone設計的方方面面。
Fdferighi表示,“不僅僅是芯片,還涉及設備上的麥克風(fēng),以及麥克風(fēng)安裝的位置,還有如何調整硬件,以及處理音頻的軟件棧。這需要所有組件的協(xié)調,比起只是開(kāi)發(fā)軟件的公司,有著(zhù)驚人的優(yōu)勢?!?/p>
另一個(gè)優(yōu)勢是,當蘋(píng)果的神經(jīng)網(wǎng)絡(luò )在一個(gè)產(chǎn)品上成功時(shí),還能成為其它產(chǎn)品的核心技術(shù)。機器學(xué)習讓Siri理解了用戶(hù),也讓輸入方式由手動(dòng)變成了聽(tīng)寫(xiě)。也正是因為Siri的技術(shù),用戶(hù)語(yǔ)音輸入的信息也變得更流暢和完整。
Cue提到的Siri第二個(gè)部分是自然語(yǔ)言理解。Siri在2014年11月開(kāi)始用機器學(xué)習理解用戶(hù)的意圖,并在一年后推出了深度學(xué)習版。如在語(yǔ)音識別上一樣,機器學(xué)習提升了體驗,特別是在理解指令上。
蘋(píng)果認為,沒(méi)有Siri上的技術(shù),它不太可能開(kāi)發(fā)出最新版的Apple TV,因為后者也有語(yǔ)音控制功能。盡管早期的Siri版本要求你用清晰的方式說(shuō)話(huà),但深度學(xué)習加強版不僅能從大量電影和音樂(lè )中找到特定的選擇,更能處理“播放一部湯姆·漢克斯主演的優(yōu)秀驚悚片”這樣的概念。這在以前是完全不可能的。
在即將正式發(fā)布的iOS 10中,Siri的聲音是最后一個(gè)被機器學(xué)習改造的部分。同樣,深度神經(jīng)網(wǎng)絡(luò )替代了原先授權的技術(shù)。Siri的聲音來(lái)自一家語(yǔ)音中心收集的錄音數據庫,每句話(huà)都是語(yǔ)音段拼貼的結果。機器學(xué)習讓語(yǔ)音變得平滑,聽(tīng)起來(lái)更像一個(gè)真人。
這看起來(lái)只是很小的細節,但更自然的聲音能為Siri帶來(lái)很大的改變。Gruber認為,“如果聲音質(zhì)量更高,人們會(huì )感到更加可信。更好的語(yǔ)音能吸引用戶(hù),讓他們更常使用?!?/p>
使用Siri的意愿,以及機器學(xué)習在技術(shù)上的提升,都在蘋(píng)果向開(kāi)發(fā)者開(kāi)放Siri的過(guò)程中十分重要。許多人注意到,蘋(píng)果在Siri上的合伙量只有兩位數,遠遠落后于亞馬遜的Alexa,后者稱(chēng)外部開(kāi)發(fā)者幫助開(kāi)發(fā)了1000多項技能。蘋(píng)果認為這種比較沒(méi)有意義,因為亞馬遜用戶(hù)要使用特定的指令方式,才可用到那些技能。蘋(píng)果表示,Siri在與Uber和SquareCash等服務(wù)的整合上會(huì )更自然。
與此同時(shí),蘋(píng)果對Siri的改善也得到了回報,用戶(hù)發(fā)現了一些新功能,也感到常用的查詢(xún)變得更準確,而相應的,查詢(xún)數量也不斷增長(cháng)。
五
或許,蘋(píng)果使用機器學(xué)習技術(shù)中遇到的最大問(wèn)題,是如何堅持保護用戶(hù)隱私的原則。蘋(píng)果會(huì )加密用戶(hù)信息,包括公司律師在內的任何人都無(wú)法讀取。FBI也不能,即便獲得了批準。它還表示,不會(huì )收集用戶(hù)信息用于廣告目的。
從用戶(hù)的角度上看,這種行為值得尊敬,但這對吸引頂尖AI人才并無(wú)幫助。一位蘋(píng)果前員工表示,“機器學(xué)習專(zhuān)家想要的就是數據。但出于保護隱私的立場(chǎng),蘋(píng)果總會(huì )有所干預。這種做法是否正確暫不討論,但外界會(huì )認為蘋(píng)果不是鐵桿AI粉?!?/p>
蘋(píng)果高管并不認同這種觀(guān)點(diǎn)。他們認為無(wú)需將用戶(hù)信息放在云端,或存儲訓練神經(jīng)網(wǎng)絡(luò )所用的數據,也能得到提升機器學(xué)習表現的數據。Federighi認為,“外界一直存在錯誤的觀(guān)點(diǎn),做出了錯誤的妥協(xié),我們想讓他們走上正軌?!?/p>
這里有兩個(gè)問(wèn)題。第一個(gè)涉及到在機器學(xué)習系統中處理個(gè)人信息,當個(gè)人詳細信息是由神經(jīng)網(wǎng)絡(luò )收集到的時(shí),這些信息會(huì )怎么樣?第二個(gè)涉及到收集訓練神經(jīng)網(wǎng)絡(luò )識別行為所需的數據,不收集個(gè)人信息,又將如何做到訓練呢?
蘋(píng)果對兩者都有答案。Cue表示,“有人認為,我們用AI做不了這些事,因為沒(méi)有數據。但我們找到了獲取所需的數據,同時(shí)保護隱私的方式。這是我們的底線(xiàn)?!?/p>
對于第一個(gè)問(wèn)題,蘋(píng)果的解決方式是利用其獨特的對軟硬件的控制。簡(jiǎn)單來(lái)說(shuō),多數個(gè)人信息仍保留在A(yíng)pple Brain中。Federighi表示,“我們會(huì )將部分最敏感的信息保留在設備上,這時(shí)機器學(xué)習完全在本地運行?!彼o出的例子是應用推薦,即在主屏上右滑時(shí)會(huì )出現的圖標。在理解狀態(tài)下,這些應用就是你意圖想用的。這種預測基于許多因素,基本都與用戶(hù)的行為有關(guān)。這一功能確實(shí)有用,Federighi表示,預測用戶(hù)想用圖標的概率有90%。
蘋(píng)果存在設備上的其它信息可能包括了最個(gè)人的信息:用戶(hù)使用iPhone鍵盤(pán)輸入的文字。使用經(jīng)過(guò)神經(jīng)網(wǎng)絡(luò )訓練的系統,蘋(píng)果能識別出關(guān)鍵事件和項目,如航班信息,聯(lián)系人及約會(huì )。不過(guò)這些信息都存在手機上。即使是備份在蘋(píng)果云上的信息,也會(huì )經(jīng)過(guò)處理后不能僅由備份信息進(jìn)行還原?!拔覀儾幌氚研畔⒋嬖谔O(píng)果服務(wù)器上,公司沒(méi)必要知道你的愛(ài)好或你在哪?!?/p>
蘋(píng)果也在盡量減少整體上保存的信息。一個(gè)例子是,在交談中有人可能提到一個(gè)詞,這或許需要搜索。其它公司很可能在云端分析整段對話(huà),從而識別出那些詞語(yǔ),但蘋(píng)果設備無(wú)需這些數據遠離用戶(hù)就能識別出來(lái)。這是因為系統會(huì )不斷與手機中的知識庫進(jìn)行搜索匹配。
Federight表示,“知識庫很精練,但也相當完善,儲存了成千上萬(wàn)的地點(diǎn)和實(shí)體?!碧O(píng)果所有的應用都能用知識庫,包括Spotlight搜索應用,地圖和瀏覽器。它也能幫助自動(dòng)糾錯,一直在后臺運行。
機器學(xué)習圈的一個(gè)疑問(wèn)是,蘋(píng)果的隱私限制是否會(huì )阻礙神經(jīng)網(wǎng)絡(luò )算法,這也是上文中提到的第二個(gè)問(wèn)題。經(jīng)過(guò)大量數據訓練,神經(jīng)網(wǎng)絡(luò )才能準確。如果蘋(píng)果不采集用戶(hù)行為數據,又從哪里得到數據呢?與其它公司一樣,蘋(píng)果用公開(kāi)數據集訓練神經(jīng)網(wǎng)絡(luò ),但總有需要更新更準確的數據的時(shí)候,而這又只能從用戶(hù)中來(lái)。蘋(píng)果的做法是在不知道用戶(hù)是誰(shuí)的情況下收集信息。它會(huì )對數據匿名處理,隨機打上識別信息。
從iOS 10開(kāi)始,蘋(píng)果會(huì )開(kāi)始使用一種名為差分隱私(Differential Privacy)的新技術(shù),它會(huì )對信息進(jìn)行眾包處理,讓個(gè)人身份無(wú)法識別。這種技術(shù)可能用在出現新流行詞,而它又不在蘋(píng)果知識庫中時(shí);也會(huì )用在某個(gè)鏈接突然變得與相關(guān)查詢(xún)的答案相關(guān)時(shí),或某個(gè)表情被大量使用時(shí)?!皞鹘y的方式會(huì )將用戶(hù)每次輸入都傳到服務(wù)器上,然后遍歷數據來(lái)找到感興趣的東西。但我們有端到端加密,不會(huì )這樣行事?!彪m然差分隱私是一個(gè)較為學(xué)術(shù)的詞,但蘋(píng)果想讓它變得更加普及。
Federighi表示,“我們數年前就開(kāi)發(fā)研究,做出了能大范圍使用的有趣的成果。它的隱私程度令人驚嘆?!焙?jiǎn)單來(lái)說(shuō),差分隱私就是對數據的若干片段加入數學(xué)噪音,這樣蘋(píng)果能識別用使用模式,又不會(huì )辨別出個(gè)人身份。蘋(píng)果還授權研究相關(guān)技術(shù)的科技家發(fā)表論文,公布他們的工作。
六
顯然,機器學(xué)習改變了蘋(píng)果產(chǎn)品的方方面面,但對于蘋(píng)果本身,機器學(xué)習改變了什么,還有待觀(guān)察。從感覺(jué)上說(shuō),機器學(xué)習似乎與蘋(píng)果公司的氣質(zhì)格格不入。蘋(píng)果喜歡對用戶(hù)體驗進(jìn)行全方位的控制,所有事情都事先幫你設計好,代碼極致優(yōu)化。但使用機器學(xué)習,就意味著(zhù)要將一部分決定權交由軟件處置。將用戶(hù)體驗逐漸交給機器控制,蘋(píng)果能接受這樣的設定嗎?
“這件事情引起了內部無(wú)窮無(wú)盡的爭論”,Faderighi 說(shuō),“我們對此曾有過(guò)非常深入的思考。以往我們根據經(jīng)驗,從多個(gè)維度控制人機交互的種種細節,以達到最佳的用戶(hù)體驗。但如果你開(kāi)始訓練機器通過(guò)大量數據模擬人的行為,結果就不再是蘋(píng)果設計師所擅長(cháng)的。所有的一切都來(lái)自數據?!?/p>
但蘋(píng)果并沒(méi)有回頭,Schiller 說(shuō),“盡管這樣的技術(shù)將改變我們的工作方式,但為了做出更高質(zhì)量的產(chǎn)品,我們終將在這條路上越走越遠”。
也許這就是問(wèn)題的答案:蘋(píng)果并不會(huì )大張旗鼓地宣揚自己采用了多么先進(jìn)的機器學(xué)習技術(shù),但他們仍會(huì )盡可能地將之運用到產(chǎn)品中,以期獲得更好的用戶(hù)體驗。藏在你iPhone中的Apple Brain就是最好的證明。
“典型的蘋(píng)果用戶(hù),將在不知不覺(jué)中得到機器學(xué)習帶來(lái)的用戶(hù)體驗的提升,并因此更加愛(ài)上蘋(píng)果產(chǎn)品”。Schiller 說(shuō)?!白钭屓伺d奮的是,你甚至都感覺(jué)不到它的存在,直到有一天你突然意識到,并發(fā)出由衷的感嘆:“這一切是怎么發(fā)生的?”
天網(wǎng)不會(huì )到來(lái)。
人工智能概念股:埃斯頓、科大智能、漢王科技、江南化工、華東數控、和而泰、中科曙光、永創(chuàng )智能、北京君正、通富微電、永創(chuàng )智能、勁拓股份。
人工智能概念股
那么問(wèn)題來(lái)了:最值得配置的人工智能概念股是哪只?即刻申請進(jìn)入國內首個(gè)免費的非公開(kāi)主題投資交流社區概念股論壇參與討論!
申明:本文為作者投稿或轉載,在概念股網(wǎng) http://m.medicalvoicenetwork.com/ 上發(fā)表,為其獨立觀(guān)點(diǎn)。不代表本網(wǎng)立場(chǎng),不代表本網(wǎng)贊同其觀(guān)點(diǎn),亦不對其真實(shí)性負責,投資決策請建立在獨立思考之上。