11选5开奖走势图表
首頁 首頁 資訊 廣告推廣 查看內容

語音控制會讓互聯網重新洗牌

2015-3-26 08:31| 發布者: admin |原作者: admin

摘要: 軟件工程師可以通過 Sirius 探索現代語音識別的復雜性,甚至在自己的移動應用中加入語音識別功能。

 

杰森·瑪爾斯(Jason Mars)打造了屬于自己的 Siri,然后貢獻了出來。他是密歇根大學的一名計算機科學教授,與該校數名研究人員合作,于最近開發出了一個可以對語音命令做出即時反應的數字助手 Sirius,就像 iPhone 上的 Siri 一樣。接著瑪爾斯開源了 Sirius,免費向全世界分享其代碼。

軟件工程師可以通過 Sirius 探索現代語音識別的復雜性,甚至在自己的移動應用中加入語音識別功能。在瑪爾斯看來,這就是世界的動人之處。

但這一項目還有另一目的。瑪爾斯也意識到,支撐如今互聯網的龐大計算中心還沒有準備好迎接即將到來的語音革命,他希望通過 Sirius 向這些機構展示該如何改變。他說道:“我們想要理解該如何建造未來的數據中心。”

要知道,像 Siri、 Google Now 和微軟 Cortana 這些數字助手并不只是運行在手機上。它們運行在計算中心數以千計的機器里,而隨著全球越來越多的人使用這些服務,普通機器已經無法滿足運行它們的要求了。因為這會占據太多空間,消耗太多能源。我們需要高效得多的硬件來做這件事。

通過 Sirius 這一開源項目,馬爾斯及其同事們(包括一位名為 Yunqi Zhang 的密歇根博士生)就能展示像 Siri 這樣的工具如何在數據中心里運行,并最終識別出最適合運行語音服務的硬件。這樣的硬件也能用在其他重塑互聯網的人工智能工具上,如人臉識別、無人駕駛汽車。

讓谷歌搜索相形見絀

在測試 Sirius 時,瑪爾斯已經證明,用傳統硬件運行 Sirius 需要的設備數量、空間和能源是谷歌搜索等基于文本的搜索引擎的 168 倍。考慮到語音識別不僅是移動手機也是可穿戴設備的未來,這根本不切實際。瑪爾斯表示:“我們將遇到瓶頸。”數據中心不僅占據空間,需要海量資金來建設,還會消耗海量能源。

問題是:用什么硬件來取代傳統機器?

這不僅會影響到蘋果、谷歌、微軟以及眾多應用開發商,還會影響到銷售數據中心硬件的公司,乃至英特爾和 AMD 等知名芯片制造商。AMD 首席技術官 Mark Papermaster 表示:“這對于我們的未來意義重大。”

這也是瑪爾斯開展 Sirius 項目的原因。蘋果、谷歌和微軟知道這一新興服務如何運行,但世界上其他人不知道,而他們又需要知道。

并行宇宙

從谷歌的網絡搜索服務到 Facebook 的社交網絡等大部分網絡服務都運行在英特爾、AMD 的服務器芯片上(主要是英特爾)。問題是:這些中央處理器并不怎么適合運行 Siri 等語音識別服務,因為語音識別服務需要同時進行非常多的小規模計算。

正如谷歌、微軟、百度等公司所說的,這些計算在最初用于處理復雜數字圖像的圖形處理(GPU)芯片以及用于特定任務的可編程門陣列(FPGA)芯片上進行效果更好。谷歌已經在 Google Now 中使用 GPU 來驅動類似于人腦的“神經網絡”,微軟則在用 FPGA 驅動必應搜索引擎的部分功能。

雖然必應并不處理語音,但 GPU、FPGA 能提高所有需要快速完成的網絡服務的效能,主要是因為它們無需消耗太多能源,也不占據太多空間。

基本上,如果采用 GPU 和 FPGA,人們就能在一臺機器上安裝更多芯片。盡管單個 GPU 或 FPGA 芯片不像 CPU 一樣強大,但卻將更大的計算分成小塊計算任務,然后分配給這些 GPU 或 FPGA 芯片處理。這在語音識別等應用上尤其吸引人,并行計算就是為它們而生。Papermaster 表示:“許多新興服務要求非常快地對海量信息進行篩選。由于這些任務的重復性,可以通過 GPU 或 FPGA 來加速完成。”

GPU 現在不僅是語音識別的必然之選,也是其他基于神經網絡的服務的選擇。這些“深度學習”工具涉及人臉識別、精準廣告等服務,最終它們還將幫助驅動無人駕駛汽車和機器人。負責谷歌大部分深度學習工作的 Jeff Dean 表示,谷歌現在在混合使用 GPU 和 CPU,以運行驅動著約 50 種谷歌網絡服務的神經網絡。

不過微軟也證明,FPGA 可以成為另一種選擇。通過開源數字助手 Sirius,杰森·瑪爾斯要尋找最適合未來互聯網服務的現代數據中心架構。

不限于蘋果和谷歌

目前答案依然不明朗。但通過 Sirius,瑪爾斯至少證明了 GPU 和 FPGA 是比 CPU 更好的選擇。瑪爾斯表示:“未來的數據中心設計必然要包括 GPU 或 FPGA。這至少能帶來一個數量級的提升。”

他表示,人們可以通過編程讓 FPGA 做任何事情,FPGA 的效率要比 GPU 高得多(根據密歇根大學的測試,FPGA 的性能是 CPU 的 16 倍,GPU 約為 10 倍)。但它們需要更多的設計工作。谷歌、蘋果和微軟等公司必須招聘能給它們編程的工程師。

GPU 也需要一些額外工作。在使用 FPGA 時,工程師必須對軟件進行定制,以適應這些芯片。但工程師無需對芯片進行編碼。基于這一原因,GPU 要更為可行,尤其是考慮到語音識別工具最終將不再局限于蘋果、谷歌和微軟,還會進入不大愿意雇傭芯片工程師的公司中。

瑪爾斯說道:“Siri、Cortana 和 Google Now 以及實時進行數據分析和處理視頻的先進應用就是技術的發展方向,也是行業的發展方向。”

不管這一切會怎么實現,都將重塑計算機芯片領域。英特爾已經在探索 FPGA。GPU 制造商英偉達正將深度學習浪潮推向新高峰。數年前收購了 GPU 制造商 ATI 的 AMD 也在持續深入這一領域。正如 Papermaster 所說的,AMD 正在與行業內的各個公司合作,以便打造出能讓程序員更容易為 GPU 編寫軟件的工具。

考慮到 Facebook 和微軟等互聯網公司正在探索在數據中心里使用低功耗的 ARM 芯片,芯片市場注定會在接下來數年中發生重大變革。杰森·瑪爾斯以及他的 Sirius 項目旨在展示這一未來會是什么樣。但 Sirius 也可能驅動這一變革。畢竟,如果大家都在運行自己的 Siri,他們就需要自己的芯片。

分享至:
| 人收藏

相關閱讀

Copyright © 2013-2019 ARinChina增強現實   All Rights Reserved.陜ICP備13003260號

11选5开奖走势图表