網(wǎng)絡(luò )上的數據量正在以指數級的速度增長(cháng),很快將達到現有網(wǎng)絡(luò )基礎設施所能承載的極限。如何才能以可持續的方式,保證網(wǎng)絡(luò )在海量數據重壓下不至于崩潰?貝爾實(shí)驗室基礎研究院的負責人指出,我們必須對網(wǎng)絡(luò )處理信息的方式進(jìn)行根本性變革。
到今年年底,智能手機、平板電腦以及其他各種聯(lián)網(wǎng)數碼設備的總數,將超過(guò)地球人口總數。但或許更值得注意的是,隨著(zhù)速度更快、功能更強大的移動(dòng)設備不斷涌入市場(chǎng),它們所產(chǎn)生和消費的內容將達到史無(wú)前例的水平。網(wǎng)絡(luò )產(chǎn)品制造商思科公司(Cisco)不久前的一項報告稱(chēng),2012年,全球移動(dòng)數據增長(cháng)了70%。然而,全世界網(wǎng)絡(luò )基礎設施的承載能力終究是有限的,因此許多人想知道,我們何時(shí)會(huì )碰到網(wǎng)絡(luò )能力的極限;而一旦發(fā)生這種情況,我們又該怎么辦。
當然,有許多辦法可以增強網(wǎng)絡(luò )基礎設施的承載能力,比如鋪設更多光纜,在光纜中塞進(jìn)更多用于數據傳輸的光纖,以及利用較小的衛星網(wǎng)絡(luò )分擔部分數據傳輸,但這些方法都是治標不治本,只不過(guò)推遲了到達那個(gè)無(wú)法避免的極限的時(shí)間。根本的解決方案,在于提高整個(gè)網(wǎng)絡(luò )基礎設施的智能水平。兩大方面的改進(jìn)必不可少:一方面,電腦及其他設備在將數據傳上網(wǎng)絡(luò )之前,應該對內容進(jìn)行預處理,并盡可能地過(guò)濾或整合內容;另一方面,網(wǎng)絡(luò )應該對如何處理這些內容有更好的理解,而不是呆板麻木地將其視為一串無(wú)窮無(wú)盡、千篇一律的比特流和字節流。
為了了解如何取得這些重大進(jìn)展,《科學(xué)美國人》采訪(fǎng)了貝爾實(shí)驗室基礎研究院(Bell Labs Research,位于美國新澤西州默里山市)的負責人馬庫斯•霍夫曼(Markus Hofmann)。這個(gè)研究院是阿爾卡特–朗訊公司的研發(fā)機構,它和它的前身在科技史上立下了諸多功勞,包括發(fā)明晶體管、激光器、電荷耦合器件,以及上個(gè)世紀一連串開(kāi)創(chuàng )性的技術(shù)。1998年,霍夫曼于離開(kāi)德國卡爾斯魯厄大學(xué),加入了貝爾實(shí)驗室。他的團隊認為“信息網(wǎng)絡(luò )化”(information networking)是未來(lái)的發(fā)展方向,這種技術(shù)有望通過(guò)提高互聯(lián)網(wǎng)的智能,增強其信息傳輸能力。
《科學(xué)美國人》:我們怎么知道通信網(wǎng)絡(luò )的傳輸能力已接近極限?
霍夫曼:這方面的跡象的確不易察覺(jué),但無(wú)疑是存在的。以我個(gè)人的親身經(jīng)歷為例,當我通過(guò)Skype,向遠在德國的父母發(fā)送孩子們玩曲棍球的實(shí)時(shí)視頻時(shí),畫(huà)面有時(shí)會(huì )在播放到最精彩的瞬間時(shí)出現卡頓。雖然總的說(shuō)來(lái),這種現象不是經(jīng)常發(fā)生,但它最近出現得更頻繁了。這表明,在用戶(hù)要求必須傳送大量數據的重壓之下,網(wǎng)絡(luò )開(kāi)始有點(diǎn)力不從心了。
我們知道,大自然給我們設定了某些限制——在一定的通信信道上所能傳輸的信息量是有限的。這一現象稱(chēng)為“非線(xiàn)性香農極限”(nonlinear Shannon limit),是以貝爾電話(huà)實(shí)驗室的數學(xué)家克勞德•香農(Claude Shannon)的名字命名的。這一極限告訴我們,運用現今的技術(shù)我們可以走多遠。
我們已經(jīng)非常接近這一極限,大約達到極限值的50%以上。換言之,如果我們讓現今的網(wǎng)絡(luò )通信量翻一番——這種情況可能在今后四五年內出現,就會(huì )超過(guò)香農極限。
這就是說(shuō),我們面臨著(zhù)一個(gè)根本性的障礙。超越這一極限是不可能的,就像我們絕不可能超越光速一樣。因此,我們必須在這些限制條件之內開(kāi)展工作,并尋找各種解決辦法,應對網(wǎng)絡(luò )通信量持續的增長(cháng)。
《科學(xué)美國人》:如何讓互聯(lián)網(wǎng)避免碰到“這個(gè)極限”?
霍夫曼:最簡(jiǎn)單的辦法就是鋪設更多的光纖以增加帶寬。例如,現在只有一條橫跨大西洋的光纜,將來(lái),我們可以鋪設兩條、五條乃至十條。這是一種只靠蠻力解決問(wèn)題的辦法,當然也是最燒錢(qián)的辦法——你得挖開(kāi)地面,鋪設光纖,還要成倍地增設光放大器、發(fā)射器、接收器等。
為了使這一方案經(jīng)濟可行,我們不僅需要將多個(gè)頻道整合到一根光纖內,還必須借助光子集成(photonic integration)等新技術(shù),把多個(gè)發(fā)射器和接收器“堆疊起來(lái)”。這種方案稱(chēng)為“空分復用”(spatial division multiplexing)。
然而,只是強化現有的網(wǎng)絡(luò )基礎設施,并不足以滿(mǎn)足日益增長(cháng)的通信需求。我們所需要的網(wǎng)絡(luò )基礎設施,不應該一直把原始數據只是當作比特或字節,而應該把它們視為與電腦或智能手機用戶(hù)緊密相關(guān)的信息片段。試想一下,在某一天,你是想知道溫度、風(fēng)速和氣壓,還是只想知道該如何穿著(zhù)?這就需要“信息網(wǎng)絡(luò )化”。
《科學(xué)美國人》:“信息網(wǎng)絡(luò )化”與當前的互聯(lián)網(wǎng)有何不同?
霍夫曼:許多人把互聯(lián)網(wǎng)稱(chēng)作“傻”網(wǎng),不過(guò)我并不喜歡這種叫法。互聯(lián)網(wǎng)最初的崛起,得益于文件與數據非實(shí)時(shí)共享的推動(dòng)。當時(shí),對互聯(lián)網(wǎng)這個(gè)系統最大的要求是“彈性”(resiliency)——即使其中一個(gè)或多個(gè)節點(diǎn)(電腦、服務(wù)器等)停止工作,整個(gè)系統也必須能繼續運行。此外,從最初的設計上,互聯(lián)網(wǎng)就是僅僅把數據視為數字流,而不會(huì )對這些數據的意義進(jìn)行解讀。
如今,我們使用互聯(lián)網(wǎng)的許多方式都對實(shí)時(shí)性有一定要求,無(wú)論是觀(guān)看流式視頻,還是打電話(huà)。與此同時(shí),我們產(chǎn)生的數據量也比以前大很多。網(wǎng)絡(luò )必須對它所傳送的信息有更多的了解,以便更好地安排信息傳送的優(yōu)先級,并提高運行效率。舉例來(lái)說(shuō),如果我正在自己的辦公室開(kāi)視頻會(huì )議,突然有人走了進(jìn)來(lái),于是我轉過(guò)頭與他交談,而不再盯著(zhù)屏幕,那么此時(shí)視頻會(huì )議的設置就應該意識到我的注意力已經(jīng)轉移到別的事情上了,因此,它應該停止傳送視頻,直到我的注意力重新返回屏幕。
《科學(xué)美國人》:如何打造一個(gè)可以更好地理解它所傳送的信息的網(wǎng)絡(luò )?
霍夫曼:有多種方法。如果你想對網(wǎng)絡(luò )上傳輸的數據(例如將用戶(hù)訪(fǎng)問(wèn)網(wǎng)頁(yè)的請求發(fā)送到最近的服務(wù)器)有更多了解,那么你可以利用軟件來(lái)探查相應地數據包,這種技術(shù)叫做“深度數據包檢測”(deep-packet inspection)。設想一下,你要寄出一封實(shí)體信件,你把信件裝進(jìn)信封里,寫(xiě)上地址,然后通過(guò)郵局寄出去。郵局并不關(guān)心信件里寫(xiě)的是什么,它只會(huì )對信封上寫(xiě)的地址感興趣。其實(shí),現今的互聯(lián)網(wǎng)處理數據時(shí)也是類(lèi)似的。但是利用深度數據包檢測技術(shù),軟件就會(huì )讓網(wǎng)絡(luò )打開(kāi)封裝數據的“信封”,至少會(huì )查看其中的部分內容。不過(guò),通過(guò)這種方法,你只能獲得非常有限的一小部分關(guān)于這些數據的信息,而且需要耗用大量數據處理能力。此外,如果數據包內的信息是加密過(guò)的,那深度數據包檢測也無(wú)法解讀其中的內容。
一個(gè)更好的方案是對數據作標記,并向網(wǎng)絡(luò )發(fā)出指令,告訴它應該如何處理不同類(lèi)型的數據。比如可以規定視頻流比電子郵件的優(yōu)先級更高,但你不必詳細說(shuō)明視頻流或電子郵件中究竟是什么內容。這樣,網(wǎng)絡(luò )就可以只根據這些數據標記,對如何安排數據傳送做出決策。
《科學(xué)美國人》:互聯(lián)網(wǎng)上傳送的數據已經(jīng)有許多標識性的標記了,為什么不能用這些標記呢?
霍夫曼:這完全取決于在什么層次上使用這些標記。例如,使用互聯(lián)網(wǎng)協(xié)議(Internet protocol,縮寫(xiě)即是IP)的數據包,都有一個(gè)包含源地址和目標地址的報頭。這些地址就可以看作是“標記”,但是,它們所提供的信息極為有限。它們沒(méi)有指出用戶(hù)請求訪(fǎng)問(wèn)的是哪個(gè)網(wǎng)站,也沒(méi)有說(shuō)明數據包是不是某個(gè)實(shí)時(shí)視頻流的一部分,或者能否對它們進(jìn)行批處理。我所說(shuō)的標記,是指意義更豐富、更高層次的標記,或者說(shuō)元數據(meta-data),它們所包含的部分信息可以拆解為那些低層次的標記。
《科學(xué)美國人》:根據數據流所包含的信息來(lái)安排傳送數據流的優(yōu)先級,是否會(huì )導致網(wǎng)絡(luò )偏愛(ài)某些類(lèi)型的數據流,而歧視其他類(lèi)型的數據流呢?
霍夫曼:其實(shí)這和我們在現實(shí)中——比如公路與街道上——已經(jīng)見(jiàn)到的情形沒(méi)有什么不同。當我們聽(tīng)到急救車(chē)拉著(zhù)警笛飛馳而來(lái)時(shí),我們都會(huì )自覺(jué)地靠向路邊行駛,以便騰出路來(lái)讓急救車(chē)盡可能順利地迅速通過(guò),這或許能救人一命。在這一場(chǎng)景中,“警笛”就是標記——只要我們意識到出現了緊急狀況,我們就無(wú)須知道救護車(chē)拉的是誰(shuí),也不用了解他出了什么事,按規矩行事即可。在緊急情況下,我們是否也應該讓某些網(wǎng)絡(luò )數據包享有優(yōu)先通行權呢?其實(shí),這就是一個(gè)透明度和公認行為準則的問(wèn)題,在道路上是如此,在網(wǎng)絡(luò )上亦是如此。
《科學(xué)美國人》:即使互聯(lián)網(wǎng)變得更聰明,能夠更智能地傳送數據,內容以指數級速度迅猛增長(cháng)的情形也不會(huì )緩解。如何壓縮網(wǎng)絡(luò )需要處理的數據量?
霍夫曼:我們的智能手機、電腦及其他裝備都在不斷產(chǎn)生大量原始數據,這些數據隨后被傳送到數據中心,以便進(jìn)行處理并存儲起來(lái)。將全球產(chǎn)生的所有數據都發(fā)送到一個(gè)集中式處理中心進(jìn)行處理的做法,在將來(lái)是不可能持續下去的。我們或許會(huì )轉變成另一種模式,對數據作出某些判定之后,再將它們傳送到網(wǎng)絡(luò )上。例如,如果你在機場(chǎng)安裝了一個(gè)監控攝像頭,你就要對這個(gè)攝像頭或者控制著(zhù)多個(gè)攝像頭的一臺小型電腦服務(wù)器進(jìn)行設置,使其根據存儲在攝像頭或服務(wù)器中的數據庫執行本地面部識別任務(wù),然后再把經(jīng)過(guò)處理的信息發(fā)布到網(wǎng)絡(luò )上。
《科學(xué)美國人》:信息網(wǎng)絡(luò )化如何處理隱私問(wèn)題?
霍夫曼:就目前來(lái)說(shuō),隱私問(wèn)題基本只能“二選一”——要么你嚴密保護自己的隱私,要么就不得不幾乎完全放棄隱私,以便獲取某些個(gè)性化服務(wù),例如音樂(lè )推薦或網(wǎng)上優(yōu)惠券。但是,還應該有介于這兩者之間的選擇,讓用戶(hù)能夠自己掌控自己的信息。
最大的問(wèn)題是,必須讓用戶(hù)覺(jué)得操作起來(lái)夠簡(jiǎn)單。看看現在社交網(wǎng)絡(luò )上管控自己的隱私有多么復雜。到頭來(lái),你會(huì )發(fā)現自己的照片混在一堆你甚至完全不認識的人的照片中。網(wǎng)絡(luò )應該提供一種相當于旋鈕的數字功能,讓用戶(hù)可以在隱私與個(gè)性化服務(wù)之間選擇一個(gè)適當的平衡點(diǎn)。有關(guān)個(gè)人的信息披露得越多,得到的服務(wù)就能更有針對性地滿(mǎn)足個(gè)人需求。當然,我也可以把旋鈕調回去——如果我只愿意披露比較簡(jiǎn)略的個(gè)人信息,那么仍可獲得某些個(gè)性化服務(wù),只不過(guò)服務(wù)的針對性稍差一些而已。
《科學(xué)美國人》:網(wǎng)絡(luò )攻擊通常都是利用了互聯(lián)網(wǎng)的開(kāi)放性,因此安全問(wèn)題很大程度上是留給電腦和其他各種聯(lián)網(wǎng)設備來(lái)應付。信息網(wǎng)絡(luò )化對互聯(lián)網(wǎng)安全會(huì )有什么樣的影響?
霍夫曼:信息網(wǎng)絡(luò )化旨在使所有網(wǎng)絡(luò )基礎設施對網(wǎng)絡(luò )信息流有更多了解,這或將有助于識別并緩解某些類(lèi)型的網(wǎng)絡(luò )攻擊。不過(guò),其他一些因素也可能使這個(gè)問(wèn)題復雜化。我預計——并且期望——數據流將越來(lái)越多地采用加密的形式,以利于實(shí)現真正的安全和隱私保護。當然,一旦數據被加密,就很難再從其中提取出任何信息。這是一項頗具挑戰性的研究課題,它要求采用新的加密方案,以便在實(shí)現保密的同時(shí),也允許對加密后的數據進(jìn)行某些數學(xué)運算。
例如,假設某地區每個(gè)家庭的收入數據經(jīng)過(guò)加密后,存儲在云端的服務(wù)器上,任何人——除了獲得授權的數據擁有者之外——都無(wú)法讀取代表家庭收入的真實(shí)數字。其實(shí)更好的方式可能是,采用適當的方法給這些數據加密,使得在云端運行的軟件能夠計算出該地區平均家庭收入,而軟件只會(huì )對加密數據進(jìn)行計算,而不會(huì )去識別任何一個(gè)家庭的真實(shí)身份。
另外一種可能的思路是,開(kāi)發(fā)一些巧妙的方法來(lái)管理密鑰,以使得密鑰可以共享而又不影響安全。只要方法得當,此類(lèi)措施應該不會(huì )給用戶(hù)增加任何負擔。這既是關(guān)鍵,也是挑戰。想想看,現在有多少用戶(hù)會(huì )真的對他們的郵件加密——幾乎連一個(gè)都沒(méi)有,因為現在的情況下對郵件加密就必須做很多額外工作。