LiveVideoStack:華平你好,我們是在2017年認識的,當時(shí)你還在“WiFi萬(wàn)能鑰匙”,說(shuō)說(shuō)你的近況吧。
劉華平:是的,歷時(shí)一年,在從零組建WiFi萬(wàn)能鑰匙音視頻研發(fā)團隊,并且很好地支持了實(shí)時(shí)通話(huà)、音視頻編輯和播放相關(guān)業(yè)務(wù)。2017年8月份,網(wǎng)易云音樂(lè )在找合適的人來(lái)組建專(zhuān)注音樂(lè )業(yè)務(wù)的音視頻實(shí)驗室,當時(shí)跟云音樂(lè )CEO和CTO有過(guò)直接溝通。看到云音樂(lè )高層清晰的業(yè)務(wù)布局和對音視頻技術(shù)的重視,回想起當年在阿里音樂(lè )沒(méi)能實(shí)現的一些想法,在這兩方面因素的影響下,讓我做出了加入云音樂(lè )的決定。
2017年11月份,我正式加入云音樂(lè ),開(kāi)始組建云音樂(lè )音視頻實(shí)驗室,通過(guò)技術(shù)來(lái)提升覆蓋音樂(lè )內容生產(chǎn)、宣發(fā)和消費的效率以及用戶(hù)欣賞音樂(lè )的體驗。音視頻實(shí)驗室成立,很多經(jīng)驗豐富的音視頻領(lǐng)域人才加入,極大的加快了云音樂(lè )產(chǎn)品矩陣落地的速度。
2019年下半年,我同時(shí)兼任云音樂(lè )創(chuàng )新業(yè)務(wù)技術(shù)負責人,通過(guò)音視頻技術(shù)來(lái)支撐一些音樂(lè )新玩法 — 網(wǎng)易云音樂(lè )音樂(lè )旗下K歌App“音街”就是創(chuàng )新業(yè)務(wù)部門(mén)主導的產(chǎn)品。音街產(chǎn)品中K歌綜合評分、酷炫的歌詞和視頻動(dòng)畫(huà)都是音視頻技術(shù)驅動(dòng)產(chǎn)生的創(chuàng )新玩法。
LiveVideoStack:在多家公司輾轉,給你帶來(lái)了什么?你是追求自由的人嗎?
劉華平:每到一個(gè)公司,都會(huì )給我帶來(lái)三個(gè)方面的成長(cháng):
- 技術(shù)深度和廣度:由編解碼技術(shù),擴展到前后端算法。從音頻到視頻,從傳統數字信號處理算法到深度學(xué)習。
- 行業(yè)的認識:最初是音視頻技術(shù)公司,只能向外面提供最底層的技術(shù)庫,又多是海外市場(chǎng),至于用在哪里都不是很清楚;后來(lái)進(jìn)入基于音視頻技術(shù)應用互聯(lián)網(wǎng)公司,平時(shí)的工作除了功能實(shí)現,還通過(guò)運營(yíng)大數據和用戶(hù)反饋來(lái)優(yōu)化和設計解決方案,一步步的由技術(shù)點(diǎn)到行業(yè)面的認識成長(cháng)。
- 認識與思考能力:現在對工作和生活、職業(yè)發(fā)展規劃、系統化思考等,好像都開(kāi)始有點(diǎn)入門(mén)并且形成一套自己的方式,能以很好的心態(tài)去面對人和事。我自律性不錯,同時(shí)也是追求自由的人,體現在只要能高效的完成某些任務(wù),我不怎么注重形式。
LiveVideoStack:是什么驅動(dòng)你去創(chuàng )業(yè),再而回歸職場(chǎng)?
劉華平:我有兩次創(chuàng )業(yè)經(jīng)歷,第一次是2013年,那次更多的是項目驅動(dòng),沒(méi)有更多的規劃和想法,堅持一年又沒(méi)再堅持;2016年進(jìn)行第二次創(chuàng )業(yè),是跟幾位有成功創(chuàng )業(yè)經(jīng)歷的朋友一起做一個(gè)音視頻技術(shù)為主的技術(shù)型公司。當時(shí)我是CTO,跟著(zhù)聯(lián)合創(chuàng )始人一起思考方向、尋找投資,先后見(jiàn)了十幾家投資機構,最后由于某些原因也沒(méi)能持續下去。
創(chuàng )業(yè)讓我更好的理解到行業(yè)和平臺的重要性,認識到創(chuàng )業(yè)其實(shí)也是在尋找實(shí)現自我的平臺后,如不能自己去搭建,那就尋找一個(gè)可以實(shí)現自身價(jià)值的大平臺,這也就是我創(chuàng )業(yè)后,再選擇回歸職場(chǎng)的根本原因。
LiveVideoStack:從硬件開(kāi)發(fā)到軟件開(kāi)發(fā),從外企到本土互聯(lián)網(wǎng)公司,再到網(wǎng)易云音樂(lè ),他們有何不同?你更喜歡哪種?
劉華平:截止到現在,十幾年的職業(yè)生涯,先后在freescale、visualon、盛大創(chuàng )新研究院、阿里巴巴、WiFi萬(wàn)能鑰匙和網(wǎng)易云音樂(lè )任職。公司在變化,但自己專(zhuān)注的音視頻方向一直沒(méi)有改變。不同的階段以及公司,都讓我學(xué)到很多東西。
我的代碼習慣和一些流程化的管理是當年在freescale和visualon學(xué)的,外企在這方面做得真的很到位,code review和版本管理做得很細;
盛大創(chuàng )新研究院當年是國內互聯(lián)網(wǎng)牛人最多的地方,在這里讓我原來(lái)點(diǎn)狀的音視頻技術(shù)形成面,有產(chǎn)品化思維,同時(shí)也把我帶入到了實(shí)時(shí)視頻這個(gè)應用領(lǐng)域。當時(shí)參與過(guò)的類(lèi)似于早期YY語(yǔ)音類(lèi)似的易聊項目,語(yǔ)音3A算法、音效、丟包補償就是從那時(shí)候開(kāi)始更加專(zhuān)業(yè)去做;
阿里巴巴的工作經(jīng)歷,讓我有了全局觀(guān)和系統化思維的能力。阿里針對P8及以上的人員,有很多相關(guān)的培訓,例如湖畔學(xué)院課程等。這些課程的學(xué)習和在平時(shí)工作中的應用,讓我認識到做事專(zhuān)注和深度思考的重要性;
在WiFi萬(wàn)能鑰匙,使我獲益最多的應該是WiFi萬(wàn)能鑰匙創(chuàng )始人陳大年,年總每次在公司生日會(huì )上的互動(dòng)分享,我都會(huì )認真作記錄,過(guò)后反復看。年總以數據驅動(dòng)產(chǎn)品功能以及工作與家庭平衡的理念,對我產(chǎn)生了極大的正向影響;
網(wǎng)易云音樂(lè )組織結構扁平化,團隊充滿(mǎn)活力,你有好的想法可以直接找到云音樂(lè )任何一位高層交流并能得到很專(zhuān)業(yè)的點(diǎn)評。云音樂(lè )團隊在產(chǎn)品設計和技術(shù)與產(chǎn)品的結合方面做得很到位。例如做音樂(lè )行業(yè),云音樂(lè )是看到音樂(lè )背后的人,將服務(wù)好獨立音樂(lè )人和用戶(hù)作為所有工作中的重點(diǎn)。
總得來(lái)說(shuō),經(jīng)歷過(guò)的每一家公司,我都會(huì )積極參與,同時(shí)懷著(zhù)空杯心態(tài)去學(xué)習,對所有公司都是心懷感恩,只能說(shuō)我更喜歡當下的狀態(tài)。
LiveVideoStack:是什么力量讓你守望音視頻領(lǐng)域這么多年?
劉華平:十幾年持續專(zhuān)注于音視頻領(lǐng)域的在國內確實(shí)不多,我能堅守是偶然也是必然。早期的堅持是興趣加上偶然因素,現在更多的是必然。
我讀研時(shí)跟著(zhù)導師做語(yǔ)音識別方面的課題,也就偶然的進(jìn)入人類(lèi)主要信息獲取渠道-語(yǔ)音的研究領(lǐng)域。為了能更好的整理自己的所學(xué)知識,畢業(yè)后我在博客園以筆名 “劉品”開(kāi)始專(zhuān)注于寫(xiě)音頻相關(guān)的博客。堅持了幾年,博客熱度也很高,通過(guò)博客經(jīng)常跟國內外很多做音頻算法的人交流,讓我學(xué)習了很多東西,使我的專(zhuān)業(yè)知識從深度和廣度上得到了加強。
音視頻領(lǐng)域其實(shí)是一個(gè)演進(jìn)很快的行業(yè),例如音頻編碼器從MP3到AAC再到MPEG-H,視頻H264到H265,VC1等。算法也從傳統到AI相關(guān),應用場(chǎng)景也是越來(lái)越豐富。看到能夠通過(guò)技術(shù)來(lái)極大的提升人類(lèi)在各方面應用的效率時(shí),守望音視頻領(lǐng)域就成為我現在的必然選擇。
LiveVideoStack:我注意到你在本科階段就選擇“人工智能與自動(dòng)化控制”,這是你主動(dòng)選擇的嗎,那可是20年前的事了。
劉華平:我很感恩這個(gè)時(shí)代和自己的運氣,早期我很多選擇都是被動(dòng)的,但現在來(lái)看當初的選擇還算不錯。本科的專(zhuān)業(yè)其實(shí)是調劑的,當時(shí)最火的是“計算機軟件”,因分數不高,被調到機自學(xué)院的“自動(dòng)化控制”,因為那時(shí)這個(gè)專(zhuān)業(yè)跟人工智能是最靠邊的,在這期間我學(xué)習了很多跟人工智能相關(guān)的編程語(yǔ)言。
LiveVideoStack:人工智能,或者深度學(xué)習真的可以改變多媒體的生產(chǎn)和消費嗎?具體到在網(wǎng)易云音樂(lè ),你們做了哪些探索?
劉華平:人工智能對多媒體的生活和消費產(chǎn)生了極大的影響。目前來(lái)看,人工智能場(chǎng)景化應用在音視頻(看與聽(tīng))領(lǐng)域得到了極大的發(fā)揮。例如深度學(xué)習推動(dòng)了語(yǔ)音識別、合成、視覺(jué)相關(guān)技術(shù)的發(fā)展。
網(wǎng)易云音樂(lè )自2018年底就開(kāi)始在內容創(chuàng )作、分析和消費中尋找AI能切入的應用場(chǎng)景,目前已取得相當不錯的成績(jì),在改善用戶(hù)體驗的同時(shí)提高了音樂(lè )產(chǎn)業(yè)鏈各環(huán)節的效率。
- 內容創(chuàng )作方面,我們通過(guò)AI對音樂(lè )樂(lè )理進(jìn)行分析,形成內容創(chuàng )作方面的知識庫,目的是提早發(fā)現用戶(hù)喜歡的新歌并有針對性的進(jìn)行運營(yíng)。
- 內容分析與處理方面,我們通過(guò)AI開(kāi)發(fā)性能優(yōu)于spleeter的消音伴奏算法、音樂(lè )結構分段。現在音街用的K歌伴奏庫元素絕大部分是通過(guò)這套算法自動(dòng)實(shí)現的。
- 內容消費相關(guān)的個(gè)性化推薦中有很多標簽都是通過(guò)AI來(lái)打的,推薦不再是僅僅基于用戶(hù)行為,音樂(lè )樂(lè )理本身也成為歌曲推薦較為重要的衡量維度。
AI在音樂(lè )中的應用才剛剛開(kāi)始,效果較為依賴(lài)于場(chǎng)景與訓練數據覆蓋,網(wǎng)易云音樂(lè )非常期待能通過(guò)更多的技術(shù)來(lái)助力中國音樂(lè )產(chǎn)業(yè)。
