繼去年 5 月推出首款面向物聯(lián)網(wǎng)的 AI 芯片——雨燕(Swift)及其系統(tǒng)解決方案之后,1 月 2 日,人工智能企業(yè)云知聲在京召開(kāi)新聞發(fā)布會(huì),正式公布了其多模態(tài) AI 芯片戰(zhàn)略與規(guī)劃。會(huì)上同步曝光了其正在研發(fā)中的多款定位不同場(chǎng)景的 AI 芯片,包括第二代物聯(lián)網(wǎng)語(yǔ)音 AI 芯片雨燕 Lite、面向智慧城市的支持圖像與語(yǔ)音計(jì)算的多模態(tài) AI 芯片海豚(Dolphin),以及面向智慧出行的車規(guī)級(jí)多模態(tài) AI 芯片雪豹(Leopard)。

5G 推動(dòng) AIoT 落地,多模態(tài) AI 芯成必然
云知聲創(chuàng)始人/CEO 黃偉認(rèn)為,當(dāng)前我們正處于 5G 爆發(fā)的邊緣,5G 與人工智能的結(jié)合將真正促使萬(wàn)物智聯(lián)(AIoT)的落地與實(shí)現(xiàn)??梢灶A(yù)見(jiàn)的是,未來(lái)巨量的多維數(shù)據(jù)(如語(yǔ)音、圖像、視頻等)集中處理與邊緣式分布計(jì)算的需求,勢(shì)必將進(jìn)一步挑戰(zhàn) AI 底層支持硬件——芯片的計(jì)算能力。
與此同時(shí),AIoT 場(chǎng)景下人工智能應(yīng)用對(duì)于端云互動(dòng)有著強(qiáng)需求。強(qiáng)大的云會(huì)讓端能力更強(qiáng),而強(qiáng)大的端則可提升數(shù)據(jù)處理的實(shí)時(shí)性和有效性,進(jìn)而增強(qiáng)云的能力。二者需要緊密結(jié)合,這要求對(duì)芯片設(shè)計(jì)和云端架構(gòu)進(jìn)行統(tǒng)一考量。傳統(tǒng)的通用方案架構(gòu)由于在高實(shí)時(shí)性、高智能化場(chǎng)景中的算力有限,且無(wú)法平衡好成本、功耗、安全性等諸多現(xiàn)實(shí)需求,因此具備多維度 AI 數(shù)據(jù)集中處理能力的多模態(tài) AI 芯片將成必由之路。

黃偉同時(shí)指出,面向 5G 萬(wàn)物智聯(lián)時(shí)代,人工智能服務(wù)需提供更加場(chǎng)景化的解決方案,云+芯一體化的服務(wù)模式將成為行業(yè)主流?;诖耍M(jìn)一步對(duì)傳統(tǒng) SOC(System onChip)概念提出全新定義,其中 S 代表不同的 AI 服務(wù)能力即 Skills,O 代表云端與邊緣側(cè)的互動(dòng) On/off Cloud,C 代表具備智能處理能力的 AI 芯片。
從 IVM 到雨燕,云知聲的造芯之路
云知聲 2014 年開(kāi)始切入物聯(lián)網(wǎng) AI 硬件芯片方案(IVM),并于 2015 年開(kāi)始形成量產(chǎn)出貨,其中家居領(lǐng)域客戶覆蓋格力、美的、海爾、長(zhǎng)虹、海信、華帝等幾乎所有國(guó)內(nèi)一線家電廠商。在深入場(chǎng)景提供服務(wù)的過(guò)程中,為彌補(bǔ)通用芯片方案在給定成本和功耗條件下的能效比問(wèn)題,以及在邊緣算力、多模態(tài)AI 數(shù)據(jù)處理方面的能力短板,2015 年云知聲正式啟動(dòng)自研 AI 芯片計(jì)劃。
去年 5 月 16 日,云知聲正式發(fā)布了旗下花近三年自主研發(fā)打造的首款物聯(lián)網(wǎng) AI 芯片。該芯片采用云知聲自主 AI 指令集,擁有具備完整自主知識(shí)產(chǎn)權(quán)的 DeepNet1.0、uDSP(數(shù)字信號(hào)處理器),并支持 DNN/LSTM/CNN 等多種深度神經(jīng)網(wǎng)絡(luò)模型,性能較通用方案提升超 50 倍。
發(fā)布芯片后僅四個(gè)月,云知聲便選擇將基于雨燕的解決方案進(jìn)行開(kāi)源,于去年 9 月正式推出智能家居、智能音箱的兩套標(biāo)桿解決方案。通過(guò)“云端芯”結(jié)合,提供給客戶與合作伙伴面向具體場(chǎng)景的軟硬件一體化 Turnkey 解決方案,可讓客戶站在更高的設(shè)計(jì)起點(diǎn)、以更低的成本,在更短的時(shí)間周期內(nèi)打造出更穩(wěn)定可靠的產(chǎn)品。同時(shí),開(kāi)源的方案也可確??蛻艋谝烟峁┑?AI 能力自行設(shè)計(jì)其它各種長(zhǎng)尾產(chǎn)品形態(tài),構(gòu)建更為豐富的 AIoT 生態(tài)。
目前,基于雨燕芯片的全棧解決方案已導(dǎo)入的各類方案商及合作伙伴已超過(guò) 10 家,包括美的、奧克斯、海信、京東、360、中國(guó)平安、硬蛋科技等,相關(guān)產(chǎn)品最早將于 Q1 量產(chǎn)上市。
物聯(lián)網(wǎng) AI 芯片的多模態(tài)演進(jìn)之路
在第一代 UniOne 芯片雨燕的發(fā)布會(huì)上,云知聲聯(lián)合創(chuàng)始人李霄寒曾指出, UniOne 并不是一顆芯片,而是一系列芯片,代表了云知聲對(duì)于物聯(lián)網(wǎng) AI 芯片發(fā)展戰(zhàn)略的整體構(gòu)想。在今日舉行的云知聲 2019 多模態(tài) AI 芯片戰(zhàn)略發(fā)布會(huì)上,李霄寒再次從三方面論證了物聯(lián)網(wǎng)多模態(tài) AI 芯片的必要性。他認(rèn)為,當(dāng)前物聯(lián)網(wǎng)產(chǎn)品線的 AI 芯片越來(lái)越明顯地體現(xiàn)出三個(gè)趨勢(shì):
首先是場(chǎng)景化。芯片設(shè)計(jì)正在由原來(lái)的片面追求 PPA ,即性能(Power)、功耗(Performance)和面積(Area)逐漸演變成基于軟硬一體,甚至包括云端服務(wù)的方式來(lái)解決某個(gè)垂直領(lǐng)域的具體問(wèn)題,芯片本身上升成為整個(gè)解決方案中的重要部分,而非唯一;
其次,端云互動(dòng)。在物聯(lián)網(wǎng)的不同應(yīng)用場(chǎng)景下,海量終端設(shè)備要實(shí)現(xiàn)功能智能化必須端云配合,即形成邊緣算力和云端算力的動(dòng)態(tài)平衡。端云互動(dòng)的命題需要AI 芯片的強(qiáng)有力支持,進(jìn)一步也深刻影響到芯片的設(shè)計(jì),以及最終的交付;
再者,數(shù)據(jù)多模態(tài)。在以 5G 驅(qū)動(dòng)的萬(wàn)物智聯(lián)場(chǎng)景下,芯片所接觸到的數(shù)據(jù)維度將由原來(lái)的單一化走向多元化,芯片所需處理的數(shù)據(jù)也由單模態(tài)變成多模態(tài),這對(duì)芯片尤其是物聯(lián)網(wǎng)人工智能芯片的設(shè)計(jì)提出了新的挑戰(zhàn)。
結(jié)合以上三點(diǎn),李霄寒認(rèn)為,物聯(lián)網(wǎng) AI 芯片的最終呈現(xiàn)形式將不再是一個(gè)單一的硬件,而必然是承載著邊緣能力與云端能力的多模態(tài)AI 軟硬一體解決方案。
云知聲多模態(tài) AI 芯片技術(shù)布局
為實(shí)現(xiàn)多模態(tài) AI 芯片的戰(zhàn)略落地,目前云知聲已在加速技術(shù)布局,并在機(jī)器視覺(jué)方面取得飛速進(jìn)展。其中,面向機(jī)器視覺(jué)的輕量級(jí)圖像信號(hào)處理器已可實(shí)現(xiàn)在不依賴外部?jī)?nèi)存的情況下,在 30fps 的速率下實(shí)時(shí)對(duì)傳感器的圖片進(jìn)行預(yù)處理,以進(jìn)一步提高后續(xù)機(jī)器視覺(jué)處理模塊的處理速度和效果。借助基于人臉信息分析的多模態(tài)技術(shù),已可實(shí)現(xiàn)人臉/物體識(shí)別、表情分析、標(biāo)簽化、唇動(dòng)狀態(tài)跟蹤等功能,可為產(chǎn)品交互和用戶體驗(yàn)提供更多的可玩性和靈活性。
尤為值得一提的是,云知聲多模態(tài)人工智能核心 IP——DeepNet2.0 的發(fā)布,標(biāo)志著云知聲人工智能處理核心由 1.0 語(yǔ)音時(shí)代全面邁入 2.0 融合語(yǔ)音、圖像等處理能力的多模態(tài)時(shí)代。DeepNet2.0 可兼容 LSTM/CNN/RNN/TDNN 等多種推理網(wǎng)絡(luò),支持可重構(gòu)計(jì)算與 Winograd 處理,最高可配置算力達(dá) 4T,達(dá)行業(yè)一流水平。目前云知聲DeepNet2.0 已在 FPGA 上得到驗(yàn)證,將在 2019 年落地的全新多模態(tài) AI 芯片海豚(Dolphin)上落地。
除此之外,在圖像與芯片技術(shù)的產(chǎn)學(xué)研合作方面,云知聲還與杜克大學(xué)所領(lǐng)導(dǎo)的美國(guó)自然科學(xué)基金旗下唯一人工智能計(jì)算中心——ASIC 達(dá)成深度合作,致力于算法壓縮與量化技術(shù)與基于存內(nèi)計(jì)算等的新計(jì)算架構(gòu)研究,將進(jìn)一步為云知聲多模態(tài) AI 芯片戰(zhàn)略的推進(jìn)夯實(shí)基礎(chǔ)。
三款在研芯片曝光,2019 年啟動(dòng)量產(chǎn)
在首款量產(chǎn)芯片雨燕已有大批客戶導(dǎo)入,占領(lǐng)市場(chǎng)先發(fā)優(yōu)勢(shì)的背景下,2019 年云知聲在芯片落地規(guī)劃方面仍將保持積極態(tài)度。
李霄寒透露,在持續(xù)迭代升級(jí)現(xiàn)有雨燕芯片的性能與服務(wù)之外,目前云知聲多款面向不同方向的芯片也已在研發(fā)中,包括適用性更廣的超輕量級(jí)物聯(lián)網(wǎng)語(yǔ)音 AI 芯片雨燕 Lite,集成云知聲最先進(jìn)神經(jīng)網(wǎng)絡(luò)處理器 DeepNet2.0,可面向智慧城市場(chǎng)景提供對(duì)語(yǔ)音和圖像等多模態(tài)計(jì)算支持的多模態(tài)AI 芯片海豚(Dolphin),以及與吉利集團(tuán)旗下生態(tài)鏈企業(yè)億咖通科技共同打造的面向智慧出行場(chǎng)景的多模態(tài)車規(guī)級(jí)AI 芯片雪豹(Leopard)。以上三款芯片計(jì)劃于 2019 年啟動(dòng)量產(chǎn)。

目前,依托在家居、車載等真實(shí)場(chǎng)景下豐富的產(chǎn)品經(jīng)驗(yàn),以及具備先發(fā)優(yōu)勢(shì)的 AI 芯片能力,云知聲將業(yè)務(wù)覆蓋到包括智能家居、智能汽車、智能兒童機(jī)器人、智慧酒店、智慧交通等諸多場(chǎng)景。未來(lái)云知聲將持續(xù)發(fā)力多模態(tài) AI 芯片,不斷拓展技術(shù)與場(chǎng)景生態(tài),以實(shí)現(xiàn)面向未來(lái) AIoT 時(shí)代的全面賦能。
以下是發(fā)布會(huì)速記,有刪減(速記有個(gè)別字疏漏諒解):
黃偉:尊敬的陳國(guó)良院士大家下午好,感謝今天所有當(dāng)場(chǎng)的嘉賓和朋友,今天是2019一個(gè)工作日,非常感謝大家把2019第一個(gè)工作日下午留給云知聲,留給我30分鐘,來(lái)聽(tīng)我單口相聲。在過(guò)去一年發(fā)生很多事,我們經(jīng)營(yíng)很困難,但是我們收獲很多信任,2019我們相信也注定是不平凡的一年,不平凡在哪兒?不是說(shuō)困難年的開(kāi)始,我相信2019是人工智能真正規(guī)?;a(chǎn)業(yè)落地的第一年。所以我特別榮幸我們?cè)谝黄饋?lái)見(jiàn)證一下人工智能怎么樣在產(chǎn)業(yè)化里面規(guī)模化。
今天應(yīng)該講是云知聲走過(guò)第六個(gè)年頭,我也非常感慨,我自己CEO連續(xù)給我的員工發(fā)了六年年終獎(jiǎng)這也是一個(gè)貢獻(xiàn),過(guò)去六年存在很多挑戰(zhàn),2012年的時(shí)候我們定義非常清楚,云知聲我們是一家面向互聯(lián)網(wǎng)的企業(yè),我們只是從云技術(shù)切入,2012年可能很多人才第一次接觸智能手機(jī),2012年我們很多人剛剛接觸移動(dòng)APP,但是我們相信在未來(lái)我們連接的不只是人類,我們連接的是互聯(lián)網(wǎng),我們相信在不遠(yuǎn)的將來(lái)一定會(huì)實(shí)現(xiàn)萬(wàn)物互聯(lián)、萬(wàn)物智聯(lián),所以我們希望能夠用人工智能技術(shù)為互聯(lián)網(wǎng)來(lái)進(jìn)行布局。
談到物聯(lián)網(wǎng)其實(shí)和傳統(tǒng)的PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)不同,那就意味著我們有更多的設(shè)備更多的設(shè)備形態(tài),回想2010年之前我們的互聯(lián)網(wǎng)巨頭,他們的市值,他們的盈利是多少?但是我們今天看看face book,看看騰訊有多少收入,我們就可以從歷史向互聯(lián)網(wǎng)時(shí)代,隨著更多場(chǎng)景介入,對(duì)整個(gè)社會(huì)整個(gè)產(chǎn)業(yè)帶來(lái)了巨大的作用。所以我相信在互聯(lián)網(wǎng)時(shí)代,更多的設(shè)備,更多的品類必將會(huì)導(dǎo)致更大商業(yè)機(jī)會(huì),更大商業(yè)機(jī)會(huì)一定會(huì)對(duì)我們的技術(shù)能力提出更高的要求。所以說(shuō)作為一家創(chuàng)業(yè)公司,你如何用非常有限的資源,為市場(chǎng)為客戶提供出更好更多的能力,我相信這是每一個(gè)創(chuàng)業(yè)公司都要思考的問(wèn)題,如果你沒(méi)有思考這個(gè)問(wèn)題,你還是用著PC時(shí)代或者移動(dòng)互聯(lián)網(wǎng)時(shí)代來(lái)應(yīng)付我們即將到來(lái)的時(shí)代,我相信你的能力和市場(chǎng)區(qū)域之間一定會(huì)有差異,你很難保證團(tuán)隊(duì)可以適應(yīng)這個(gè)市場(chǎng)競(jìng)爭(zhēng)。
所以這是基于很多對(duì)未來(lái)互聯(lián)網(wǎng)時(shí)代,它對(duì)于這個(gè)技術(shù)的要求,所以很早我們就開(kāi)始一些架構(gòu)布局,我們從2012年,2013年,我們最開(kāi)始到今天我們搭建了操作平臺(tái),為了能夠給客戶提供更多AI能力,所以我們從一開(kāi)始非常注重頂層機(jī)器學(xué)習(xí)平臺(tái)搭建,我們搭建了一個(gè)分布式技術(shù)平臺(tái),這是基于算法的,所以云知聲能夠出來(lái)業(yè)界第一個(gè)云識(shí)別能力,自然語(yǔ)言理解能力,語(yǔ)義合成能力,機(jī)器翻譯能力等等。
那么有了能力還是不夠的,能力也要跟場(chǎng)景結(jié)合,好像說(shuō)我是內(nèi)力非常深厚還要需要跟你的能力產(chǎn)品對(duì)接,我們2014年希望通過(guò)云端芯這種統(tǒng)一的產(chǎn)品體系能夠深入,為我們的客戶提供支持,提供服務(wù)。我們?cè)谠贫颂峁〢I Service,我們同事要在不同設(shè)備終端提供AI交互能力,我們要提供到移動(dòng)端,能夠滿足用戶在移動(dòng)端上對(duì)技術(shù)和能力要求。
在過(guò)去六年里云知聲從2012年到2014年,那個(gè)時(shí)候我們做的是團(tuán)隊(duì)最擅長(zhǎng)的事情,就是把算法平臺(tái)化,通過(guò)算法平臺(tái)化云知聲構(gòu)建了云端芯體系,從2018年開(kāi)始我們把場(chǎng)景和算法結(jié)合定了云端芯體系,我們?cè)诓煌瑘?chǎng)景去開(kāi)拓。接下來(lái)我們做什么,我們要構(gòu)建產(chǎn)品?;仡櫫昀?,云知聲我們秉持著堅(jiān)持科大校訓(xùn),談不上我們做了哪些特別大的,了不起的東西,但是我們?cè)浦暳曜隽巳虑椤?/p>
2012年可能學(xué)術(shù)界很多人還沒(méi)有聽(tīng)說(shuō)過(guò)什么叫深度學(xué)習(xí),什么叫(英),云知聲在2012年我們就開(kāi)始把深度學(xué)習(xí)應(yīng)用于語(yǔ)音識(shí)別技術(shù),并且把深度學(xué)習(xí)確定整個(gè)公司的技術(shù)戰(zhàn)略方向。今天我們知道在2016年3月份,在阿法狗之后,我們幾乎所有人都知道AI。在2016年前我們正確的確定了未來(lái)的戰(zhàn)略方向。在2014年的時(shí)候我們就意識(shí)到,算力和算法必須完美融合在一起,在2014年我們就確定要把云端芯一體化,在2015年我們開(kāi)始決定啟動(dòng)了我們的芯片計(jì)劃,2015年我們對(duì)芯片認(rèn)識(shí)就開(kāi)始不一樣了,芯片是高端制造業(yè),我們甚至把芯片歸為夕陽(yáng)產(chǎn)業(yè),我們還是定義為傳統(tǒng)產(chǎn)業(yè),但是沒(méi)有看到技術(shù)進(jìn)步對(duì)計(jì)算能力的追求。
今天來(lái)看,也許我們?cè)谒惴ㄔ诋a(chǎn)品戰(zhàn)略,在對(duì)技能云數(shù)據(jù)方面有了認(rèn)識(shí),有了很好的能力,那么云知聲選擇了兩個(gè)場(chǎng)景,分別是AI生活和AI服務(wù),2014年初云知聲開(kāi)始設(shè)計(jì)語(yǔ)音識(shí)別,那個(gè)時(shí)候我們沒(méi)有看到我在家里可以不通過(guò)搖控器可以控制的設(shè)備,回到家的時(shí)候我一邊脫鞋子一邊說(shuō),把燈打開(kāi),這是我下的定義。我們今天去國(guó)美會(huì)看到,幾乎所有的帶語(yǔ)音交互設(shè)備無(wú)論是海爾、美的的幾乎無(wú)一例外都在使用云知聲語(yǔ)音交互。
在2014年的時(shí)候我們相信未來(lái)的車一定是智能的,未來(lái)的車主一定通過(guò)網(wǎng)絡(luò)服務(wù)來(lái)導(dǎo)航,來(lái)聽(tīng)歌曲,來(lái)查找附近的美食,所以2015年我們開(kāi)始把車載分案提交給市場(chǎng),到今天我們?cè)诤蠖耸袌?chǎng)已經(jīng)擁有差不多1800套設(shè)備,我們有接近40款前端的車型,2017年我們認(rèn)為家庭會(huì)變成智能化,我們開(kāi)始推出家庭智能方案,到今天為止有300個(gè)執(zhí)行方案。云知聲2015年AI能力跟產(chǎn)品需求結(jié)合在一起,到今天我們的醫(yī)院已經(jīng)超過(guò)五百多家布局,這里面80%以上都是非常頭部的,包含北京協(xié)和醫(yī)院,上海的礦山醫(yī)院等等,同樣的我們也把AI的能力給我們互聯(lián)網(wǎng)公司進(jìn)行運(yùn)作。在今年我們還陸續(xù)在金融,在客服等等方面布局。
其實(shí)2017年就有很多人說(shuō),我們都說(shuō)創(chuàng)業(yè)公司不行,說(shuō)是不是想法太多了,人家做AI你還做芯片,其實(shí)他們不知道云知聲從來(lái)沒(méi)有專門的教育,也沒(méi)有專門的家具,在云知聲我們只不過(guò)從場(chǎng)景落地,我們通過(guò)滿足場(chǎng)景需求,我們具備了在這個(gè)場(chǎng)景里為這個(gè)用戶提供某一種需求,某一種能力。正是云知聲在2014年確定了云端芯一體化戰(zhàn)略,才使得我們?cè)谟邢耷闆r下可以快速的在場(chǎng)景下布局。有了技術(shù)還有相對(duì)產(chǎn)品的規(guī)劃,后面需要經(jīng)過(guò)漫長(zhǎng)的迭代。2018年很多朋友跟我講,今年業(yè)績(jī)又下滑了,確實(shí)如此。2018年很多行業(yè)都會(huì)遇到各種各樣的問(wèn)題,但可能就是云知聲的產(chǎn)品與未來(lái)的市場(chǎng)變化,我們做了很多準(zhǔn)備工作,所以在2018年也許是厚積薄發(fā)。
我們有的公司在分蛋糕,是說(shuō)明市場(chǎng)需求已經(jīng)有了,大家只是說(shuō)這個(gè)刀怎么切的問(wèn)題,云知聲做了很多事情,我們現(xiàn)在做的,無(wú)論是在教育、醫(yī)療、智能家具,車等等,云知聲都是行業(yè)領(lǐng)域的先河者,我們都是在這個(gè)場(chǎng)景,我們有創(chuàng)新的技術(shù)和體系,我們第一個(gè)來(lái)做,而且做出規(guī)模。
另外云知聲的收入構(gòu)成,我們今年的收入都是來(lái)自于芯片,我們看似幾個(gè)億的營(yíng)業(yè)額銷售額帶動(dòng)的產(chǎn)值可能是幾十億甚至上百個(gè)億,我們沒(méi)有去做任何系統(tǒng)性的。我們投資公司的時(shí)候,特別是2B公司,人工產(chǎn)值如果把兩個(gè)組合在一起的話,相信今天在AI里面我們是一個(gè)頗具分量的,為什么能做?因?yàn)槲覀冊(cè)谶^(guò)去,我們堅(jiān)持一個(gè)正確的商業(yè)化的方式。所以今天我們不光在2018年,根據(jù)現(xiàn)有的產(chǎn)品開(kāi)發(fā),我們甚至可以預(yù)測(cè)在2019年相比于2018年依然會(huì)有增長(zhǎng),甚至在純粹的市場(chǎng)環(huán)境中的能力,我相信我們接下來(lái)會(huì)遇到很多問(wèn)題。
其實(shí)過(guò)去很多O2O、P2P等等,現(xiàn)在有朋友問(wèn)我說(shuō),你羨慕嗎?其實(shí)我一點(diǎn)不羨慕,因?yàn)槲易鲈浦暿且粋€(gè)事業(yè),我覺(jué)得是在平凡中更偉大,有的時(shí)候慢一點(diǎn)打好基礎(chǔ)。雖然說(shuō)過(guò)去六年里面云知聲取得了一點(diǎn)點(diǎn)成績(jī),這其實(shí)都是我們?cè)谶@個(gè)時(shí)代里要做的。
什么是5G?這里面什么叫G?我們?cè)诳吹倪^(guò)程中從2G、3G這種感覺(jué),2G的時(shí)候我們干什么?最多在手機(jī)上看小說(shuō)。3G時(shí)代云知聲誕生的時(shí)候剛好是3G時(shí)代,那個(gè)時(shí)候我們?cè)谑謾C(jī)上看圖片,4G來(lái)臨,今天快手、抖音等等,但是我們發(fā)現(xiàn)5G相比3G、4G可能會(huì)是一個(gè)質(zhì)變。今天我們對(duì)社會(huì)可視的對(duì)話,但是基本我們其是感覺(jué)比較生硬,現(xiàn)在全息各種各樣的,我們甚至可以說(shuō)可以3D看到每個(gè)人的表情。所以5G對(duì)于未來(lái)改變的不只是網(wǎng)絡(luò)速度,甚至改變形態(tài),甚至還有行業(yè),所以5G對(duì)于4G是革命性的變化。
5G的三個(gè)典型特征,更寬的寬帶,更低的時(shí)延,廣闊的覆蓋。5G會(huì)給我們每個(gè)人的生活帶來(lái)改變,5G會(huì)使得我們今天從人和人之間的連接,到萬(wàn)物的互聯(lián),每個(gè)人之間,每個(gè)設(shè)備之間,5G引用應(yīng)用的大爆炸,車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等等,而且我們今天可能會(huì)從手機(jī)的時(shí)代,手機(jī)的互聯(lián)擴(kuò)展到各種行業(yè),連接爆炸和應(yīng)用爆炸加快,比方說(shuō)我開(kāi)車的時(shí)候車聯(lián)網(wǎng),接收其他行業(yè)的信息,他會(huì)產(chǎn)生大量的數(shù)據(jù),而且數(shù)據(jù)會(huì)發(fā)給平臺(tái)。
舉個(gè)例子,終端未來(lái)越來(lái)越多的數(shù)據(jù),什么叫做智能,我非常贊同一句話,只有耳朵沒(méi)有眼睛是不全面的,所以我相信未來(lái)的智能終端,一定是多維的。算力之外,還需要有深入場(chǎng)景提供服務(wù)能力。場(chǎng)景里面我們需要什么?我們需要解決問(wèn)題,計(jì)算能力基礎(chǔ),計(jì)算能力之上。
所以我們今天有必要再定義SOC,什么叫SKill?在AI時(shí)代我們是打開(kāi)一個(gè)鏈接進(jìn)入一個(gè)網(wǎng)址,移動(dòng)互聯(lián)網(wǎng)時(shí)代打開(kāi)手機(jī)找出我們想實(shí)現(xiàn)的功能,幫助你訂機(jī)票訂酒店等等,所以未來(lái)通過(guò)SKill這個(gè)方式來(lái)做一些事情。那么是不是SKill只在云端,SKill既存在云端也存在其他地方,這個(gè)城市我們需要很多攝像頭、傳感器,如果我們所有數(shù)據(jù)都是網(wǎng)絡(luò)傳到云端,所有的數(shù)據(jù)會(huì)占據(jù)很多帶寬,會(huì)占據(jù)很多資源,如果每個(gè)攝像頭本身都具備能力,不見(jiàn)得所有的數(shù)據(jù)都需要,4G剛來(lái)的時(shí)候流量用不完,但是發(fā)現(xiàn)抖音來(lái)了以后不夠用。如果說(shuō)我們完成一些工作,讓變的云端更加有用的,更強(qiáng)的終端,讓云變的更強(qiáng),端跟云的互補(bǔ)能夠讓能力在場(chǎng)景里面配合。
正是因?yàn)樵贫嘶ハ嗟哪芰?,(英)所以終端本身也必須具備一個(gè)能夠支持芯片算法的NPU,這個(gè)NPU支持語(yǔ)音任務(wù),你還可以支持視頻。重新定義了SOC之后,云端會(huì)變成更加靈活,只有這樣我們才能在5G+IOT+AI時(shí)代來(lái)臨的時(shí)候,我們才有更好的能力,我們要通過(guò)這種方式來(lái)構(gòu)建我們的場(chǎng)景優(yōu)勢(shì)。其實(shí)我并不知道還會(huì)遇到多少困難,2012年當(dāng)我們把云識(shí)別開(kāi)放的時(shí)候,中國(guó)還沒(méi)有云計(jì)算,2014年我們開(kāi)始做云的時(shí)候,2015年我們做芯片的時(shí)候,所以每一年都會(huì)有變化,為什么?因?yàn)閯?chuàng)業(yè)過(guò)程中最難走的路才是捷徑,我們也希望進(jìn)一步支持幫助我們,我們也堅(jiān)信我們走的道路是順利的,謝謝大家!
主持人:有請(qǐng)?jiān)浦暵?lián)合創(chuàng)始人李霄寒博士,為我們來(lái)正式揭曉云知聲多模態(tài) AI 芯片戰(zhàn)略與布局。
李霄寒:大家好!各位領(lǐng)導(dǎo),各位老師,各位朋友,各位合作伙伴們,陳老師、吳主任大家下午好,今天是2019的1月2日是第一個(gè)工作日,非常感謝大家把一個(gè)下午時(shí)間交給云知聲,今天下午由我?guī)ьI(lǐng)大家回顧一下云知聲過(guò)去的歷程!當(dāng)前人工智能物聯(lián)網(wǎng)面臨什么挑戰(zhàn),我們對(duì)它的思路,以及2018云知聲做的一些積累取得的一些成功,以及2019云知聲將有一個(gè)非常宏大的芯片技術(shù)。
首先我們來(lái)看一下我們這個(gè)時(shí)代,我們現(xiàn)在處在一個(gè)互聯(lián)網(wǎng)時(shí)代,我們所有人都經(jīng)歷過(guò)個(gè)人電腦和移動(dòng)終端時(shí)代,在這兩個(gè)時(shí)代有什么差別?他們?cè)诤诵姆矫嬗惺裁床灰粯??我們認(rèn)為有幾點(diǎn),首先是社會(huì)數(shù)量的增長(zhǎng),個(gè)人電腦時(shí)代是以家庭為單位,移動(dòng)互聯(lián)網(wǎng)設(shè)備以人為單位,所以有了提升。在物聯(lián)網(wǎng)時(shí)代,我們每一個(gè)人未來(lái)都可能有一個(gè)兩個(gè)三個(gè)多個(gè)N個(gè)互聯(lián)網(wǎng)設(shè)備,所以設(shè)備的數(shù)量會(huì)呈現(xiàn)大規(guī)模爆發(fā)狀態(tài),對(duì)于這個(gè)產(chǎn)業(yè)鏈所有玩家來(lái)講都是一個(gè)巨大規(guī)模。
第二點(diǎn)就是連接成本更低一點(diǎn),在既有的藍(lán)牙、WIFI一些比較成熟的,我們可以看到5G方興未艾,這些連接手段發(fā)展,為物聯(lián)網(wǎng)設(shè)備的連接成本會(huì)使得他降到非常的低廉,這種低廉一方面是金錢一方面是帶寬成本!同樣條件下可以傳輸更多的數(shù)據(jù)。
第三數(shù)據(jù)維度變的復(fù)雜多樣,PC時(shí)代我們所收集的數(shù)據(jù)無(wú)非是鍵盤的點(diǎn)擊,移動(dòng)互聯(lián)網(wǎng)手機(jī)的數(shù)據(jù)包括GPS包括用戶很多其他數(shù)據(jù)化,在物聯(lián)網(wǎng)時(shí)代更傾向于人體交互,所以會(huì)產(chǎn)生對(duì)物聯(lián)網(wǎng)設(shè)備提出新要求,最后是應(yīng)用場(chǎng)景。我們?cè)僖膊豢赡芟褚苿?dòng)時(shí)代那樣生產(chǎn)一款芯片手機(jī)上面可以有很多應(yīng)用,在物聯(lián)網(wǎng)時(shí)代風(fēng)扇的物聯(lián)網(wǎng)平臺(tái)和空調(diào)的物聯(lián)網(wǎng)平臺(tái)肯定是不一樣,可能只有幾個(gè)應(yīng)用,所以這些不同和對(duì)物聯(lián)網(wǎng)和以前的時(shí)代創(chuàng)造出一些新的變化,這些變化給我們帶來(lái)了挑戰(zhàn),也給我們所有人創(chuàng)造新的機(jī)會(huì)。
物聯(lián)網(wǎng)時(shí)代非常重要的命題,把能力下沉到設(shè)備端,和移動(dòng)時(shí)代不一樣,移動(dòng)時(shí)代和PC時(shí)代都可以用手機(jī),在物聯(lián)網(wǎng)時(shí)代風(fēng)扇和空調(diào)不會(huì)共用一個(gè)平臺(tái),這就意味著最終端的硬件上面會(huì)產(chǎn)生跟以前不一樣的變化,所以物聯(lián)網(wǎng)必須解決最終端的硬件問(wèn)題,云知聲是怎么解決的呢?
在2014年云知聲提出了云端芯的產(chǎn)品技術(shù)架構(gòu),我們認(rèn)為物聯(lián)網(wǎng)時(shí)代下任何一個(gè)產(chǎn)品都會(huì)具有這三個(gè)部分,都會(huì)用云端芯這三個(gè)部分組成,僅僅強(qiáng)調(diào)其中一個(gè)都是不行的,是解決不了當(dāng)下人們的需要,所以我們開(kāi)發(fā)了IDM的產(chǎn)品,在2015正式量產(chǎn),經(jīng)過(guò)這幾年的發(fā)展有了非常多客戶,出貨量也呈規(guī)模性增長(zhǎng)。一直到今天我們?cè)谶@個(gè)領(lǐng)域仍然是獨(dú)一無(wú)二的老大。
在我們2015取得階段性成果,當(dāng)時(shí)就面新一個(gè)問(wèn)題,來(lái)自業(yè)務(wù)端的問(wèn)題,我把它叫做來(lái)自戰(zhàn)術(shù)的挑戰(zhàn)。第一個(gè)挑戰(zhàn)我們要處理的數(shù)據(jù)當(dāng)時(shí)是語(yǔ)音, 大家用紅外搖控器和觸屏完全不一樣,需要基于深度進(jìn)行互聯(lián),對(duì)于算力提出更高要求,我們的方法就是用更好的算法提供更好的需求,很明顯帶來(lái)一個(gè)負(fù)作用成本增加,硬件對(duì)于成本是非常敏感的。比如家電,我的成本沒(méi)增加一塊錢,在硬件成本采購(gòu)商一塊錢,意味著我的用戶承擔(dān)五倍價(jià)值增加,也就你的產(chǎn)品采購(gòu)云知聲的產(chǎn)品一百塊錢,就意味著你最終的成品售價(jià)要增加五百塊錢左右,但是如果你原來(lái)的產(chǎn)品是一個(gè)風(fēng)扇只賣一兩百怎么去涵蓋吸收五百塊錢的價(jià)值增長(zhǎng),所以這個(gè)問(wèn)題對(duì)于印象,對(duì)于五千塊錢以下的成本都是成立的。
另外一個(gè)功耗的問(wèn)題,更多的算力意味著更多的功耗,對(duì)于插電的產(chǎn)品可能成立,但是對(duì)于電視工業(yè)的成本肯定不行,所以這是我們面臨非常迫于眉睫的問(wèn)題,這是2015年的問(wèn)題。但是僅僅業(yè)務(wù)端的挑戰(zhàn)還是淺薄了一些,我們?cè)谀莻€(gè)時(shí)間點(diǎn)看到了一些不太一樣的,也就是所謂的戰(zhàn)略端的考量。
首先我們看到在我們做的產(chǎn)品之外,在我們面向整體的市場(chǎng),它其實(shí)是一個(gè)物聯(lián)網(wǎng)市場(chǎng)。他在接觸用戶,跟用戶打交道注定是有新數(shù)據(jù)導(dǎo)入,比如語(yǔ)音、頭像、手勢(shì)等等這些數(shù)據(jù)需要處理,要進(jìn)行更好效能要進(jìn)行基于深度神經(jīng)網(wǎng)絡(luò)的法,這就意味著我需要在終端提供更加充分的算力,這是一個(gè)事實(shí)。
另外一個(gè)有約束就是成本的約束,在規(guī)定成本和條件下怎么提供不同的算法,基于通用性是不是最優(yōu)的,不太適合做大規(guī)模矩陣的神經(jīng)性網(wǎng)絡(luò)的計(jì)算,它是低效的,所以左邊和右邊這兩個(gè)是一個(gè)根本性矛盾,是我們做物聯(lián)網(wǎng)、人工智能設(shè)計(jì)的時(shí)候不可回避的矛盾,只要物聯(lián)網(wǎng)往前發(fā)展成本仍然是一個(gè)不可忽略的點(diǎn),那這個(gè)矛盾就永遠(yuǎn)存在,我們的使命就是要去解決這個(gè)矛盾,那怎么解決?我們的看法就是基于深度學(xué)習(xí)的新硬件勢(shì)在必行,簡(jiǎn)單來(lái)講就是做邊緣側(cè)人工智能芯片,所以我們2015下決心做這個(gè)事情,我們看到了一個(gè)趨勢(shì)。這個(gè)趨勢(shì)我們可以抓住,在今年這個(gè)時(shí)間點(diǎn)我們就可以比別人好,所以我們勇敢革自己的命,所以這是我們2015年整體項(xiàng)目的思路。
我們2016在做團(tuán)隊(duì)的模式,2017年項(xiàng)目到了實(shí)際階段。2018年1月份做了一個(gè)MPW,2018年5月份做了一個(gè)盛大的發(fā)布,6月份我們正式啟動(dòng)量產(chǎn),9月份我們做了另外一個(gè)事情,9月12日發(fā)布了基于雨燕的方案。9月份之后我們的芯片設(shè)計(jì)團(tuán)隊(duì)轉(zhuǎn)入了圖像IP設(shè)計(jì)。
這一頁(yè)是(英)第一代產(chǎn)品,也就是我們發(fā)布雨燕整體的介紹,它的架構(gòu)是一個(gè)非常典型的芯片,我們做了兩件事情一件是(英)專門做音頻數(shù)據(jù)處理,第二個(gè)做了人工智能數(shù)據(jù)處理器,面向音頻的人工智能神經(jīng)處理器。當(dāng)把這個(gè)人工處理器集成進(jìn)去以后效果是顯而易見(jiàn)的,相對(duì)于通用芯片AI(英)提升了50倍。在硬件設(shè)備方面,因?yàn)檫@個(gè)芯片是高度集成的,所以外圍的線路使得很大的成本降低三分之一。
9月12日我們發(fā)布了開(kāi)源方案,我們?cè)谶@個(gè)芯片上做了很多工作,我們?nèi)斯ぶ悄芤娣派先ミM(jìn)行調(diào)優(yōu),我們?yōu)檫@個(gè)硬件應(yīng)用還設(shè)計(jì)了APP,客戶拿過(guò)去如果正好符合他的要求,那他直接跟產(chǎn)品做連接就可以突破,不用再拿芯片找人工智能的服務(wù)商,人的服務(wù)商,手機(jī)的開(kāi)發(fā)商,我們給他是一個(gè)完整的方案。在這個(gè)時(shí)間點(diǎn)上多家客戶做產(chǎn)品導(dǎo)入,在測(cè)試、開(kāi)發(fā)、生產(chǎn),所以我們會(huì)有雨燕產(chǎn)品在市場(chǎng)上出現(xiàn)。
2019年第一個(gè)工作日這個(gè)時(shí)間點(diǎn),我們之前做了很多事情,有必要去回顧一下,展望一下未來(lái)物聯(lián)網(wǎng)人工智能芯片到底該怎么做,他到底在他的發(fā)展路線需要考慮什么核心因素,這是我們必須要思考的。首先連接、安全和PPA,無(wú)論是藍(lán)牙還是5G還是WIFI,你總要考慮連接方式,這是一個(gè)核心點(diǎn)。
第二個(gè)安全,芯片物聯(lián)網(wǎng)意味著別人也可以到達(dá)你的芯片,我們不希望生產(chǎn)一個(gè)攝像頭被人家黑掉,轉(zhuǎn)到黑客服務(wù)器,這樣你的產(chǎn)品就再也賣不出去了,所以安全以及云端的安全是物聯(lián)網(wǎng)必須要擴(kuò)率的。
第三個(gè)PPA,是(英)性能、功耗和面積這三個(gè)是做物聯(lián)網(wǎng)芯片要考慮得,如果我們做AI物聯(lián)網(wǎng)芯片僅僅考慮這三個(gè)是不夠的。
第一個(gè)場(chǎng)景化,我們看到我們?cè)诿嫦蚩蛻籼峁┓桨傅臅r(shí)候,我們需要針對(duì)某個(gè)場(chǎng)景做不同事情,不光做軟件,很有可能你的芯片為這個(gè)產(chǎn)品而生。就像剛才講的,如果面向風(fēng)扇或者開(kāi)關(guān)去做物聯(lián)網(wǎng)芯片,跟我們做汽車和電視這樣的物聯(lián)網(wǎng)芯片,從云到芯片本身會(huì)有質(zhì)的變化,產(chǎn)品功能功耗會(huì)有非常大差異,所以場(chǎng)景化我認(rèn)為是物聯(lián)網(wǎng)人工智能芯片考慮得第一個(gè)因素。
第二個(gè)因素多模態(tài),這個(gè)場(chǎng)景我們出現(xiàn)很多了,我們認(rèn)為物聯(lián)網(wǎng)既然要以各種方式接觸到人,物聯(lián)網(wǎng)人工智能芯片必須具備多模態(tài)數(shù)據(jù)的能力,這是第二個(gè)。
第三個(gè)端云互動(dòng),什么意思?物聯(lián)網(wǎng)芯片是聯(lián)網(wǎng)的,芯片只是一個(gè)排頭兵,他通過(guò)到達(dá)終端服務(wù)用,所以這個(gè)是非常重要的。僅僅設(shè)計(jì)一款芯片是解決不能能力到達(dá)端的問(wèn)題。這三點(diǎn)是我認(rèn)為互聯(lián)網(wǎng)AI芯片在這個(gè)時(shí)間點(diǎn)需要重點(diǎn)考量的三個(gè)要素。
所以用一句話把我剛才的觀點(diǎn)概括,就是需要面向基于端云互動(dòng)提供多模態(tài),在性能、功耗面積上達(dá)到優(yōu)異的平衡,并兼顧連接和安全的需求。
需求的場(chǎng)景化,我把它概括成一句話,這個(gè)也是大家業(yè)界的共識(shí),基本是從PPA到APP,PPA三個(gè)要素(英),我現(xiàn)在設(shè)計(jì)目標(biāo)就是在盡可能小的功能上,提高最好的性能,這是PPA的核心。但是在人工智能上,僅僅關(guān)注PPA不久,我們需要關(guān)注APP,我們最后向客戶提供的是一個(gè)包含APP的,需要整體角度考量。從PPA到APP發(fā)生了一些變化,從通用的芯片變成了面向網(wǎng)絡(luò)垂直來(lái)提供芯片,第二從單純的提供芯片,變成了提供方案,芯片上的軟件,有能力,有云端服務(wù)。第三就是從提供硬件變成能力,這是一個(gè)具體的場(chǎng)景化。
第二個(gè)端云互動(dòng),邊緣的計(jì)算可以看成云計(jì)算的補(bǔ)充和優(yōu)化,而且云計(jì)算始終都是一體的,我舉個(gè)例子,這個(gè)圖上面部分是一個(gè)功能,叫做語(yǔ)音喚醒,下面是芯片,邊緣算力來(lái)承擔(dān)語(yǔ)音方面的功能,比如印象或者電視你問(wèn)你好了嗎,他會(huì)回復(fù)你,接下來(lái)你進(jìn)行一段有趣的對(duì)話。音響半夜里會(huì)忽然大笑把人嚇一跳,背后的原理很簡(jiǎn)單,就是某些自然界的噪音發(fā)出,就把這個(gè)設(shè)備喚醒,設(shè)備以為就是人在喊它,然后它就聽(tīng)到的話就是給我笑一下,不知道原來(lái)的話是什么,但是被機(jī)器解讀成了給我笑一下,所以在人沒(méi)有聽(tīng)到任何聲音的時(shí)候,機(jī)器出來(lái)一個(gè)怪笑,所以這就是喚醒和不喚醒之間的一個(gè)矛盾。
我們科學(xué)家要做的盡可能提高喚醒率的上面提升邊緣算力,但是不是唯一一個(gè)方式,我保持邊緣算力,當(dāng)我識(shí)別發(fā)到云端之后,在云端用更加的模型進(jìn)一步分析,他到底有沒(méi)有真的在喊我。當(dāng)他確認(rèn)的時(shí)候,又發(fā)現(xiàn)用戶繼續(xù)提交新的語(yǔ)言過(guò)來(lái)之后,他繼續(xù)笑一下或者做別的反應(yīng),理論上它可以用最精簡(jiǎn)的模型,所以可以把一些東西規(guī)避掉了,所以這是一個(gè)非常典型的例子。如果一個(gè)廠商說(shuō)我在云端上做的是最好的,這樣可能不夠,你需要有更加完美的解決方案來(lái)提供給你的客戶。
多模態(tài),我這里舉個(gè)例子,美的空調(diào),有一個(gè)攝像頭是通過(guò)一個(gè)矩陣去觀測(cè)屋里的狀態(tài),如果小朋友在風(fēng)就避開(kāi)他,往別的方向去吹。還有如果小朋友晚上登被子上皮膚會(huì)感覺(jué)溫度比較低,它會(huì)自動(dòng)提升溫度,是非常好的一個(gè)功能,這是多模態(tài)一個(gè)非常典型的例子。機(jī)器人就不用說(shuō)了,無(wú)論是陪伴機(jī)器人還是教育機(jī)器人,除了跟人自由對(duì)話,還期待認(rèn)識(shí)我們,教小朋友讀書,認(rèn)識(shí)單詞等等,所以要求機(jī)器人必須具備多模態(tài)功能。車載能夠用語(yǔ)音導(dǎo)航,能夠看到路面的狀態(tài),告訴我狀況,還有你困了,要停下休息。還有一個(gè)IP攝像頭,它的核心功能錄像,如果它聽(tīng)到聲音的時(shí)候就把感興趣的東西拍下來(lái),傳說(shuō)去,所以這就是多模態(tài)在各個(gè)領(lǐng)域的剛性需求的一些例子。
基于以上的我們可以得出一個(gè)結(jié)論,重新定義SOC,在今天這個(gè)時(shí)間點(diǎn)僅僅做(英)可能不太就,我們需要做的是(英),這個(gè)可能來(lái)自于本地的算力,本地的引擎,也可能來(lái)自于云端的能力,我們需要在這個(gè)上面集成更多更優(yōu)秀的(英),所以端云互動(dòng),場(chǎng)景化,多模態(tài)這幾個(gè)因素會(huì)非常深刻的影響到芯片的設(shè)計(jì),影響到芯片的定位,影響到你的成本、功耗還有你對(duì)芯片的需求,所以芯片需要面向綜合考慮得一個(gè)事,這是我們對(duì)這個(gè)事情的理解。
基于這個(gè)理解云知聲做了什么工作呢?第一個(gè)我們發(fā)布了垂直化(英)方案,我們把所有軟件硬件場(chǎng)景都做好了,客戶拿來(lái)就用,不需要再去找更多供應(yīng)商,這也是我們未來(lái)芯片銷售,芯片服務(wù)提供的一個(gè)核心產(chǎn)品模式。
第二點(diǎn)我們叫做ADPC,專門面向端云互動(dòng),(英)在2012年公司成立之后,9月份我們就推出語(yǔ)音識(shí)別功能,經(jīng)過(guò)六年多發(fā)展已經(jīng)發(fā)展成面向物聯(lián)網(wǎng)每天用量達(dá)到5億次的巨大云平臺(tái),我們對(duì)這個(gè)平臺(tái)開(kāi)發(fā)了ADPC模式。
第三個(gè)我們?cè)谛酒O(shè)備方面有兩個(gè)輸出,一個(gè)叫做(英)是非常輕量的圖片處理單元。DeepNet2.0是我們面向多模態(tài)開(kāi)發(fā)的深度神經(jīng)網(wǎng)絡(luò)處理器,這款處理器有非常多很好的涉及,目前在業(yè)界也出了非常多不錯(cuò)的,至少在我看來(lái)是非常好的一個(gè)產(chǎn)品,后面我還會(huì)講到。
ADPC是我們的AI深度處理核心,這個(gè)方框是我們?cè)破脚_(tái)的架構(gòu),暗的地方跟云平臺(tái)可能沒(méi)有太大差別,但是我們有一個(gè)AI的數(shù)據(jù)處理核心,用它跟云端連接,當(dāng)我們端處理完數(shù)據(jù),會(huì)把一部分的數(shù)據(jù)提交給云端,由云端做深度的分析,就像我剛才舉的例子,如果只有右面的例子我們可能只會(huì)提供一個(gè)95分的產(chǎn)品,如果有了云端的時(shí)候我們會(huì)提供一個(gè)98的產(chǎn)品,所以有了云端互動(dòng)可能你的產(chǎn)品是最優(yōu)秀的。
這是我們(英)的介紹,這是面向機(jī)器視覺(jué)輕量級(jí)的圖像服務(wù)器,一個(gè)是面向機(jī)器視覺(jué),第二個(gè)是輕量級(jí),讓人看這個(gè)圖片看起來(lái)會(huì)更加的舒服,更加精細(xì),但是它不一定更加適合機(jī)器視覺(jué),所以(英)是專門面向機(jī)器視覺(jué)得,所以他支持任何圖像縮小,(英)給一個(gè)圖片,通過(guò)這個(gè)模塊可以實(shí)時(shí)縮小,后面的神經(jīng)網(wǎng)絡(luò)比較舒服的處理,這是他一個(gè)重要功能。
第二個(gè)做動(dòng)態(tài)自動(dòng)的曝光控制,這個(gè)圖人眼已經(jīng)很難看出寫的什么,但是就機(jī)器識(shí)別力,會(huì)出現(xiàn)在他里面,他很有可能會(huì)識(shí)別不到,但是通過(guò)(英)識(shí)別把暗處提高,使得可清晰度有了大幅度提升,所以使得后面的圖像處理更加的容易。
第三點(diǎn)我們其他還支持8、10、12bit圖像輸入,他不需要外部的內(nèi)存是一個(gè)非常小的模塊,把這個(gè)圖片輸入給后面的神經(jīng)網(wǎng)絡(luò)得到更好的視覺(jué)過(guò),這是我們的(英)。僅僅這樣可能還不夠,我們?cè)?019計(jì)劃會(huì)跟BlinkAI合作,它是來(lái)自于哈佛的團(tuán)隊(duì),基于深度學(xué)習(xí)的算法圖象處理。左邊這個(gè)圖片比較小,是三星的處理之后是在光照的情況下,右邊也是處理過(guò),所以看到效果非常,整個(gè)亮度增加,對(duì)比度增加,所以我們也會(huì)在2019跟BlinkAI探討這方面合作,在充沛算力支持情況下進(jìn)一步提升效果。
再一個(gè)DeepNet1.0,是面向語(yǔ)音的,但是在2.0里面我們添加了很多是面向多模態(tài)的,既可以處理圖像,又可以處理語(yǔ)音。為什么我們會(huì)做這個(gè)DeepNet2.0,IP就是知識(shí)產(chǎn)權(quán),實(shí)際在芯片設(shè)計(jì)里面IP是已經(jīng)驗(yàn)證過(guò)軟件的模塊,IP決定人工智能的合理性,這是里面最核心的部分。
它有幾個(gè)特點(diǎn),首先支持多種的兼容網(wǎng)絡(luò),我們?cè)?.0里面主要支持LSTM和CNN這兩個(gè)主要面向語(yǔ)音識(shí)別,在2.0里面我們支持更多,比如RNN,TDN,所以在兼容里做到非常高水平。
第二個(gè)可重構(gòu)計(jì)算,我們都知道一些算法是有規(guī)定的,可能會(huì)有一些高頻率的出現(xiàn),如果這個(gè)高頻率用硬件實(shí)現(xiàn)可以由一個(gè)非常高的飛躍。在DeepNet2.0支持可重構(gòu)計(jì)算,他的計(jì)算單元可以去拼接應(yīng)對(duì)計(jì)算模式,你換一個(gè)模式也可以通過(guò)快速組合,用一條指令來(lái)計(jì)算公式。
第三個(gè)支持Winograd,芯片做乘法的時(shí)候耗時(shí)是遠(yuǎn)遠(yuǎn)高于加法的,我們想用于多加法就可以實(shí)現(xiàn)這是可行的,這是核心思想。我們支持Winograd使乘法降低到原來(lái)的一半進(jìn)一步提升效率。
它還有其他的一些,比如支持多NPU組網(wǎng),我在設(shè)計(jì)芯片B的時(shí)候需要更高算力,拿兩個(gè)NPU組網(wǎng)進(jìn)行多算法組合,這是他非常好的靈活的特性。在2018年最后一周我們把DeepNet2.0正式成功一直到了STPA的板上,大家可以看到這是效果。所以人像識(shí)別的算法,基于DeepNet2.0,已經(jīng)運(yùn)行在STPA上了。
這里是一些橫向的指標(biāo)對(duì)比,也相對(duì)比較專業(yè),我盡量用比較淺顯的語(yǔ)言解釋一下。對(duì)于NPO來(lái)講一個(gè)核心的指標(biāo)是算力,還有一個(gè)核心指標(biāo)功耗,如果算力除以功耗就是一個(gè)非常有趣的,我們預(yù)計(jì)在28納米這樣一個(gè)工藝條件下,我們是有優(yōu)勢(shì)的。
有了那么好的DeepNet2.0,那么好的一個(gè)算力提供者,在上面好的應(yīng)用算法有什么進(jìn)展?首先是我們超聽(tīng)限的同向降噪技術(shù),什么是超聽(tīng)限,就是超越聽(tīng)力的極限,讓機(jī)器可以聽(tīng)到人聽(tīng)不到的東西。聲音的東西很難向各位去描述,右下角是我們的芯片,裝備了四個(gè)麥克風(fēng),這個(gè)音響是用來(lái)放噪音的,他播的聲音是人的對(duì)話,然后我們后面站著這位演示者,他是一個(gè)命令發(fā)布者,會(huì)向這個(gè)藍(lán)色的板去發(fā)指令,大家如果視頻里面聽(tīng)到你有什么分咐,意味著這個(gè)成功了,會(huì)漏出一個(gè)藍(lán)色的。這個(gè)藍(lán)色是一個(gè)能量?jī)x,目前這個(gè)聲音是93.2,人的聲音聽(tīng)到一般是在60-70,所以在這個(gè)場(chǎng)景下他在負(fù)3左右,已經(jīng)超越人力的聽(tīng)力極限了,人已經(jīng)聽(tīng)不到了。我接下來(lái)會(huì)播放這個(gè)聲音,我會(huì)揭曉里面最精彩的部分。這個(gè)聲音準(zhǔn)確被我們的芯片捕捉并且做出反映,同相降噪,人和噪音源還有麥克風(fēng)三點(diǎn)呈一線,機(jī)器是很難分別,所以這對(duì)于技術(shù)提出更高挑戰(zhàn)。
接下來(lái)我們?cè)趫D像上的,云知聲是一家做語(yǔ)音的公司,或者以語(yǔ)音為公眾所知的公司,但是實(shí)際我們?cè)?018年已經(jīng)投入了很多資源做圖像的事情,也有很多進(jìn)展,我們之所以從語(yǔ)音潛入到圖像,因?yàn)槲覀冇泻芎玫挠布脚_(tái),分布式的機(jī)器學(xué)習(xí),所以我們的數(shù)據(jù)可以在這個(gè)上面很快的處理,迭代。
這個(gè)表格里面列了兩個(gè)比賽,這也是業(yè)界兩個(gè)非常有名的人臉測(cè)試儀,可以看到云知聲的識(shí)別率99.8。除了人連識(shí)別我們還有物體識(shí)別、表情分析、顏值分析,標(biāo)簽化,我們做這些事情不是為了樂(lè)趣,而是為了在物聯(lián)網(wǎng)場(chǎng)景,在芯片設(shè)計(jì)過(guò)程中需要用的。
這是我們的人臉識(shí)別和表情分析以及標(biāo)簽化的案例??梢钥吹轿覀儨?zhǔn)確的抓住了他的性格,表情,還有一點(diǎn)我們可以捕捉他的表情,他有沒(méi)有微笑。在機(jī)器場(chǎng)景下用戶有沒(méi)有微笑是非常重要的,在車載里面用戶有沒(méi)有疲勞駕駛這也是非常重要的。在一個(gè)場(chǎng)景會(huì)有多個(gè)目標(biāo),我們需要對(duì)每一個(gè)目標(biāo)進(jìn)行相應(yīng)的反應(yīng)。
還有一個(gè)有趣的,是我們的唇動(dòng)狀態(tài),在同一個(gè)場(chǎng)景誰(shuí)有說(shuō)話誰(shuí)沒(méi)有說(shuō)話通過(guò)食品捕捉到,它有一個(gè)非常有趣的功能是在人機(jī)對(duì)話里,在嘈雜的環(huán)境里,通過(guò)單一模態(tài)他不知道是在向誰(shuí)說(shuō)話,但是有了視覺(jué)可以有捕捉到信息,通過(guò)對(duì)人唇動(dòng)的追蹤,可以獲取到唇語(yǔ)相關(guān)詳細(xì),所以這在多模態(tài)的人機(jī)交互里是很重要的,很榮幸我們也做到了。
前面講我們做到一些事情,我們不僅腳踏實(shí)地做產(chǎn)品、技術(shù)和算法,同時(shí)我們也奧適度仰望星空,我們正式成為新型可持續(xù)智能計(jì)算中心的創(chuàng)始會(huì)員,在整個(gè)2019我們會(huì)跟杜克大學(xué)共同去研究AI芯片壓縮量化技術(shù),以及非馮新型AI芯片計(jì)算架構(gòu),我們是為了證明云知聲在智能方面是認(rèn)真的,我們還要做研究,我們要始終把我們的水平保持在業(yè)界一流,希望我們?cè)谖磥?lái)芯片領(lǐng)域能夠有所開(kāi)拓。
我們?cè)?018年形成一個(gè)非常重要的合作,我們跟億咖通科技合作面向智能出行共同打造車規(guī)級(jí)AI智能芯片。整個(gè)2018年的成績(jī)已經(jīng)給大家匯報(bào)完了。
后面跟大家宣布一下2019年我們準(zhǔn)備做的幾個(gè)重要的事情。第一個(gè)我們會(huì)開(kāi)發(fā)一款新的產(chǎn)品雨燕-Lite,它會(huì)更加的輕,仍然是面向語(yǔ)音的場(chǎng)景,但是它會(huì)非常的輕薄,所以我們計(jì)劃2019會(huì)去投產(chǎn)這款芯片。第二個(gè)面向智慧城市,我們這塊一直沒(méi)有涉及過(guò),今天宣布通過(guò)芯片切入到智慧城市建設(shè)之中,我們會(huì)在2019投產(chǎn)一款多模態(tài)的芯片,這個(gè)芯片會(huì)繼承我們的DeepNet2.0和(英),所以它不僅僅支持雨燕功能,他還會(huì)支持?jǐn)z像頭、ISP、OD、人臉識(shí)別這是我們?cè)?019年非常大的投入。第三個(gè)雪豹,我們會(huì)跟億咖通科技合作推行車載人工智能芯片,他的功能和前面的芯片有一個(gè)不一樣,會(huì)針對(duì)車載場(chǎng)景,可能會(huì)斷網(wǎng)沒(méi)有網(wǎng)絡(luò)連接,可能會(huì)有一些奇奇怪怪情況,會(huì)更加著重本地算力,我們會(huì)提供本地的語(yǔ)音搜索,在沒(méi)有網(wǎng)絡(luò)狀況下通過(guò)語(yǔ)音導(dǎo)航選址,所以做本地的語(yǔ)言路徑,可以做一些相應(yīng)的圖像處理等等,這款產(chǎn)品會(huì)在2019年投產(chǎn)。
在2015年的這個(gè)時(shí)間點(diǎn),我們真心沒(méi)有想過(guò)2018年我們會(huì)推出云知聲自己的芯片,我們不光做出來(lái)了而且還賣出去了,性能還在業(yè)界領(lǐng)先水平,在2018年這個(gè)時(shí)間點(diǎn)我沒(méi)有想到,我們除了雨燕之外,我們?cè)谌斯ぶ悄苄酒蠒?huì)走的更遠(yuǎn),會(huì)扎的更深,我們會(huì)出現(xiàn)多模態(tài)等等方面,包括核心的NPO、IT方面有這么多收獲,我們相信我們明年這個(gè)時(shí)間點(diǎn)在各位的鼎力支持下我們做的一定會(huì)比我們說(shuō)的更好更快更強(qiáng),謝謝大家!
主持人:感謝李博士的精彩發(fā)言,給我們帶來(lái)非常多的干貨滿滿。接下來(lái),我們要有請(qǐng)的是360集團(tuán)副總裁、360智慧城市事業(yè)部總裁 穆鴻為我們帶來(lái)演講,讓我們一起來(lái)聽(tīng)聽(tīng)360與云知聲之間都有哪些精彩碰撞!
穆鴻:各位來(lái)賓大家下午好!非常榮幸有這個(gè)機(jī)會(huì)能夠過(guò)來(lái)跟大家一起分享一下360在人工智能以及跟云知聲合作當(dāng)中的一些收獲。我今天講的這個(gè)題目叫安全大腦用心守護(hù)大安全,因?yàn)?60應(yīng)該是現(xiàn)在國(guó)際最大的網(wǎng)絡(luò)安全公司,我們其實(shí)在整個(gè)發(fā)展過(guò)程當(dāng)中,人工智能對(duì)整個(gè)360整個(gè)集團(tuán)發(fā)展非常關(guān)鍵。我們從2018年提出來(lái)未來(lái)整個(gè)安全的態(tài)勢(shì)非常的嚴(yán)峻,必須使用新方法來(lái)解決安全問(wèn)題,這就是我們?nèi)ツ晏岢龅陌踩竽X。
過(guò)去大家比較熟悉的就是360免費(fèi)殺毒,我們?cè)?010年的時(shí)候提出了一些基于AI的殺毒功能引擎,我們現(xiàn)在已經(jīng)成為最大的搜索引擎工作,我們2013年也推動(dòng)了一些智能硬件,我們智能硬件在市場(chǎng)上都處于第三的位置,我們家用攝像頭也處在前三的位置,我們360還有智能機(jī)器人,智能門鈴,等一系列的智能硬件。2015年360開(kāi)始進(jìn)入,因?yàn)槲覀冇写罅炕ヂ?lián)網(wǎng)能量,我們進(jìn)入了直播、金融相關(guān)領(lǐng)域,剛剛我們金融也在美國(guó)上市。
從2017年開(kāi)始我來(lái)領(lǐng)導(dǎo)公司往AI這方面做轉(zhuǎn)型,整個(gè)360的業(yè)務(wù)線都會(huì)適用AI來(lái)做業(yè)務(wù)線,更重要的我們?nèi)ツ晖瞥龅陌踩竽X,通過(guò)大量的安全數(shù)據(jù)的分析來(lái)解決這個(gè)安全問(wèn)題。360從2018年回顧到A股,我們的業(yè)務(wù)逐步往安全做轉(zhuǎn)型,具體的公司業(yè)務(wù)我們有三個(gè)大的,第一個(gè)國(guó)家的安全級(jí)涉及到國(guó)家大的安全網(wǎng)絡(luò),后面的兩個(gè)跟今天主題有很大關(guān)系,第一個(gè)城市安全大腦,主要是利用各種傳感器捕捉的集中數(shù)據(jù)解決城市的安全問(wèn)題,從我們過(guò)去的網(wǎng)絡(luò)安全到現(xiàn)在物理安全問(wèn)題,包括行車安全、社區(qū)安全,這也是我領(lǐng)導(dǎo)現(xiàn)在業(yè)務(wù)方向。
另外一個(gè),加了一個(gè)安全大腦業(yè)務(wù),我們認(rèn)為未來(lái)守護(hù)整個(gè)家庭的安全僅僅靠一些硬件是不行的,必須有大量的AI參與,我們的核心能力就是家庭安全大腦,通過(guò)各種傳感器的收集,通過(guò)邊緣的AI計(jì)算能力能夠處理家庭的一些威脅。前面幾個(gè)大腦的核心是構(gòu)建一個(gè)人機(jī)協(xié)同的人工智能。
第一方面通過(guò)數(shù)據(jù)算力發(fā)揮機(jī)器價(jià)值,未來(lái)希望價(jià)值做的事情機(jī)器去做,但是人有不同于機(jī)器很多點(diǎn),包括人的知識(shí)、經(jīng)驗(yàn)創(chuàng)造力,這些是機(jī)器沒(méi)有辦法取代的,所以通過(guò)人機(jī)協(xié)同最近解決我們所面臨的一些問(wèn)題。這里主要指是安全按照。
在實(shí)行過(guò)程中最重要的是選擇芯片,當(dāng)然云知聲也是我們一個(gè)重要合作伙伴,我基本上把市場(chǎng)上幾十家公司的芯片都做了很多測(cè)試對(duì)比研究,其實(shí)在我們這個(gè)芯片選擇過(guò)程當(dāng)中,大概從我們這個(gè)角度而言,我們基本首先考慮我們的場(chǎng)景,這個(gè)人工智能一定要跟場(chǎng)景結(jié)合起來(lái),單純考慮芯片是沒(méi)有意義的。在場(chǎng)景情況下,我需要一個(gè)簡(jiǎn)單的算力,在算力情況下考慮能耗,因?yàn)椴煌牡胤綄?duì)能耗的需求是不一樣的。
對(duì)我而言,對(duì)一個(gè)商業(yè)公司而言價(jià)值也是非常關(guān)鍵的因素,當(dāng)我把前面相應(yīng)的考慮完了之后,就會(huì)考慮價(jià)值,每一個(gè)公司都會(huì)考慮價(jià)值。大家其實(shí)很容易忘到一點(diǎn),工具鏈,我們講一個(gè)產(chǎn)品用到工具連非常重要,整個(gè)產(chǎn)品的架構(gòu),以及整個(gè)成熟度對(duì)我們選擇非常關(guān)鍵。我們?cè)瓉?lái)做的一些模型一些積累能不能在新的芯片上使用,這在我選擇新的過(guò)程當(dāng)中是非常重要的?,F(xiàn)在市場(chǎng)上有幾種,一種是云端訓(xùn)練的,典型的GPO或者谷歌突出的TPO,還有云端推出的一些,現(xiàn)在百花齊放更多是在設(shè)備端的推理上,這里面也列出了國(guó)內(nèi)外一些公司,當(dāng)然云知聲的雨燕也在上面可以看到,這是我選芯的一個(gè)基礎(chǔ)。
其實(shí)從我的角度更多我要考慮的場(chǎng)景,第一個(gè)是我這個(gè)算法的性能,這個(gè)大家可以看到不同的架構(gòu)的處理。第二個(gè)考慮整個(gè)人工智能的成本,這個(gè)當(dāng)然可以看到專用的芯片幾個(gè)方面,成本比較低,在我們很多智能家居,因?yàn)楫a(chǎn)品是比較固定的。我們360重點(diǎn)要實(shí)現(xiàn)幾個(gè)大腦,第一個(gè)是家庭安全大腦,它新的需求響應(yīng)速度,如果你所有都推到云端去做,在網(wǎng)絡(luò)差的情況下,怎么提供更好的體驗(yàn)的時(shí)候,在本地響應(yīng)會(huì)很快。
第二個(gè)安全跟隱私的問(wèn)題,這個(gè)在智能家居里也非常重要,我們?yōu)槭裁醋鲞吘売?jì)算,我們?yōu)槭裁粗攸c(diǎn)強(qiáng)調(diào)芯片問(wèn)題,就考慮安全跟隱私占非常重要一個(gè)方面。第三面可靠性問(wèn)題,網(wǎng)絡(luò)連接一旦發(fā)生問(wèn)題,如果所有處理在云端的話,可靠性是得不到保證的。第四個(gè)整個(gè)成本開(kāi)銷,早期如果芯片價(jià)值比較貴,我把所有都放在云端上,這對(duì)云端的壓力比較大,這實(shí)際是一個(gè)平衡問(wèn)題。整個(gè)智能邊緣要做一個(gè)協(xié)同,再一個(gè)特別是我們安全的時(shí)候?qū)λ惴ǖ慕Y(jié)果要求非常高,比如安全檢測(cè)漏報(bào)率,我們不可以出現(xiàn)漏報(bào)率,當(dāng)然這個(gè)出現(xiàn)也比較低,再一個(gè)其實(shí)我們也意識(shí)到對(duì)于一個(gè)家庭安全而言,不僅僅要能看能聽(tīng)能說(shuō),還有其他的接入你的數(shù)據(jù),這就驗(yàn)證了我們場(chǎng)景對(duì)多模態(tài)的需求,我們要使得場(chǎng)景率大幅度提升。
第三個(gè)成本問(wèn)題,這是講2C這塊。我們講家庭安全大腦,當(dāng)然這個(gè)大腦可能是一個(gè)虛的概念,它將來(lái)硬件可能在智能音響里或者其他設(shè)備里面呈現(xiàn)。再一個(gè)我們面臨2B或者2C的城市安全上,這里提到整個(gè)智慧城市建設(shè)正在經(jīng)歷一個(gè)轉(zhuǎn)型期,什么叫新型的智慧城市建設(shè),這里要強(qiáng)調(diào)怎么樣改變業(yè)務(wù)發(fā)展或者城市管理的的動(dòng)力,從被動(dòng)發(fā)展轉(zhuǎn)變?yōu)橹鲃?dòng)發(fā)展。
第二個(gè)從一些新的技術(shù)手段,使得原來(lái)被動(dòng)管理變成主動(dòng)管理。第三個(gè)我們希望通過(guò)人工智能引入,提高辦事效率,當(dāng)然在整個(gè)方案里,2B跟2C成本沒(méi)有那么大,但是在幾個(gè)方案里還是非常重要的要素。比如說(shuō)我們的攝像頭數(shù)據(jù),我們可能一個(gè)設(shè)備要處理幾百個(gè)攝像頭的數(shù)據(jù),第三依然多模態(tài)的學(xué)習(xí),更多的大數(shù)據(jù)需要進(jìn)行多模態(tài)的處理,第四個(gè)成長(zhǎng)開(kāi)銷,這是我們大概360對(duì)未來(lái)的一個(gè)簡(jiǎn)單的需求,以及一些方案的著眼點(diǎn)。
我們?cè)谶x擇芯片合作伙伴的時(shí)候我們有一些選擇,第一個(gè)場(chǎng)景理解,我們認(rèn)為一個(gè)技術(shù)合作伙伴如果不理解場(chǎng)景,很難提供一個(gè)好的解決方案。在我們選擇過(guò)程當(dāng)中遇到多家公司,他們基本沒(méi)有辦法對(duì)場(chǎng)景進(jìn)行理解。第二個(gè)我覺(jué)得他要提供一個(gè)技術(shù)掌控力,跟先進(jìn)的技術(shù)掌控力是非常明顯的。第三個(gè)很多AI公司為了掌控形成所謂的解決方案綁定的關(guān)系,他把方案做的非常死,你沒(méi)有辦法定義方案的算法,這個(gè)時(shí)候我們強(qiáng)調(diào)方案的靈活性也是非常關(guān)鍵。第四個(gè)方案的殺傷力,這里面玻璃特別看到一個(gè)公司的內(nèi)部,因?yàn)樘貏e是人工智能芯片他更多還有一些運(yùn)營(yíng),所以這個(gè)關(guān)系到硬件、軟件和運(yùn)營(yíng),對(duì)大量的大數(shù)據(jù)的收集處理,這個(gè)其實(shí)是非常重要的。所以數(shù)據(jù)運(yùn)營(yíng)能力也是我們非??粗械狞c(diǎn)。
我在360負(fù)責(zé)整個(gè)公司的技術(shù)體系,我們是實(shí)際測(cè)試的一些結(jié)果,這個(gè)基本涵蓋了業(yè)界最定級(jí)提供語(yǔ)音的解決方案,這是我們真實(shí)測(cè)試出來(lái)的結(jié)果,為了方便,我把這些對(duì)應(yīng)的公司都隱掉了,只有云知聲,云知聲基本在所有的指標(biāo)里面都是第一個(gè),這是我們實(shí)際測(cè)試出來(lái)的結(jié)果。因?yàn)槲以瓉?lái)對(duì)云知聲不是很熟悉,但是真正測(cè)試下來(lái)覺(jué)得云知聲的內(nèi)容非常強(qiáng),我覺(jué)得他們的優(yōu)點(diǎn)主要是幾個(gè)方面。
第一個(gè)對(duì)語(yǔ)音語(yǔ)義的場(chǎng)景理解,可以感覺(jué)在這個(gè)行業(yè)是深耕的,第二個(gè)實(shí)測(cè)表現(xiàn)能力非常強(qiáng),你測(cè)試好我就用你。第三個(gè)跟我們360深度合作的融合性相繼,因?yàn)檫@個(gè)云知聲提供了各種各樣的解決方案,你定制了自己的一些模塊算法包括布局的形態(tài)都做的非常好,這個(gè)靈活性也足夠。第四個(gè)通過(guò)今天發(fā)布會(huì),我也看到云知聲一直以來(lái)技術(shù)的前瞻性和戰(zhàn)略設(shè)計(jì)方面有特點(diǎn),這四點(diǎn)都是符合我對(duì)前面的芯片定位。有一塊就是價(jià)格這塊,其他的我都是非常滿意的。
我們也在做語(yǔ)音芯片的一些集成的測(cè)試,作為合作伙伴來(lái),我其是第一個(gè)恭喜云知聲,云知聲特別的努力,確實(shí)做出了很好的成績(jī)。第二我也向各位來(lái)推薦云知聲,今天簡(jiǎn)單就說(shuō)這么多,謝謝大家!
主持人:感謝穆總的分享。接下來(lái)讓我們有請(qǐng)?jiān)浦晳?zhàn)略伙伴,來(lái)自京東IoT創(chuàng)新硬件的王雅卓總經(jīng)理,有請(qǐng)王總!
王雅卓:首先非常高興也非常榮幸,能夠見(jiàn)證2019云知聲多模態(tài)AI芯片戰(zhàn)略發(fā)布會(huì),接下來(lái)我們介紹一下IOT在科技創(chuàng)造美好這個(gè)場(chǎng)景下現(xiàn)在正在做的和未來(lái)將要做的事。剛才也提到過(guò)去三十年經(jīng)過(guò)了幾個(gè)時(shí)代,互聯(lián)網(wǎng)時(shí)代,移動(dòng)互聯(lián)網(wǎng)時(shí)代以及現(xiàn)在的IOT時(shí)代。
移動(dòng)互聯(lián)網(wǎng)時(shí)代我們當(dāng)時(shí)智能手機(jī),功能手機(jī)的多個(gè)呈現(xiàn),當(dāng)時(shí)我們提比如一款手機(jī)有可能是智能機(jī),可能是功能機(jī),現(xiàn)在大家的手機(jī)都變成了智能機(jī)。IOT時(shí)代,現(xiàn)在是智能設(shè)備和非智能設(shè)備,我相信將來(lái)所有的設(shè)備都是智能設(shè)備。物聯(lián)網(wǎng)現(xiàn)在發(fā)展非常迅速,各行各業(yè)這個(gè)投入也非常大,目前有三個(gè)環(huán)境,大量數(shù)據(jù)沒(méi)有連接形成了數(shù)據(jù)孤島,這是連接層面沒(méi)有做高。第二海量數(shù)據(jù)只是數(shù)字,并沒(méi)有基于數(shù)字創(chuàng)造價(jià)值,公司對(duì)于數(shù)據(jù)的處理能力欠缺。第三數(shù)據(jù)不智能,這也是我們需要加強(qiáng)的。
AI和物聯(lián)網(wǎng)的相互結(jié)合可以促進(jìn)多個(gè)產(chǎn)業(yè)往前發(fā)展,比如智能家具、配送機(jī)器人這些行業(yè)都在無(wú)時(shí)無(wú)刻深入發(fā)展,對(duì)我們的產(chǎn)業(yè)進(jìn)行推動(dòng)。大家更多以為京東是一個(gè)零售公司,但實(shí)際上京東更是數(shù)字經(jīng)濟(jì)與實(shí)體深度融合的企業(yè),過(guò)去京東人臉識(shí)別、無(wú)人車方面都取得非常大成就,同時(shí)京東的技術(shù)從原來(lái)的支撐業(yè)務(wù)現(xiàn)在變成了主導(dǎo)業(yè)務(wù)。
物聯(lián)網(wǎng),物指的是實(shí)體經(jīng)濟(jì),網(wǎng)指的是互聯(lián)網(wǎng)經(jīng)濟(jì),在PC、手機(jī)、AR、VR我們現(xiàn)在實(shí)現(xiàn)了邊聽(tīng)邊買,邊讀邊買,我們現(xiàn)在實(shí)現(xiàn)了移動(dòng)收獲、人臉識(shí)別支付,遠(yuǎn)程投敵,在這些實(shí)現(xiàn)了線上線下融合。在過(guò)去京東很多技術(shù)上實(shí)現(xiàn)了多個(gè)第一,2015年第一臺(tái)多功能音響,2016年第一架鄉(xiāng)村送貨無(wú)人機(jī),2017年第一個(gè)全流程的無(wú)人倉(cāng),2018年首個(gè)機(jī)器人配送站在長(zhǎng)沙試點(diǎn)進(jìn)行,解決了最后一公里的難題。
我們隨著平臺(tái)不斷擴(kuò)大,技能不斷提升,我們?cè)?018年12月份全面升級(jí)了平臺(tái),就是現(xiàn)在的小京魚平臺(tái),覆蓋了物聯(lián)網(wǎng)平臺(tái)、大數(shù)據(jù)平臺(tái)、智能服務(wù)平臺(tái)??匆幌滦【~平臺(tái)的語(yǔ)言技術(shù)、云計(jì)算技術(shù)、圖像識(shí)別技術(shù)以及(英)協(xié)議,(英)協(xié)議我們已經(jīng)為千萬(wàn)級(jí)用戶提供了服務(wù),已經(jīng)工作了四年。應(yīng)用服務(wù)層我們和頭部的兒童的內(nèi)容,包括電臺(tái)還有有聲讀物都形成了非常好合作,目的就是為了給用戶更好的體驗(yàn)。平臺(tái)生態(tài)層,我們和解決方案商、技術(shù)廠商都形成了非常好的合作,能夠把硬件產(chǎn)品快速落地。
京東追求全品類、更多品牌,我們目前京東的品類有200多個(gè),品牌超過(guò)500個(gè),產(chǎn)品超過(guò)2000個(gè),服務(wù)家庭超過(guò)1000萬(wàn),京東同時(shí)擁有AIT最大價(jià)值的數(shù)據(jù)鏈,比如京東高凈值用戶達(dá)到3億多,這部分我們可以拿到精準(zhǔn)用戶畫像,同時(shí)對(duì)用戶需求一個(gè)精準(zhǔn)把控,對(duì)產(chǎn)品進(jìn)行定義。同時(shí)設(shè)備控制次數(shù)達(dá)到5.7億次,這些數(shù)據(jù)可以優(yōu)化傳統(tǒng)功能,我們?cè)诰€時(shí)長(zhǎng)超過(guò)1千億個(gè)小時(shí),這些運(yùn)行的數(shù)據(jù)提供了服務(wù)和質(zhì)量。
看一下小京魚的硬實(shí)體,包括語(yǔ)音識(shí)別達(dá)到90%,自然語(yǔ)言理解能力達(dá)到96%,語(yǔ)音合成達(dá)到90%以上,圖象識(shí)別達(dá)到97%,ARVR模型還原度達(dá)到99%。同時(shí)我們還有全國(guó)最多的技能,滿足用戶的衣食住行各種需求,同時(shí)我們?cè)?2月份發(fā)布了三款產(chǎn)品,包括兩款耳機(jī)還有自己的音響。我們做小京魚這個(gè)產(chǎn)品主要是目標(biāo)是打造有品質(zhì)、有能量、有溫度的產(chǎn)品。有品質(zhì)是指在京東上購(gòu)物的用戶一樣,希望高品質(zhì)的生活。有能量說(shuō)明我們的性能非常強(qiáng)大,能夠給用戶帶來(lái)更多需求。有溫度產(chǎn)品非常智能,能夠讓設(shè)備更加懂你。
小京魚智能也是一個(gè)全面開(kāi)放的平臺(tái),助力行業(yè)重塑提升,為了IOT行業(yè)整體的提升盡自己的努力。我們有最廣泛技術(shù)的布局,包括互聯(lián)互通,邊緣計(jì)算,語(yǔ)音視覺(jué)交互。還有軟硬件一體化平臺(tái),包括物聯(lián)網(wǎng)平臺(tái),大數(shù)據(jù)平臺(tái),智能服務(wù)平臺(tái),還有C端的音響、冰箱、耳機(jī)等等,這些產(chǎn)品同時(shí)也會(huì)給行業(yè)的其他用戶賦能,包括用戶更快的完成自己的產(chǎn)品。同時(shí)我們京東在渠道方面,通過(guò)線上線下的支持也會(huì)把產(chǎn)品打造的更好。因?yàn)楫a(chǎn)品一方面要做的好,還得需要賣的出去才能觸達(dá)到用戶。
京東IOT和云知聲是多年的合作伙伴,基于云知聲在AI芯片以及系統(tǒng)解決方案的能力和優(yōu)勢(shì),我們將和云知聲一道共同構(gòu)建面向零售、家居、車載等多個(gè)場(chǎng)景的AI技術(shù)生態(tài)。我們的愿景是用科技創(chuàng)造美好生活,我們希望讓自己成為讓用戶受益的自由創(chuàng)新者,讓行業(yè)興奮的技術(shù)合作伙伴,同時(shí)助力中國(guó)從制造向智造轉(zhuǎn)變,謝謝大家!
來(lái)源:汽車俱樂(lè)部Plus
本文地址:http://www.cbbreul.com/news/renwu/85347
以上內(nèi)容轉(zhuǎn)載自汽車俱樂(lè)部Plus,目的在于傳播更多信息,如有侵僅請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動(dòng)網(wǎng)(www.cbbreul.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。