智能座艙的演進,本質(zhì)上是一場關于人車關系的重構。
過去幾年,伴隨著智能化的快速普及,中國智能汽車市場經(jīng)歷了從“屏幕大、芯片強”的硬件競賽,到“可見即可說、連續(xù)對話”的語音普及。然而,一個現(xiàn)實的痛點始終存在:用戶仍然需要遷就機器——記住固定喚醒詞、背誦標準指令、分步驟下達任務。
座艙更像一個聽話的工具,而非懂人的伙伴。與此同時,行業(yè)滲透率數(shù)據(jù)一路走高,但用戶粘性和滿意度并未同步提升,根本原因就在于:大多數(shù)所謂的智能座艙仍停留在被動響應層面,缺乏對復雜意圖的理解力、跨場景的規(guī)劃力,以及基于感知的主動服務能力。
更深層的挑戰(zhàn)來自兩個方向。一是技術落地鴻溝:大模型上車口號響亮,但云端依賴帶來的延遲和隱私隱患、端側(cè)算力和模型大小的平衡、多模態(tài)感知和執(zhí)行閉環(huán)的打通,都是亟需跨越的關卡。二是全球化新課題:中國汽車出口量躍居世界第一,但智能座艙的“出?!保h不止語言翻譯那么簡單,不同文化背景下的交互習慣、語義理解偏差、本地生態(tài)服務缺失等,都會讓說得對、聽得懂、融得進成為新的競爭壁壘。
圖片來源:科大訊飛(下同)
在這樣的產(chǎn)業(yè)深水區(qū),單純的功能堆疊已無法構建差異化,行業(yè)需要的是系統(tǒng)級的智能體能力——即從感知-理解-決策-執(zhí)行到主動服務的完整閉環(huán)。而構建這一閉環(huán),恰恰需要底層大模型的深度賦能、多模態(tài)感知的量產(chǎn)落地、軟硬一體的聲學創(chuàng)新,以及全球化交互的本地化適配。
科大訊飛在北京車展上給出的答案,正是從以上維度同時發(fā)力:星火新一代多模態(tài)智能座艙提供端側(cè)多模態(tài)大模型和智能體生態(tài),讓座艙從聽話的工具進化為“會辦事的管家”;iFLYSOUND氮化鎵母帶級聲學系統(tǒng)及超30項全鏈自研的車載音頻算法,以軟硬一體方案重塑車載聽覺體驗,讓聲音從聽個響升級為百變聲活空間;海外星火大模型則打通了語言和文化的壁壘,為中國智能汽車出海掃清交互障礙。
科大訊飛此次發(fā)布的新品,共同構成了對行業(yè)命題的系統(tǒng)性回應——讓智能座艙真正回歸“服務人”的本質(zhì)。這背后,是星火大模型從通用能力向車端深度定制的遷移,是端側(cè)多模態(tài)技術從實驗室走向量產(chǎn)平臺的突破,也是國產(chǎn)聲學供應鏈從替代走向引領的縮影。
星火大模型雙線布局——國內(nèi)座艙“會辦事”,海外交互“融得進”
要理解星火新一代多模態(tài)智能座艙的升級,首先要厘清一個當前行業(yè)認知的誤區(qū):語音交互的智能化程度,并不取決于對話的流暢度,而取決于系統(tǒng)對用戶真實意圖的理解深度。過去幾年,不少企業(yè)都宣稱實現(xiàn)了“可見即可說”、“連續(xù)對話”的能力,但這些能力本質(zhì)上都是建立在大量預置指令模板和有限狀態(tài)機之上的,用戶依舊需要用機器能聽懂的方式說話,只是模板數(shù)量變多了、對話輪次變長了,這種模式走到今天,邊際效益已經(jīng)遞減——無論怎么擴充指令集,總會有用戶的口語表達落在覆蓋范圍之外的情況。
星火新一代多模態(tài)智能座艙引入的端側(cè)多模態(tài)大模型SparkAuto-EMM,則是從底層改變這一邏輯,不是通過擴充模板來記住更多說法,而是通過大模型對語義的表征能力,去理解用戶一句話背后的真實需求。例如車控自由說:當用戶說有點悶時,系統(tǒng)會結合車內(nèi)外溫度、車窗狀態(tài)、天氣情況、甚至用戶的歷史偏好,判斷應該開窗還是開空調(diào),這背后涉及模糊語義消歧、上下文感知、多模態(tài)信息融合等一系列的綜合能力。
更值得關注的是端側(cè)部署的產(chǎn)業(yè)意義。
大模型上車有兩種路徑:云端和端側(cè)。云端方案能力上限高,但代價是網(wǎng)絡依賴和隱私風險,而且在地下車庫、隧道、高速等信號不穩(wěn)定的場景下,云端方案隨時可能失效。端側(cè)方案則是將所有計算鎖定在車機內(nèi),斷網(wǎng)可用,數(shù)據(jù)不出車,從架構上解決了云端部署的核心痛點。
當然,端側(cè)部署會面臨算力和模型大小的矛盾。一輛經(jīng)濟型車的座艙芯片可能只有幾TOPS的算力,旗艦車型則可能有幾十甚至上百TOPS,對此科大訊飛的解決方案是提供0.5B到7B的階梯式模型矩陣,不同算力平臺可以裁切出最合適的版本。
而且傳統(tǒng)語音系統(tǒng)只能處理單步指令,但真實的用戶需求往往是多步驟、多條件的。比如用戶給出一條指令:“先加油再去機場,路上找一家川菜館”,系統(tǒng)需要拆解出三個子任務,查詢沿途加油站和餐廳的信息,考慮路線順序,還要結合用戶偏好排序。這種復雜任務規(guī)劃,既需要大模型對自然語言的理解,也需要與地圖、興趣點搜索等外部服務的實時交互,本質(zhì)上是“理解-規(guī)劃-執(zhí)行”三個環(huán)節(jié)的閉環(huán)。星火新一代多模態(tài)智能座艙在這一層面的突破,讓智能座艙首次具備了類似智能助手的任務編排能力。
智能體生態(tài)則是星火座艙將“辦事”能力延伸到車外服務的關鍵。通過與超50家頭部生態(tài)伙伴的合作,科大訊飛構建了三層智能體架構:第一層圍繞高頻剛需場景,自研或深度定制精品智能體,一站解決全家出行中的娛樂和信息需求;第二層深度集成生態(tài)伙伴面向車端優(yōu)化好的多端通用智能體,典型代表是美團生態(tài)的三大高頻場景——美食推薦、智能排號、在線訂座,用戶從發(fā)現(xiàn)餐廳到完成預約,全程在座艙內(nèi)閉環(huán),無需切換手機;第三層面向長尾場景,以解決方案形式集成優(yōu)質(zhì)生態(tài)智能體,保證能力邊界的可擴展性。
智能體生態(tài)的核心價值——不是簡單的應用商店或語音喚醒第三方App,而是以大模型為調(diào)度中樞,將不同智能體的能力按需組合,響應用戶的復合意圖。與消費級AI產(chǎn)品的泛化能力不同,科大訊飛的智能體生態(tài)完全圍繞車載場景設計:駕駛場景下交互時間極短,需要首輪命中率高、任務路徑短;安全要求也更高,不能因處理長尾請求而分散駕駛注意力;網(wǎng)絡環(huán)境復雜,需要有支持離線或弱網(wǎng)下的方案。這些約束條件,決定了車載智能體生態(tài)不能簡單移植互聯(lián)網(wǎng)產(chǎn)品的邏輯,而必須基于對真實駕駛行為的長期理解進行定制。
再將視線轉(zhuǎn)向海外。中國汽車出口量已經(jīng)躍居全球前列,但智能座艙的出海遠未成熟。這方面,不少企業(yè)的做法是,將國內(nèi)的語音方案翻譯成目標語言,然后直接部署,結果得到的用戶反饋往往是“系統(tǒng)說得很標準,但就是不像人話”——因為語言不只是詞匯和語法,還有文化語境、使用習慣、甚至禮貌程度。
海外星火助理的差異化在于,它從底層構建了一套母語級交互體系。32種語言,60個國家和地區(qū),100多款明星車型的量產(chǎn)交付,中國出海前?的?企中,8家已經(jīng)科大訊飛合作,這些數(shù)字說明的不僅僅是覆蓋范圍,更是經(jīng)過大批量驗證的可靠性。52個高質(zhì)量TTS發(fā)音人、全部由母語者構建的語料庫、多輪專家交叉校驗,這些細節(jié)保證了地道性,而非簡單的正確性。更深一層,海外星火助理還整合了全球主流車機生態(tài),從導航到音樂,從體育到新聞,讓用戶獲得的是熟悉的本土數(shù)字生活體驗,而非一個“外國車”的生硬界面。
星火大模型在國內(nèi)的任務是讓座艙“能辦事”,在海外的任務則是讓中國汽車“被接納”,兩條戰(zhàn)線共享同一套底座,卻針對完全不同的場景做了深度定制。這種能力不是靠一個通用大模型就能實現(xiàn)的,它要求團隊既懂AI,又懂汽車,還懂全球各地的用戶差異,這也是科大訊飛區(qū)別于僅僅將通用大模型套殼上車的消費級AI產(chǎn)品的核心能力所在。
AI音效新物種,讓普通車也能擁有百萬級聽享體驗
如果說座艙交互的智能化是軟件定義的體現(xiàn),那么車載音響的變革則更需要軟硬一體的思維。
車載音響行業(yè)長期存在一個潛規(guī)則:好聲音與高價格強綁定,過去行業(yè)內(nèi)普遍的認知是,只有豪華品牌的高配車型,或者選裝了知名品牌音響的車型,才能獲得“好聽”的體驗。這種認知背后,既有品牌溢價的商業(yè)邏輯,也有硬件成本和技術門檻的現(xiàn)實約束??拼笥嶏w此次發(fā)布iFLYSOUND的核心價值就在于,不是開發(fā)了又一款所謂的高端音響,而是帶來了一套打破了價格和體驗正相關關系的技術方案。
傳統(tǒng)車載功放多采用硅基MOSFET器件,受限于材料特性,功率密度較低,要實現(xiàn)高保真大功率輸出,往往需要增大體積和散熱結構,導致重量和成本同步攀升。氮化鎵(GaN)作為新一代半導體材料,具有更高的工作頻率和轉(zhuǎn)換效率,在消費電子領域已經(jīng)得到驗證,但在車載領域的大規(guī)模應用,面臨車規(guī)級可靠性、成本控制和系統(tǒng)集成的多重挑戰(zhàn)。
科大訊飛的做法沒有停留在器件替換的思路上,而是從系統(tǒng)架構層面重新設計——將氮化鎵的優(yōu)勢和車載場景的特殊需求進行了深度適配,通過芯片協(xié)同、算法優(yōu)化和散熱創(chuàng)新等,逐一打通了從器件到系統(tǒng)的落地瓶頸。
科大訊飛采用ARM+ADSP協(xié)同的SOC架構,配合首創(chuàng)的氮化鎵音頻功放架構,實現(xiàn)了單通道300W的峰值輸出,足以驅(qū)動8歐姆影院級重低音單元。紅寶石薄膜電容/電感技術再加上低密度翅片專利散熱設計的應用,相比傳統(tǒng)方案,在實現(xiàn)音質(zhì)提升20%、重量降低30%的前提下,還能有效縮減硬件成本?;诖?,高保真音響不再是成本無上限的旗艦車型才能擁有的配置,主流車型也可以在有限的BOM成本內(nèi),獲得母帶級的還原能力。行業(yè)首個QQ音樂臻品音質(zhì)認證,更是從第三方角度驗證了iFLYSOUND的硬件素質(zhì),已經(jīng)達到高解析度音頻的播放標準。
硬件提供了性能底座,算法則負責將這些硬件能力轉(zhuǎn)化為用戶可感知的體驗價值。
iFLYSOUND全鏈自研了超過30項車載音頻算法,覆蓋從麥克風收音、主動降噪、聲場重建到揚聲器驅(qū)動的全鏈路。而“好聽、好用、好玩”的三層框架,進一步擴展了車載音響的智能邊界。
傳統(tǒng)音響只負責播放聲音,iFLYSOUND則是將聲音作為座艙體驗的調(diào)節(jié)變量,音樂廳模式追求真實聲場還原,電影院模式則強化低頻和人聲,營造沉浸感,不同模式服務于不同的內(nèi)容類型。
好用層面,聲場分區(qū)解決了車內(nèi)多用戶的需求沖突——駕駛者需要導航語音,乘客想聽音樂,通過獨立音區(qū)互不干擾。聲場智導則是一個與駕駛安全強相關的創(chuàng)新:給導航和警示音賦予方位感,用戶通過聽覺就能判斷轉(zhuǎn)向方向或風險來源,減少對視覺的依賴。
在好玩層面,無麥K歌、露營空間、隨行DJ等功能豐富了座艙的社交和娛樂屬性。以隨行DJ為例,AI可以根據(jù)駕駛節(jié)奏、車速、油門深度等實時數(shù)據(jù)自動混音,讓音樂和駕駛行為產(chǎn)生動態(tài)呼應,實現(xiàn)的是從播放器到創(chuàng)作者的身份轉(zhuǎn)變。
市場數(shù)據(jù)提供了驗證:iFLYSOUND已落地超過120萬輛車,北京車展上發(fā)布的魏牌V9X、東風日產(chǎn)NX8、2026款極氪007GT、奇瑞星途EX7、奇瑞風云T9L、昊鉑S600等新車也都搭載了相關技術。
將座艙交互和車載聲學放在一起看,會發(fā)現(xiàn)一條清晰的線索:科大訊飛構建的是一個從聽懂到辦好再到體驗好的完整閉環(huán)。星火大模型負責理解用戶意圖并調(diào)動能力執(zhí)行任務,iFLYSOUND負責提供高品質(zhì)且可變化的感官體驗,兩者共同支撐起主動式AI座艙的價值主張——不是等用戶下達指令,而是在用戶表達感受、甚至尚未表達時,就能提供恰當?shù)姆蘸头諊?/p>
小結:
如果展開過去二十余年的時間軸,會發(fā)現(xiàn)一個更本質(zhì)的事實:科大訊飛在汽車行業(yè)的角色演變,始終與智能座艙的技術迭代同頻。從最早的語音合成上車,到成為國內(nèi)車載語音市場的份額領先者,再到今天端側(cè)大模型和全棧聲學系統(tǒng)的量產(chǎn)落地,這條路徑不是跨界者的突襲,而是長期主義者的持續(xù)深耕。
與許多互聯(lián)網(wǎng)公司或AI創(chuàng)業(yè)公司不同,科大訊飛對汽車行業(yè)的理解,建立在數(shù)百萬輛量產(chǎn)車的交付、數(shù)億條真實交互數(shù)據(jù)的反饋、以及無數(shù)個與車企聯(lián)合攻關的工程難題之上,而這些認知,都是時間和場景共同沉淀的壁壘。
科大訊飛積累的不是某一項技術的先發(fā)優(yōu)勢,而是對汽車行業(yè)規(guī)則、車規(guī)級工程要求、用戶真實駕駛場景的系統(tǒng)性理解。與那些將通用大模型簡單封裝后推向車市的消費級AI產(chǎn)品相比,科大訊飛更知道方向盤后的用戶在高速行駛時需要多短的交互路徑,知道夜間駕駛時語音反饋的音量和亮度應該如何變化,知道海外不同地區(qū)的用戶對“禮貌程度”和“語速”有著截然不同的期待??拼笥嶏w的核心價值就在于,把大模型這一通用能力,重新打磨成了一款真正懂車、懂駕駛者、懂全球用戶的車規(guī)級智能體。
科大訊飛此次北京車展上發(fā)布的產(chǎn)品,共同傳遞出一個清晰的信號:智能座艙的競爭已經(jīng)進入系統(tǒng)級智能體能力的比拼時代。單點功能的堆砌無法構建核心競爭力,只有將理解、規(guī)劃、執(zhí)行、感知、情感等能力深度融合,才能讓座艙從冰冷的硬件,進化為有溫度的數(shù)字伴侶。
來源:第一電動網(wǎng)
作者:蓋世汽車
本文地址:http://www.cbbreul.com/news/shichang/297438
以上內(nèi)容轉(zhuǎn)載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉(zhuǎn)載內(nèi)容并不代表第一電動網(wǎng)(www.cbbreul.com)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權請聯(lián)系admin#d1ev.com(#替換成@)刪除。