以三年為時(shí)間界限,可以說,自動(dòng)駕駛盈利的時(shí)間節(jié)點(diǎn)近在咫尺。
對(duì)此,王曉剛有兩個(gè)角度的考慮,其一是開源,整車企業(yè)的車型項(xiàng)目越來越多;其二是節(jié)流,“比較重要的是合作的模式,能夠以更高的性價(jià)比的方式去完成交付,實(shí)際上還包括新技術(shù)和新產(chǎn)品的開發(fā)。”
同時(shí),王曉剛認(rèn)為,現(xiàn)階段,市場的競爭態(tài)勢(shì)和虧損的現(xiàn)狀很不合理,導(dǎo)致整個(gè)行業(yè)和智駕領(lǐng)域都存在問題。破局的方法便是避免同質(zhì)化競爭,“要做出既有用戶價(jià)值,還有特色功能的產(chǎn)品出來”。也就是說,“從產(chǎn)品設(shè)計(jì)、技術(shù)發(fā)展路線上,找到自己獨(dú)特的路線和價(jià)值。”
01 AGI將為商湯絕影打開新局面
媒體采訪之前的發(fā)布會(huì)上,商湯絕影發(fā)布了三款產(chǎn)品,分別針對(duì)智艙、智駕和世界模型。
智艙領(lǐng)域,商湯絕影首次發(fā)布智艙座艙大模型創(chuàng)新產(chǎn)品「A New Member For U」(你的家庭新成員)。
王曉剛介紹:“在座艙里面我們的New Member,它的設(shè)計(jì)跟今天市面上大模型的使用是有本質(zhì)的差別,實(shí)際上背后是有很多新技術(shù)的支撐,包括我們對(duì)于產(chǎn)品體驗(yàn)的要求。”
相較以往被動(dòng)接受指令的車機(jī),「A New Member For U」依靠原生流式多模態(tài)大模型、車載類人記憶框架和持續(xù)運(yùn)行框架等前沿AI大模型技術(shù),能夠感知用戶的語音、表情、手勢(shì)、以及環(huán)境數(shù)據(jù),并進(jìn)行深度理解和推理思考,進(jìn)而在車內(nèi)空間與人進(jìn)行主動(dòng)互動(dòng)。
在《人機(jī)對(duì)話交易中的響應(yīng)時(shí)間》的論文中,羅伯特·米勒指出,人類幾乎察覺不到100毫秒以下的延遲。而「A New Member For U」的數(shù)據(jù)延遲控制在1毫秒以下,首包延時(shí)最快只需60毫秒。
在智能駕駛領(lǐng)域,商湯絕影構(gòu)建了「車云一體」的產(chǎn)品矩陣,發(fā)布涵蓋高速、城區(qū)以及泊車等全場景的高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系。
基于J6E、J6M、Orin等不同算力平臺(tái),商湯絕影打造了全場景高階智駕、端到端智駕等絕影量產(chǎn)智駕產(chǎn)品體系?;贘6平臺(tái)的智駕方案預(yù)計(jì)2025年第二季度將量產(chǎn)交付,而量產(chǎn)端到端智駕方案則預(yù)計(jì)會(huì)在明年年底量產(chǎn)落地。
在世界模型方面,商湯科技全新升級(jí)「開悟」世界模型,以此打造堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)設(shè)施。
對(duì)于世界模型來說,其基礎(chǔ)與核心能力便是生成高質(zhì)量視頻數(shù)據(jù)。官方數(shù)據(jù)顯示,在真實(shí)的基礎(chǔ)上,「開悟」生成的場景視頻,時(shí)間最長為150秒、分辨率可達(dá)1080P、視角可以實(shí)現(xiàn)11V。
另外,通過多模態(tài)大模型,「開悟」世界模型可以支持多樣化的自動(dòng)駕駛場景及Corner case的可控生成。目前商湯絕影基于1024類場景,能夠泛化出更多的平行世界,打造了千萬級(jí)的生成場景庫,預(yù)計(jì)2025年對(duì)行業(yè)開放。
王曉剛認(rèn)為:“我們已經(jīng)站在AGI時(shí)代的門口。作為加速智能汽車駛?cè)階GI時(shí)代的戰(zhàn)略合作伙伴,商湯絕影將牢牢把握住新一輪智能汽車變革的時(shí)間窗口,與車企伙伴進(jìn)行全方位深度合作,共享大算力與大模型,共建數(shù)據(jù)基礎(chǔ)設(shè)施,共同打造智能汽車大模型創(chuàng)新應(yīng)用。”
02 數(shù)據(jù)很重要
進(jìn)入AGI時(shí)代,數(shù)據(jù)的重要性愈發(fā)明顯。
王曉剛表示:“傳統(tǒng)的是模塊化分工,Tier-1負(fù)責(zé)集成,作為整體黑盒標(biāo)準(zhǔn)化的交付;但是未來在端到端自動(dòng)駕駛到來的時(shí)候,更多是要依賴數(shù)據(jù)的驅(qū)動(dòng)。”
如何解決數(shù)據(jù)數(shù)量、質(zhì)量和完備性的問題?
王曉剛分析:“過去一年多的發(fā)展,實(shí)際上大模型在快速發(fā)展的時(shí)候是把互聯(lián)網(wǎng)上公開的數(shù)據(jù)價(jià)值快速榨取了?;ヂ?lián)網(wǎng)上的數(shù)據(jù)已經(jīng)被用到了。新的數(shù)據(jù)很大方向就是垂直行業(yè)里面,比如說在自動(dòng)駕駛里面采集的各種數(shù)據(jù),端到端自動(dòng)駕駛。”
對(duì)此,王曉剛強(qiáng)調(diào):“有新的數(shù)據(jù),才能實(shí)現(xiàn)新的突破。”
然而,作為整車使用過程中的一部分,數(shù)據(jù)與汽車企業(yè)的關(guān)系要比Tier 1企業(yè)更進(jìn)一步。因此,王曉剛判斷:“數(shù)據(jù)就在主機(jī)廠手里,所以誰能夠更接近數(shù)據(jù),誰就能夠在未來發(fā)展過程當(dāng)中占據(jù)主動(dòng)。”
數(shù)據(jù),不僅是企業(yè)智能化發(fā)展的必備資源,也將是改變市場格局的決定因素。
“以前大家關(guān)注的,誰的算法比較先進(jìn)或者有沒有芯片,能不能進(jìn)行垂直的整合,這四家(地平線、大疆、華為、Momenta)可能多多少少都有類似的特點(diǎn)。” 王曉剛分析,對(duì)比前后兩個(gè)時(shí)段,競爭因素正在發(fā)生變化。
“接下來端到端最核心的點(diǎn),不一定是軟硬一體或者進(jìn)行垂直整合,而是數(shù)據(jù)。誰離數(shù)據(jù)最近,誰的數(shù)據(jù)基礎(chǔ)設(shè)施最強(qiáng),誰能把這些數(shù)據(jù)基礎(chǔ)設(shè)施鋪到主機(jī)廠,誰在未來發(fā)展和競爭當(dāng)中就有主動(dòng)權(quán)。”
基于此,王曉剛判斷,市場格局將會(huì)因此而改變。
“今天畢竟還是技術(shù)驅(qū)動(dòng)的行業(yè),當(dāng)技術(shù)發(fā)生變革的時(shí)候,這里面生產(chǎn)力核心要素就會(huì)發(fā)生變化,這也意味著給市場上競爭的態(tài)勢(shì)帶來新的變化。”
目前,商湯絕影通過實(shí)車采集和仿真生成兩種方式解決數(shù)據(jù)數(shù)量的問題。對(duì)于仿真幻覺導(dǎo)致數(shù)據(jù)質(zhì)量不足的問題,商湯絕影的方式是提前干預(yù)。
王曉剛介紹:“所謂幻覺的問題,跟模型訓(xùn)練的方式還是密切相關(guān)的。我們說語言模型,多模態(tài)模型,它實(shí)際上也都存在幻覺的問題,但是我們?cè)跀?shù)據(jù)準(zhǔn)備,輸入監(jiān)督信號(hào),事件模型,輸入的時(shí)候不光是用自然語言做這些描述去生成視頻,這里面還會(huì)給它非常精準(zhǔn)的信號(hào)。”
03 數(shù)據(jù)基礎(chǔ)設(shè)施更重要
從動(dòng)態(tài)發(fā)展的角度,數(shù)據(jù)基礎(chǔ)設(shè)施將是比數(shù)據(jù)更為重要的競爭要素。
王曉剛強(qiáng)調(diào):“如果更加準(zhǔn)確的來說,數(shù)據(jù)并不是最關(guān)鍵的,而是數(shù)據(jù)的基礎(chǔ)設(shè)施和數(shù)據(jù)管線是最重要的。”
是因?yàn)椋?ldquo;有效的數(shù)據(jù)是隨著算法的變化而變化的。我永遠(yuǎn)不可能去存儲(chǔ)最原始的數(shù)據(jù)。因?yàn)闊o論是通訊,還是存儲(chǔ)成本都太高了。算法和模型變的時(shí)候,提取數(shù)據(jù)的方式就會(huì)發(fā)生變化。”
因此市場競爭的底層邏輯便指向:“你只要有這樣一套有效的數(shù)據(jù)生產(chǎn)的管線隨時(shí)隨地都可以有新的數(shù)據(jù)高效地引進(jìn)來。”
在這個(gè)邏輯指引下,商湯絕影與奇瑞大卓、東風(fēng)汽車分別在智駕和智艙領(lǐng)域建立戰(zhàn)略合作關(guān)系,共享數(shù)據(jù)資源。
基于此的戰(zhàn)略合作,將帶來兩個(gè)明顯的改善。
其一,節(jié)約資源。王曉剛認(rèn)為:“很多是重復(fù)性的投入,這就在于基礎(chǔ)的設(shè)施數(shù)據(jù),大家沒有進(jìn)行對(duì)齊。今天之所以會(huì)出現(xiàn)成本高的問題,在于機(jī)制上大家合作的模式。”
王曉剛強(qiáng)調(diào),現(xiàn)階段的競爭方式不具備可持續(xù)性。以商湯科技為例,“像大模型,商湯在這方面累計(jì)投入超過100個(gè)億,后面還會(huì)持續(xù)在這方面投入,那任何一家公司在這里面,如果在基礎(chǔ)設(shè)施方面持續(xù)投入的話也是難以承受的。”
因此,王曉剛建議:“大家要找到自己的定位,形成比較有效的合作,而不是惡性競爭和取代的關(guān)系。這樣的話才能夠達(dá)到共贏共生,長久持續(xù)的發(fā)展。”
其二,高效協(xié)同。王曉剛介紹:“我們跟主機(jī)廠和自研團(tuán)隊(duì)的協(xié)同,重要的是我們能夠提供基礎(chǔ)算力和數(shù)據(jù)平臺(tái)化能力,包括工具鏈。我們要能夠去對(duì)齊數(shù)據(jù)生產(chǎn)的標(biāo)準(zhǔn)和算法的架構(gòu)。”與此同時(shí),王曉剛還強(qiáng)調(diào):“如果這些東西對(duì)不齊的話,在不同車型上采集的數(shù)據(jù)是沒有辦法進(jìn)行兼容的。”那么,人工智能發(fā)展的底層基礎(chǔ)也將不復(fù)存在。
以商湯絕影與奇瑞大卓的合作為例,王曉剛介紹:“如果我們跟主機(jī)廠自研團(tuán)隊(duì)在數(shù)據(jù)、工具鏈、算法架構(gòu)上對(duì)齊以后,當(dāng)涉及到具體交付車型的時(shí)候,大家就會(huì)比較靈活。有的時(shí)候你可以多做一點(diǎn),有的時(shí)候我來多做一點(diǎn)。”
唯此,汽車領(lǐng)域的智能化,才能形成技術(shù)、產(chǎn)品、商業(yè)三者協(xié)同進(jìn)化的良性發(fā)展。