天天看點

商湯科技釋出“日日新5o”,實時多模态流式互動對标GPT-4o

2024年7月5日,上海——2024世界人工智能大會暨人工智能全球治理進階别會議(WAIC 2024)戰略合作夥伴商湯科技召開“大愛無疆·向新力”人工智能論壇,釋出國内首個所見即所得模型“日日新5o”,互動體驗對标GPT-4o,實作全新AI互動模式。

通過整合跨模态資訊,基于聲音、文本、圖像和視訊等多種形式,國内首個所見即所得模型“日日新5o”帶來一種全新的AI互動模式,即實時的流式多模态互動。現場也為大家展示了這種創新互動模式——

從業人員剛開始僅是和“日日新5o”打個招呼,它就自動識别出從業人員脖子佩戴的胸卡帶子上的字眼,判斷出現場就是世界人工智能大會會場,并表示在這個地方可以“好好學習”。

商湯科技釋出“日日新5o”,實時多模态流式互動對标GPT-4o

接下來從業人員拿了一隻可愛小狗玩偶,“日日新5o”準确描述了小狗的外貌、表情以及重要穿戴——一個帶着印有商湯科技logo白帽子,很給主場人排面。

商湯科技釋出“日日新5o”,實時多模态流式互動對标GPT-4o

再上些難度,随便翻開一本書的任何一頁,“日日新5o”都能自動介紹,不是簡單的OCR識别文字,而是識别圖文給出好了解的總結,這一切在瞬間即可完成,真正做到實時互動。

商湯科技釋出“日日新5o”,實時多模态流式互動對标GPT-4o

從業人員還現場發揮了“畫功”,随手畫了一隻簡筆畫小兔子,“日日新5o”直呼畫得可愛,而後從業人員又畫了一個微笑表情,它從這個平靜的表情中捕捉到了笑意,從業人員又改了一筆把嘴巴畫大增添了舌頭,“日日新5o”看到後立馬說道這表情開心多了。

能聽會看更會找話題,就如同真人聊天一般的交流對話,這種互動模式特别适用于實時對話和語音識别等應用,其多任務适應性強,能夠在同一模型中自然處理多種任務,且根據不同上下文自适應調整行為和輸出,能夠實作對标GPT-4o的互動體驗正是源于“日日新5.5”基礎模型能力的全面提升。

今年4月釋出的“日日新5.0”是國内首個對标GPT-4 Turbo的國産大模型,短短兩個多月時間,全新“日日新5.5”體系迎來多項更新,綜合性能較“日日新5.0”平均提升30%,在數學推理、英文能力和指令跟随等能力明顯增強,互動效果和多項核心名額實作對标GPT-4o。

商湯科技釋出“日日新5o”,實時多模态流式互動對标GPT-4o

“日日新5.5”采用混合端雲協同專家架構,最大限度發揮雲邊端協同,降低推理成本,模型訓練基于超過10TB tokens高品質訓練資料,包括大量合成的思維鍊資料,提升推理思維能力。

商湯科技釋出“日日新5o”,實時多模态流式互動對标GPT-4o

為了讓更多企業使用者低門檻接入并使用“日日新”大模型體系的強大能力,商湯于近期推出了“大模型0元Go”計劃。凡是“日日新”的新注冊使用者,都可獲得涉及調用、遷徙、訓練等多項免費服務大禮包。同時,商湯還将免費贈送5000萬Tokens包,并且派出專屬搬家顧問,幫助OpenAI使用者實作零服務成本遷移。

繼續閱讀