擊敗Gemini-1.5-Pro、GPT-4V，從容大模型多模态能力跻身全球前三

作者：機器之心Pro 2024-06-28 18:36:00

機器之心報道

機器之心編輯部

近日，雲從科技從容大模型在綜合評測權威平台 OpenCompass 的多模态評測領域中取得重大進展。

最新評測結果顯示，雲從科技的從容大模型在該體系中的平均得分為 65.5，這一成績使得從容大模型跻身全球前三，超越了谷歌的 Gemini-1.5-Pro 和 GPT-4v，僅次于 GPT-4o（69.9）和 Claude3.5-Sonnet（67.9）。

而在國内市場，從容大模型的成績也超過了 InternVL-Chat（61.7）和 GLM-4V（60.8），排名首位。

擊敗Gemini-1.5-Pro、GPT-4V，從容大模型多模态能力跻身全球前三

圖 1：OpenCompass 多模态榜單

OpenCompass 大模型開放評測體系是上海人工智能實驗室推出的完整開源可複現的評測架構。OpenCompass 多模态評測方面采用了 8 個具有代表性的資料集，從多種視角客觀量化多模态大模型的能力，評估次元覆寫目标檢測、文字識别、動作識别、圖像了解和關系推理、藝術與設計、商業、科學、健康與醫學、人文與社會科學、技術與工程、數學推理等多個方面。

圖 2：從容大模型 - 2.0 多模态能力示例

在本次測評中，從容大模型在其中的 6 個資料集表現優異，排名國内第一（MMbench、MMStar、MathVista、HallusionBench、AI2D、OCRBench），尤其是在 OCRBench 測試集上以取得全球最高的 827 分（總分為 1000 分），且高于第二名 GLM-4v 13 分，進一步提升從容大模型在文本識别、以文本為中心的視覺問答、面向文檔的視覺問答、關鍵資訊提取等業務場景下的适用性。

圖 3：OpenCompass 中國大模型能力展示

從容大模型在此體系中的優秀表現，依賴雲從科技自研的高效多模态處理架構和先進的計算技術，實作了高效的多模态資料處理能力，能夠在視覺和語言任務之間實作高效的融合和切換，并最大化利用計算資源，保證在處理大規模多模态資料時仍能保持較高的性能和響應速度，使得模型的訓練過程更加高效，收斂速度更快，性能更穩定。

同時也得益于雲從科技長期在視覺、語言領域的深厚積累和不斷創新。

圖 4：從容大模型 - 2.0 多模态能力示例

此前，從容大模型已在視覺、跨模态領域 10 次重新整理世界紀錄，綜合性能經第三方 SuperClue、C-Eval 等綜合評測，位列全球前五。

作為一家專注于人機協同技術研發的平台企業，雲從科技一直在積極推動 AI 智能體及大模型技術的發展和應用。

随着人工智能技術的迅猛發展，多模态大模型已成為驅動産業變革的核心引擎。此次從容大模型在 OpenCompass 大模型開放評測體系中的出色表現，不僅是對雲從科技技術創新實力的認可，更在業界樹立典範，激勵全球科技企業在新一輪的人工智能競争中勇攀高峰。

擊敗Gemini-1.5-Pro、GPT-4V，從容大模型多模态能力跻身全球前三

繼續閱讀

JFrog 收購 Qwak AI，緻力于簡化AI模型從開發到生産的全流程

周一分享（二百六十四）：《二型模糊廣義TODIM法》模型的應用

大模型訓練檢查點寫入速度相比 PyTorch 加快 116 倍！

大語言模型，如何賦能測試？| TF136回顧

計算機行業深度研究：全球大模型将往何處去？

企業建構AI大模型應用的步驟流程與關鍵問題解析

2024世界人工智能大會五大看點：25款人形機器人亮相，大模型繼續“湧現”

大模型引領行業革命：探索AI助手與AI

AI大模型颠覆視訊剪輯：Captions AI揭秘

外媒稱中國沙漠現F35模型，機場布滿彈坑，或已模拟攻擊日本本土

馬斯克：Grok 2模型将在8月推出丨「騰訊元寶」上線深度AI搜尋

WOT全球技術創新大會圓滿閉幕：在大模型、AIGC賽道持續狂奔

中考實體液體壓強重要模型

國産大模型即将決戰

IBM推出創新架構用“黑盒”方式，評估大模型的輸出

神經元新計算模型或産生更強大AI