AI訓練資料服務第一股海天瑞聲終于迎來了“曙光”。
日前,海天瑞聲釋出2024年半年報顯示,上半年其實作營收9242.63萬,同比增長24.13%;實作淨利潤41.64 萬元,不過同比去年同期的虧損1724.14萬元,扭虧為盈。
其在财報中解釋,主要是因為,而在2023年,其業務整體毛利率顯示為56.01%。
并且其還提到,2024年上半年,受益于大模型技術的快速發展以及應用領域不斷拓展,以智能終端廠商為代表的科技巨頭紛紛加大多模态資料投入,全球資料服務市場持續增長。另外相關法規出台,使得其境外業務大幅增長,拉動公司整體營業收入快速增長。
資料顯示,2024 年上半年,海天瑞聲的境外業務的收入達到4369.53萬元,同比增長50.00%。
資料顯示,海天瑞聲作為大陸領先的AI算法訓練資料與解決方案提供商。其訓練資料業務覆寫智能語音(語音識别、語音合成等)、計算機視覺、自然語言等多個AI核心領域,全面服務于人機互動、智能駕駛、智慧城市等多種創新應用場景。
其業務主要分為智能語音、計算機視覺、自然語言、訓練資料相關的應用服務四大類,其中智能語音業務收入占比超過7成,其次是計算機視覺業務,占比約18%,另外兩大業務占比相對較小。
在2024年上半年,四大業務中智能語音業務和自然語言收入均同比有所增長,其中主力業務智能語音業務收入增幅超過37%。
過去的幾年間,海天瑞聲的業績一直顯得較為艱難,包括智能語音、智能駕駛以及大模型等下遊AI 應用行業的大規模商業化發展也呈現震蕩趨勢。
。
2023年再次出現營收和淨利潤雙跌,淨利潤還出現大幅虧損。
2023年公司實作營業收入1.7億元,較上年同期下降35.33%;歸屬于母公司所有者的淨利潤虧損了3038.52萬元,較上年同期減少203.16%;歸屬于母公司所有者的扣除非經常性損益的淨利潤虧損達到4,347.07萬元,較上年同期減少528.32%;經營性現金流淨額-3,104.62萬元,較上年同期下降201.26%。
在2023年年報中,幾大闆塊的營收均處于下滑态勢,這也導緻了整體業績的下滑明顯。
不過,剛剛跨過盈虧衡點的海天瑞聲,業績能否進一步飄紅還有待觀察。
2022 年底 ChatGPT 的爆火,AI大模型開始席卷各大行業,一時間各網際網路大廠、科技公司、初創企業等都在下場投入大模型,這也帶動全球 AI 産業進入新一輪發展期。
以上趨勢對海天瑞聲來說,将對旗下智能語音、自然語言幾塊業務形成利好。其也在财報中表示,2024 年上半年,受益于大模型技術的快速發展以及應用領域不斷拓展,以智能終端廠商為代表的科技巨頭紛紛加大多模态資料投入,全球資料服務市場持續增長。
根據資料顯示,海天瑞聲的客戶包括阿裡巴巴、Meta、騰訊、百度、位元組跳動、微軟、三星等大型科技公司,另外還包括科大訊飛、商湯科技、雲知聲、海康威視等人工智能企業,以上公司基本上均在AI大模型領域有所部署。
不過觀察目前市場情況,各大大模型企業自身的大模型業務的商業化模式還處于探索階段,很明顯,隻有大模型應用的滲透率達到一定程度,并在各大應用場景中真正落地實作了商業價值,跑通了商業路徑,大模型客戶外購訓練資料的需求才會明顯增長。
這也意味着,資料供應商期待大模型産業拉動相關業務線高速增長,還需要待以時日。
并且,目前AI大模型還需要持續的高投入,這包括研發、人力和算力等各項高額投入也帶來不小的壓力,這從幾家AI客戶的業績也可見一斑。
例如雲從科技2024 年上半年營收1.21億,同比減少26.35%;虧損 3.56億。科大訊飛今年上半年淨利潤虧損4.01億元;而商湯科技今年上半年總收入為人民币17.4億元,同比增長21.4%,上半年淨虧損24.77億元,相比去年同期虧損收窄21.2%。來自下遊應用端的壓力,恐怕也會向上遊供應鍊傳導。
在大模型應用趨勢下,同時也對訓練資料業務也将帶來新的變化和挑戰。
例如大模型範式下的訓練資料與傳統深度學習訓練資料處理方式存在顯著差異,資料标注技術呈現“智能化”,大模型資料服務将更加依賴算法的參與等等。
另外,人工智能技術加速向各産業内深度滲透,對資料處理更加注重專業性,這需要建構面向垂直行業的資料資源等等。
這也意味着,海天瑞聲這類AI訓練資料供應商還需要持續在算法、平台工具更新、大模型資料處理等方面進行大筆的研投入,以及針對各大行業垂直領域進行資源投入等等。
海天瑞聲方面也透露,公司将繼續在大模型資料領域進行研發投入,在大模型領域的部署主要分為兩部分:首先在研發資料生産中使用的大模型工具;其次也在積極打造大模型資料集的矩陣,主要包括通用大模型資料集和行業大模型資料集。在行業資料上,已經研發出汽車、金融、教育、醫療等行業大模型所需的高品質資料集。
例如2023年在公司虧損的情況下,海天瑞聲的研發費用共計5849.09 萬元,占當期營業收入的 34.40%。2023年其還計劃募集資金6.67億元用于“AI 大模型訓練資料集建設項目”和“資料生産垂直大模型研發項目”。
此外,以智能駕駛場景作為核心的計算機視覺業務也被視作海天瑞聲的第二增長曲線。
2023年4月,海天瑞聲推出專為自動駕駛場景設計的全棧式資料标注平台“DOTS-AD自動駕駛資料平台”。官方資料顯示,目前公司至今已服務超過70家智能駕駛領域客戶。
2024年上半年,公司加大了對進階别資料标注工具的研發力度,截至6月底,DOTS-D平台新增 3D動靜分離标注工具,BEV多圖層 4D車道線标注工具,并更新點雲分割工具支援連續幀疊加标注和4D分段加載等核心能力,有效支撐了自動駕駛 BEV和 OCC主流算法演進對資料标注工具的需求。
此外,公司開發了 2D-3D 融合的動靜分離檢測追蹤算法,在點雲連續幀融合産線實作提效 30%以上,疊代優化點雲分割算法和地面檢測算法,在點雲分割産線實作提效 20%以上。
而為進一步支撐自主品牌車企的國際化戰略,公司在全球範圍内擴充了道路采集業務,可提供包括采集方案設計、采集人員組織、車隊管理、車輛改裝及資料清洗與脫敏等在内的全鍊條服務。
2024年上半年,公司采集業務已覆寫包括德國、西班牙、捷克等多個國家,為公司建構智能駕駛全球化資料服務能力奠定了基礎。
在2022年财報中,其首次披露了智能駕駛業務收入情況:2022年,公司智能駕駛業務收入4174.51 萬元,同比增長115.12%; 但在後續的2023年年報和2024年半年報中均未明确披露。不過其在2023年半年報中提到其智能駕駛業務收入同比增長178.96%。
不過2024年半年報中顯示,根據合同分類來自計算機視覺業務的營收資料同比上一年同期的來看,呈現下滑趨勢。