天天看點

智能輔助标注——資料标注領域新突破

作者:Coovally之AI科普君

資料标注是對未處理的非結構化初級資料,包括語音、圖檔、文本、視訊、點雲等,通過人工智能訓練師進行加工處理,并轉換為機器可識别資訊的過程。原始資料一般通過資料采集獲得,随後的資料标注相當于對資料進行加工,然後輸送到人工智能算法和模型裡完成調用。

資料标注的發展

人工智能産業的發展,帶動了資料标注的蓬勃興起。随着算法模型的不斷優化和應用場景需求的不斷提高,機器所需的資料品質和精度也越來越高,同時也将成為未來競争的核心優勢。

常見的報道中,資料标注總被描述為“血汗工廠”,這項工作和從業者被描述得廉價低質,人被重複性機械式的勞動異化。随着産業的發展變化,人們也逐漸意識到人工智能資料及其采集标注工作卻極其重要,是人工智能建設的基礎養料,是重中之重,随之對資料标注的這種刻闆印象也逐漸被打破。

目前這種大量的人工标注是有價值的,因為理論上解決問題很難,但有了大量資料,設計深度學習網絡,可以在特定場景特定應用中用資料訓練神經網絡,進而在很多場景中可以讓AI快速落地占領市場、驅動行業應用、促進行業更新和疊代。然而随着人工智能産業的不斷深化,如何減少這種靠人力堆積的資料标注必将是未來的趨勢。

智能輔助标注——資料标注領域新突破

資料标注的核心需求

1. 資料品質

監督學習下的深度學習算法訓練十分依賴于标注資料,資料集品質的高低将直接決定算法模型的效果。然而,目前資料标注行業存在很嚴重的資料品質問題。需求方希望資料服務公司可以提高首次傳遞項目的準确率,并大幅減少返工情況。

2. 服務效率

目前資料标注行業主流的項目營運方式是以“衆包”以及“轉包”為主,資料服務企業很難對标注團隊做到直接有效的管理,是以項目延期成為了一種常态。對于需求方來說,項目延期意味着在激烈的商業競争中喪失先發優勢,是以對于需求方來說,希望資料服務公司擁有高效的項目執行系統,提高工作效率,可以按時甚至提前完成項目。

3. 資料安全

資料标注行業的特殊性意味着要經常接觸到很多敏感的資料,比如人臉資料、車牌資料等等,這些資料的存儲、傳輸等對于安全性的要求極高。是以,需求方希望基礎資料服務商有明确具體的安全管理流程,對資料傳輸、存儲,以及結項後的資料銷毀等環節足夠重視。

4. 管理能力

“衆包”以及“轉包”模式下,管理能力較弱的公司很難在兼顧多個項目時做到精力集中、高品質地服務客戶,這樣的後果就是項目延期、資料品質差。是以,需求方希望資料服務企業能夠建立完善的内部管理流程,優化項目流程體驗,達到效率與品質的雙提升。

5. 服務能力

資料标注業務從本質上來講也屬于一種服務業務,從項目對接到最終項目的完結,每一個環節都需要需求方與資料服務企業不斷地商讨,進而做出最優解。是以,需求方希望資料服務公司能夠在項目進行中做到積極配合、快速響應,并可以對項目提出一定的優化建議。

以上五點是需求方對資料标注的核心訴求,是以,如何在AI商業化落地加快的大背景下,能夠在垂直場景中建立一套完整的資料整體解決方案,才是未來的市場競争中增添的重要優勢砝碼。

從近兩年的市場資料來看,第三方資料标注與稽核公司開始變多;原本十分分散的資料标注行業走向專業化的拐點正在發生。随着人工智能在金融、醫療、安防等多個領域實作技術落地,人工智能公司對資料的使用逐漸有“大”的趨勢,整個行業正在逐漸向多模态、多場景、高精度的方向發展。

然而目前市面上的資料标注企業大多都是多人并發協同标注的方式進行資料标注,需要大量的人力進行重複機械性的操作,這樣的準确率很難保證;并且完成标注後的資料集往往也很難與後續的模型訓練銜接上,導緻項目無法準時傳遞,進展緩慢。

跑碼地Coovally智能輔助标注

是以,針對資料标注領域的核心需求,跑碼地Coovally智能AI視覺平台推出了智能輔助标注功能。

智能輔助标注——資料标注領域新突破

Coovally樣本智能輔助标注具有以下幾大亮點:

  • 支援對常見的機器學習任務對應格式的樣本進行标注,如:圖像分類、目标檢測、圖像分割等;
  • 支援自動根據已标注樣本訓練模型和輔助标注;并且還提供了多種快捷标注,如:粘貼标注、預标注等。使用者可以使用本人已部署的模型預标樣本集圖檔、可以批量粘貼标注框到圖檔、預标部分标簽物體也統統可以實作。

并且跑碼地Coovally是一個包含完整AI模組化流程、AI項目管理及AI系統部署管理的機器視覺平台,能夠幫助使用者快速批量驗證多種機器學習和深度學習模型的性能,極大的降低AI模型工程化應用門檻;能夠提供“打包自身的A I能力”,給業務人員使用,可實作“授人以漁”。是以通過Coovally可以一步實作從資料标注到模型訓練再到模型部署的全流程,省去了找第三方資料标注後銜接模型的過程,極大地提高了模組化效率,為項目準時傳遞提供了保障。

目前跑碼地Coovally已廣泛應用于制造業質檢、地質災害監測、電力行業裝置監控、醫學專病診斷、智慧交通、智慧園區等多樣場景。“得資料者,得人工智能”,有了智能輔助标注功能的加持,Coovally将進一步拓寬應用場景,提高模型精度,助力機器視覺行業發展。

繼續閱讀