視覺AI訓練營第一天
視覺生産技術探索和應用
(一)定義和分類
視覺了解,比如識别、檢測、分割等;
視覺生産,也可以了解為怎麼去産生視覺,指通過一個/ 一系列視覺過程,産出新的視覺表達。
我們希望通過技術實作過去由人工來完成的過程。
(二)主要應用
視覺生産主要包括生成、拓展、摘要、升維,另外還有增強/ 變換、插入/ 合成、擦除等。達摩院在該領域已經投入了很多人力和精力,也形成了一些産品,比如鹿班、畫蝶、視覺智能開放平台等。
(三)通用基礎架構
一般邏輯為,請求(Request)、分發(Dispatch)、服務(Service)和響應(Response)四大部分。
深入了解視覺生産——視覺分割
思路:
1.複雜問題拆解:粗mask估計+精準matting
2.豐富資料樣本:設計圖像mask統一模型
探索視覺生成
分析鹿班場景智能美工(平面),AlibabWood(短視訊)的架構流程,在各個行業的應用都會産生不同的效果,依據場景來進行賦能。
其他視覺技術
1.視覺編輯:主要包括增删查改等功能
2.視覺增強:對視訊的内容進行一些改變,以達到視訊某些方面的改善效果。
3.視覺制造:我們可以利用視覺制造技
術來解決實際生産過程中面臨的效率低、協同差、定制難等問題。
視覺智能開放平台
阿裡巴巴的視覺智能開放平台(vision.aliyun.com)