視覺生産技術探索與應用
- 視覺生産定義
視覺生産定義,分為兩類視覺了解和視覺産生,視覺了解就是常見的檢測,分割,而視覺産生可以了解為如何産生視覺,即通過一個、一系列視覺過程,産出新的視覺表達。在這裡的産出,指的是和輸入不一樣的人或機器能感覺到的視訊,而不是标簽或特征。
視覺生産有以下分類,生成,拓展,摘要,升維,增強/變換,插入合成,擦除
- 視覺生産通用基礎架構
- 視覺生産的五個次元
1.滿足視覺/美學表現(可看)
2.合乎語義/内容邏輯(合理)
3.保證結果的豐富性(多樣)
4.提供使用者預期的抓手(可控)
5.帶來商業價值和使用者(可用)
- 精細了解
1.識别:知道是什麼
2.了解:再識别基礎上知道位置資訊
3.分割:在前兩步的基礎上知道沒一個像素是什麼(難點:複雜背景,遮擋,發絲精扣,邊緣反色,透明材質,多尺度/目标)
思路1.複雜問題拆解:超mask估計+精準matting
2.豐富資料樣本:設計圖像mask統一模型
- 視覺生成流程
- 短視訊流程
- 視覺編輯
主要是對于視訊進行增删改查,來優化使用者的體驗,應用主要如下:
- 視覺增強
- 視覺制造
- 阿裡雲智能開放平台