天天看点

视觉AI训练营-第一天

视觉生产

一、定义:通过一个/一系列视觉过程,产出新的视觉表达

输入(参数/素材)->(视觉生产)过程->产出(素材/成品)

二、.分类:1.生成:0->1;2.拓展:1->n 3.摘要n->1; 4.升维An->An+1 5.增强/变换:A->B; 6.插入/合成:A+B=C; 7.擦除:A-B=C

三、通用基础框架

Request->Dispatch->Service->Response

四、五个关键维度

1.满足视觉/美学表现(可看)

2.合乎语义/内容逻辑(合理)

3.保证结果的丰富性(多样)

4.提供预期的抓手(可控)

5.*带来用户/商业价值(可用)

精细理解

一、分割抠图

1.识别 2.检测 3.分割

二、难点

数据严重不足,标注成本高

三、解题思路

1.复杂问题拆解:粗mask+精matting

2.丰富数据样本

四、应用场景

头发丝、相似背景、其他物体抠图..

视觉生成

一、框架流程

1.理需求->2.定草图->3.选状态->4.调细节->5.生成图->6.评好坏

二、鹿班场景智能美工

1.人工还原机器学习:JPG->PSD

2.模板创作机器人:1PSD->100PSD

3.图片合成机器人:PSD->PNG

三、视频

视频封面

视觉编辑

一、视频植入

广告:核心挑战与亮点:

位置、透视、尺寸、遮挡、时间

二、动态检测分割

三、视频内容擦除

核心挑战与亮点:

粗定位-精分割-像素填充-在线训练

应用:文字擦除、logo擦除

四、画幅变化

主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率

视觉增强

一、视频、图片增强

单点核心技术:人脸增强

核心挑战:分辨率、帧率、色彩

二、视频、图片超分

视频插帧、HDR色彩扩展

三、风格迁移、颜色拓展

视觉制造

一、实体设计制造

几何生成、视觉迁移及融合、多样性拓展、2D3D融合

视觉智能开放平台

https://vision.aliyun.com/

继续阅读