视觉生产
一、定义:通过一个/一系列视觉过程,产出新的视觉表达
输入(参数/素材)->(视觉生产)过程->产出(素材/成品)
二、.分类:1.生成:0->1;2.拓展:1->n 3.摘要n->1; 4.升维An->An+1 5.增强/变换:A->B; 6.插入/合成:A+B=C; 7.擦除:A-B=C
三、通用基础框架
Request->Dispatch->Service->Response
四、五个关键维度
1.满足视觉/美学表现(可看)
2.合乎语义/内容逻辑(合理)
3.保证结果的丰富性(多样)
4.提供预期的抓手(可控)
5.*带来用户/商业价值(可用)
精细理解
一、分割抠图
1.识别 2.检测 3.分割
二、难点
数据严重不足,标注成本高
三、解题思路
1.复杂问题拆解:粗mask+精matting
2.丰富数据样本
四、应用场景
头发丝、相似背景、其他物体抠图..
视觉生成
一、框架流程
1.理需求->2.定草图->3.选状态->4.调细节->5.生成图->6.评好坏
二、鹿班场景智能美工
1.人工还原机器学习:JPG->PSD
2.模板创作机器人:1PSD->100PSD
3.图片合成机器人:PSD->PNG
三、视频
视频封面
视觉编辑
一、视频植入
广告:核心挑战与亮点:
位置、透视、尺寸、遮挡、时间
二、动态检测分割
三、视频内容擦除
核心挑战与亮点:
粗定位-精分割-像素填充-在线训练
应用:文字擦除、logo擦除
四、画幅变化
主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率
视觉增强
一、视频、图片增强
单点核心技术:人脸增强
核心挑战:分辨率、帧率、色彩
二、视频、图片超分
视频插帧、HDR色彩扩展
三、风格迁移、颜色拓展
视觉制造
一、实体设计制造
几何生成、视觉迁移及融合、多样性拓展、2D3D融合
视觉智能开放平台
https://vision.aliyun.com/