机器之心发布
机器之心编辑部
「你好,我在咱们公司刚入职。业务上有什么事儿,就请您多多指教啦!」
什么,这些同事竟然都是大模型驱动的 “数字人”?
只需 30 秒画面,10 秒音频,10 分钟就能极速定制一个这样和真人无异的 “数字同事”。它可以直接和你实时交互,并且有着通信运营商级别的高质量低延迟的音画传输。
就像这样:
像这样:
这是小冰公司最新上线的 “零样本” 数字人(Zero-shot Xiaoice Neural Rendering,Zero-XNR)技术,依托超千亿大模型基座,新技术不仅将数字人所需的训练数据压缩至 “秒级”、使定制时间达到 “立等可取”,而且生成的数字人能够直接应用于实时交互。据业内人士介绍,这在全球尚属首次。
同时,新技术仍旧保持了超高清标准,栩栩如生:
基于这项全新的 Z-XNR 技术和 TTS 语音大模型的融合框架,小冰数字人实现了秒级数据高质量形象声音复刻。独特的数据训练和推理算法,同时实现了数字人复刻高质量、视觉个性化表达与立等可取的便捷性:
视频链接:https://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650926863&idx=1&sn=9865f7a4a3dca2ad458f0474902fb2a5&chksm=84e42b71b393a267cf2fb46fe915cd5e03008c823f361dec7ed602e8dbeea11184c0d1551c3e&token=1370830057&lang=zh_CN#rd
不仅如此,小冰 AI 数字员工产品线这一次共计进行了三大升级:全新 Z-XNR 技术 + 全新超千亿大模型基座与 Agent 构建框架 + 全新透影音画传输系统。
全新超千亿大模型基座与 Agent 构建框架,简单而言,就是基于超千亿大模型基座,升级混合基座架构的 Agent 构建框架,搭建完整的交互数字员工能力构建与强化平台 —— 数字大脑平台,小冰全系列数字员工都能配备强大和丰富的职业交互套件,让数字员工更懂客户,更懂企业知识与业务,让交互精准适配商业场景原生工作流。
全新透影音画传输系统,是指基于 webRTC 的自研引擎,提供超高清视频推送能力、通信运营商级别的高质量低延迟的音画传输和弱网抗丢包通信能力,实现精准的声音画面同步,并可搭载透明通道数据,支持客户端实时渲染来丰富扩展应用。可以承载端到端的多模态实时交互和 AI 对话等场景,提供流畅自然的用户体验。
“零样本” 数字人以及基于该技术的全新普惠型数字员工的推出,进一步丰富了小冰 AI 数字员工产品线,产品体系 “高 - 中 - 低” 搭配日臻完善,广泛适配企业不同发展阶段和多样化的业务场景。目前,小冰的客户已经覆盖了包括招商局集团、红杉中国、万科集团在内的国内众多行业头部企业,并在各垂直领域企业中取得了丰富的产业落地实践。
而有了 “零样本” 数字人,更多的小微企业、小型商家,都有了更加便捷和低成本的路径来尝试数字人和大模型技术,有助于实现数字化转型。
至于如何体验?
即日起,通过小冰数字员工 APP 的自助服务,就可以轻松畅享全流程自动化的 “零样本” 数字人定制了。
值得一提的是,小冰大模型以及语言模型算法、语音合成算法、数字人合成算法等技术都已经成功通过了国家网信办备案,标志着小冰在技术能力、专业性、安全性和合规性方面拥有坚实基础,已获国家权威级认可。
近几年来,数字人如雨后春笋一般涌现,一度成为各行业的宠儿。然而,热度持续提升的另一面,日新月异的技术更迭、用户体验的更多诉求,都在向这一新兴赛道发起挑战。最近,市场逐渐回归理性,行业开始更加关注数字人的实际应用和商业价值。
作为最早布局数字人的企业之一,小冰团队一直走在 “数字人 + 大模型” 产品技术革新的最前沿。依托小冰大模型、神经网络渲染及超级自然语音等领先技术,小冰公司已构建类型丰富的 AI 数字人完整产品体系,将数字人的整体自然度提升到与真人难以分辨的程度,同时实现 800 毫秒级别的端到端超低延时人机实时交互,通过完备的 SaaS 化平台工具,用户可自主管理数字资产,配置数字人工作。目前,小冰数字人已成功赋能金融保险、智能车企、地产、文旅、政务、教育、零售、大消费、互联网等十余个垂直领域。
小冰团队表示,坚信技术创新的力量,将坚持致力于推动数字人普及,让数字人赋能千行百业,发挥技术进步的巨大价值。