天天看点

刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

作者:再建巴别塔
刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

作者

简介

刘娜

中国传媒大学外国语言文化学院师资博士后,中国传媒大学石榴籽研究院研究员

李倩

北京师范大学新闻传播学院讲师

刘茜

北京师范大学新闻传播学院副教授

吴晔

北京师范大学新闻传播学院、北京师范大学计算传播学研究中心教授(通讯作者)

正文

Article

一、研究背景

近年来,以人工智能(artificial intelligence,简称AI)为代表的新兴信息技术正驱动新闻业向智能化转向。作为AI技术在媒体领域应用的“最新形态和高级阶段”,AI主播成为了政府、学界和业界关注与实践的热点。2021年广电总局发布的《广播电视和网络视听“十四五”科技发展规划》明确提出:“推动虚拟主播广泛应用于新闻播报等节目生产中,创新节目形态,提高制播效率和智能化水平。”在技术和政策的支持下,AI主播被广泛应用于不同新闻场景,以AI主播为传播主体的实践成为新闻播报领域的一场革新,这必将对传媒产业格局,特别是传媒从业者产生深刻影响。

AI主播是指“以大数据处理与学习、虚拟合成与分身、人机交互等AI技术为驱动,在媒介中担负着播报任务的智媒产品”。在AI主播广泛应用之前,真人主播是主持播音环节中的关键传播者,被称为媒体和观众的代言人。在数字时代,即便真人主播的信息中介、流程串联等职能被部分地重构或替代,但其依然是广播电视等媒体中的关键一环,联结着广泛的社会生活空间,是决定传播效果的重要角色。因此,AI主播是否能够发挥与真人主播同等的功能和作用,受众对AI主播播报的新闻内容如何感知与评价?是本文关注的重点。

二、文献综述

(一)理论依据

AI主播是机器的一种,受众对其感知与评价属于人机传播范畴(human machine communication,简称HMC)。与广播、电视、电话等媒介不同,AI主播从幕后走向前台,将视觉、听觉符码意义通过镜头画面与受众直接建立感观联动,其不再仅仅作为信息传递的中介渠道(mediator),而是以“他者”(other)身份作为信息的发送者或接受者参与整个交流互动过程。随着技术进步,人与机器间界限逐渐模糊,传播不再局限于人与人之间,也发生于人与机器之间。

媒介等同理论(media equation theory)与计算机是社会行动者(computers are social actors,简称CASA)范式有助于理解这种新型的人机关系。在《媒介等同》一书中,克利福德·纳斯(Clifford Nass)和拜伦·里夫斯(Byron Reeves)提出个体与计算机、广播电视、新媒体的互动是基于社会性的自然反应,如同现实生活中与人的互动一样。媒介等同理论的重要范式CASA进一步指出,人机互动时会套用互惠互利、刻板印象等人类之间交往的社会规范,哪怕人们意识到媒介与人类截然不同且这种反应不恰当,也会无意识(mindless)套用人际交往中习得的思维模式。这种无意识行为可能与不成熟的认知承诺(premature cognitive commitments)有关,而要引发这种无意识的社会化反应,媒介需要呈现足够多的社会线索(social cues),从而让人们将其归为社会行动者,并做出相应的社会化反应。

最初,CASA范式和媒介等同理论主要被应用于解释人与计算机的交互。例如,人类倾向于对他们直接互动过的计算机给出更为正面的评价,而在缺乏直接互动的情况下评价则较为消极。人们倾向于根据计算机的外观特征与个人标识的一致性,将计算机归类为队友或非队友,进而影响对其的评价和意见接受度。此外,计算机声音也是很强的社会线索。实验发现受众能够鉴别计算机声音的性格倾向并产生相应的社交情绪反应:听到计算机声音表现出与自己相似性格的受众会认为计算机有更强的社会存在感。

随后,CASA范式也被应用于其他媒介中,如自动驾驶汽车、机器人和虚拟人。当媒介呈现语言、外观、声音、情感、行动等社会线索时,受众会将其看作社会行动者并做出相应的社会化反应。有名称的自动驾驶车辆或者机器人更易得到受众的偏爱和信任,短发机器人被认为更适合修理和看守等工作,而长发机器人更适合家务和护理等工作;具有真人声音而非合成语音的AI老师更被信任,并且真人语音比合成语音在受众情绪唤起和思维认知上更具优势;表现出同理心、热情等人类情感的聊天机器人(chatbot)被认为更具支持性,更能激发受众回应其请求;机器人使用手势更易吸引人,也更让人感觉亲密;零售网站嵌入为消费者提供讲解服务的虚拟导购,更能激发消费者的积极情绪及购买意向。

可以发现相关研究中,人类特征、行为和情感等拟人化(anthropomorphism)是非常重要的社会线索。当然,拟人化并非越逼真越好,研究发现外观拟人程度较低的虚拟人更能引发被试产生共同在场感和社会存在感。根据恐怖谷效应(uncanny valley),随着非人类物体拟人化程度增加,人类对其好感呈现增-减-增的趋势。刚开始,拟真度越高正面情感越多;而当拟真度达到一定值时,好感度会突然跌至谷底,产生厌恶和恐怖;而随着相似度增加,好感度又会再次提升。AI主播如何做到既呈现足够多的社会线索进而达到更好的交互效果,又不至陷入到恐怖谷引起受众反感,是值得关注的问题。

(二)文献综述

随着AI在新闻传播领域的“全面渗透”,越来越多的研究关注受众对AI生成内容的态度与感知。大量实证研究关注使用算法将数据转换为新闻文本的“自动化新闻”(automated journalism),特别是AI生成新闻和传统人工写作对比。整体而言,AI生成新闻与人类写作内容在受众态度与感知层面不相上下,只在某些方面呈现细微差异。有研究发现AI新闻写作在受众感知专业性、可信度、客观性等方面均优于人类写作;也有研究发现相较于AI写作,记者写作的新闻内容更具专业性、可信度以及可读性。结论之间相互矛盾可能因为受众并不以单一的方式感知AI新闻内容,而是会受到其他因素的交互影响,例如,受众认为网络媒体上的AI新闻更加有趣,而传统媒体上人类记者编写的新闻更受欢迎。此外,研究也关注“基于数据的抓取、挖掘、统计、分析和可视化呈现”的“数据新闻”(data journalism)。结果显示,与传统的文字报道相比,受众更喜欢呈现形式新颖的数据新闻。还有研究关注受众对AI生成艺术类内容的感知,发现受众对AI创作诗歌的评价与真人创作相比并无显著差异;受众对AI生成的绘画在喜好、美感、新颖性和可理解性方面均不如人类绘制的画作。

相较于机器写作、数据新闻以及AI艺术创作,AI主播出现较晚、研究较为单一,主要集中于探讨AI主播是否能够替代真人主播这一议题。有学者指出AI主播的明显优势,如工作地点、工作时长不受限,特别在新冠疫情等特殊时期,AI主播能够随时到岗,全天候不间断播报;从文本内容到音视频的“秒级转换”,大幅提高了新闻制作效率,保证新闻时效性和准确性;庞大完善的信息储备系统支持AI主播与观众实时互动,提供报道与咨询服务。AI主播不仅拥有强能力,还逐渐具有“虚拟人格”,与受众交互呈现出人际传播特征,成为新型“虚拟人格传播主体”。依此可见,传统主播岗位将面临被重新定义的事实。相反,一些学者认为AI主播在很长一段时间内仍无法与真人主播相提并论。专业技能方面,AI主播缺乏权威感,新闻公信力差;非语言方面,AI主播表情、肢体语言等欠生动;创作方面,AI无法担起“思想性”主持人的职能。

AI主播实证研究集中在受众对其态度的影响因素上。总体来说,受众对这一新型媒介应用了解有限,但整体态度较为积极。其中,王忆希等基于新技术特性与社会行动者的双重视角,发现技术新颖性、可信度、拟人化正向影响对AI主播的态度;技术自身特性、社会影响、享乐动机等因素正向影响青年受众对AI主播的使用意愿。此外,有学者关注受众对AI主播音频播报的感知。研究发现,在收听读物时,选择AI与选择真人主播播读的听众比例基本相同,且在喜爱度和信任度感知上无明显差异;另一项实验表明被试收听二者播报天气新闻后,在查询新闻信息意图和采纳新闻资讯建议方面无差异,但人类主播的可信度更高;一项深度访谈研究发现,新闻内容、媒体机构和技术透明是影响受众对AI主播感知可信度的重要因素。以上研究中,主要采用了问卷调查法,并未明确对AI主播进行定义和展示,因此无法排除被试对AI主播的认知偏差;亦或是采用实验法探析受众对AI主播部分功能(语音)的态度,缺少视频形式AI主播的研究。

总体来看,目前对AI主播的研究较少,且以现象解释和思辨为主,实证研究,特别是实验研究不足。“作为一项新兴传播实践,AI主播的社会接受过程尚不明晰。”因此,本文采用控制实验法探究受众对AI主播与真人主播的感知与评价,实验制作了AI主播与真人主播播报新闻的视频材料,受众感知基于真实、直观的观看体验,这也是本文的创新点之一。

三、研究问题

(一)主播类型

AI主播以新型智能传播主体的身份出现在大众视野。传播主体是大众传播活动中的重要因素,直接对传播内容、过程和效果产生影响。霍夫兰(Carl Hovland)等学者总结了媒介可信度的两个重要维度:专业性(expertness),可信赖性(trustworthiness)。两者均指向了传播主体,前者指传播主体被认为能够提供有效信息的能力,包括传播者的专业训练、经验和与受众相似的社会背景和价值观等;后者指传播者被认为愿意提供事实真相的程度,包括其可靠性、公正性、中立性和缺乏特定动机和意图。皮尔斯(C. S.Peirce)从本体论中确定了传播符号学的范式取向,指出符号所传达的意义并非静态,而是由不同的传播主体赋予的,受者在符号传递过程中产生理解,而符号的传递过程是双方的协商结果。在传统媒体中,主持人作为传播主体将潜在传播力转化为实际传播效果,受众对节目质量的评价在很大程度上受到他们的影响。而作为新型传播主体的AI主播对受众的感知与评价会产生怎样的影响,与真人主播相比在哪些方面会有差异?由此,本文提出如下研究问题(图1):

RQ1:不同传播主体类型(AI主播/真人主播)对受众的内容感知与节目评价有何影响?

(二)新闻类别

AI主播被广泛应用于新闻生产实践中,涵盖了民生新闻、时政新闻、天气预报等多种类别。其中,时政新闻与民生新闻代表了两种不同的表达样态。在政策性强、权威性强的时政新闻播报中,主播承担了“党的喉舌”的重要作用,传达客观事实和政治立场,因此要求播音员的表达做到准确、客观。而民生新闻更具生活化与贴近性,主播大多选择“说新闻”的方式替代“播新闻”,风格轻松自然、情感饱满丰富。已有研究表明,新闻类别会影响受众对机器新闻可信度的感知,然而,同样的结论是否适用于AI播报新闻?本文选取严肃客观的时政新闻与亲切亲民的民生新闻两种不同类型的新闻内容,考察受众的感知与评价。因次,本文提出第二个研究问题(图1):

RQ2:新闻类别(民生新闻/时政新闻)对受众的内容感知与节目评价有何影响?

(三)平台属性

目前,不仅有央视、新华社等官方媒体推出AI主播,个人也可通过科技公司自主定制AI主播,并在自媒体平台上播放生成的新闻作品。随着媒介形态的多样化,受众的感知与评价不仅受到来源特征、信息内容影响,还受到媒介或渠道的影响,相同信息在不同媒介环境中会引发不同的评价,媒介技术形态与渠道来源是影响评价的重要因素。因此本文将官方媒体和自媒体作为变量之一,考察不同播出平台对受众感知与评价AI主播的影响。本文提出第三个研究问题(图1):

RQ3:播出平台属性(官方媒体/自媒体)对受众的内容感知与节目评价有何影响?

受众对不同传播主体的态度可能因新闻类别和播出平台而异。本文提出第四个研究问题:

RQ4:不同传播主体中,受众的内容感知与对节目的评价是否受到不同新闻类别和不同播出平台属性影响?即传播主体、平台属性、新闻类别三个自变量之间是否存在交互关系?

可信度、喜爱度等认知维度被证实为重要的因变量。另外,新闻代入感是受众接收新闻内容的一种内化过程,使受众主动寻求新闻的发展要素,产生情感共鸣,从而更好理解新闻。因此本文将因变量划分为内容感知与对节目评价两部分。内容感知包括可信度、新闻代入感,而节目评价分为喜爱度与整体质量感知。综上,本文提出如下研究模型图(图1):

刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

四、党的情感体制的初步建立及其影响

本研究进行一项2(主播类型:AI/真人)×2(新闻类别:时政新闻/民生新闻)×2(平台属性:官方媒体/自媒体)的被试间因子实验。实验中,被试观看不同视频后填写问卷,从内容感知(可信度、新闻代入感)与节目评价(喜爱度、整体质量)方面打分。

(一)实验对象

本研究采取随机抽样法,通过“问卷网”(https://www.wenjuan.com)发放问卷。共收回问卷548份,剔除无效样本和未能通过操作检验的样本,共有497份有效问卷。如表1所示,从性别构成来看,被试男女比例约为2∶3。年龄分布从18岁到70岁,其中18到40岁的中青年群体比例为88.33%。93.76%的被试的学历为大学专科及以上。

刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

(二)实验材料的设计

本研究制作8种不同呈现方式的视频刺激材料:真人主播+时政新闻+官方媒体;真人主播+民生新闻+官方媒体;真人主播+时政新闻+自媒体;真人主播+民生新闻+自媒体;AI主播+时政新闻+官方媒体;AI主播+民生新闻+官方媒体;AI主播+时政新闻+自媒体;AI主播+民生新闻+自媒体。

1.材料选定

选取真人主播。首先,避免主播自身知名度过高,导致被试受既往印象影响。第二,达到专业新闻主播水准且有丰富工作经验。结合知名度、社会认可度、业务能力等综合因素,本研究选取了一位在省级媒体新闻栏目供职10年的新闻主播作为真人主播视频的录制者。

选取AI主播。首先,能够代表目前AI主播技术发展水平的虚拟合成形象。第二,与真人主播性别一致、视觉年龄相近。综合上述因素,通过对央视、新华社、百度AI、科大讯飞、清博等平台出现的AI主播进行筛选,最终选定由科大讯飞研发的AI主播晓璇作为实验对象。晓璇利用语音合成、图像处理、机器翻译等AI技术打造而成,其视觉呈现效果能够代表目前AI主播的技术发展水平,形象气质也与实验素材相符。

选定新闻题材。首先,排除近期新闻热点话题,避免被试受已有报道或舆论影响。第二,排除争议性话题,避免被试受已有态度干扰。第三,实验材料选取时政新闻与民生新闻各一则。第四,主题一致。主题确定为“青海环保”。选取青海日报的《省委书记实地调研青海湖生态保护情况》为时政新闻素材,选取中国环境报的《守护大美青海的“颜值担当”》为民生新闻素材。最后,根据两则报道的文字内容,由两位传统媒体专业播音员改写为符合报道规范的口播稿。其中时政新闻口播稿共370字,民生新闻口播稿共416字。

视频呈现。首先,不同因素组合呈现的8个视频全部制作为统一的演播空间。第二,根据平台属性的不同,官方媒体台标标注为CCTV,自媒体标注为bilibili。均选用受众熟悉度高的平台标识。第三,视频格式为MP4,保证视频大小、分辨率等一致。时政新闻中,AI主播的播报时长为1分32秒,平均语速为4.02字/秒;真人主播的播报时长为1分30秒,平均语速为4.11字/秒。民生新闻中,AI主播的播报时长为1分36秒,平均语速为4.33字/秒;真人主播的播报时长为1分40秒,平均语速为4.16字/秒。真人主播与AI主播视频中的主持人服饰、拍摄景别、演播室背景、台标设计、稿件内容等均保持一致。

2.材料发放

在网络问卷中嵌入制作好的视频并设置随机出现。被试点击播放按钮即可观看,观看完整的视频后方可进入之后的问卷填写。

3.测量量表

本研究测试受众对视频的感知可信度、新闻代入感、喜爱度和整体质量评价。所有变量均使用5级李克特量表。

可信度。使用提出的可信度测量量表:“准确的”,“真实的”,“可信的”和“权威的”。量表信度α=.89。

新闻代入感。采用杨洸杨洸、郭中实:《新闻内容、理解与记忆:解读争议性事件报道的心智模型》,《新闻与传播研究》2016年第11期。等提出的量表:“在你观看刚才的视频时,脑海中能轻而易举的浮现出新闻故事的画面”;“观看刚才的新闻视频时,你能做到注意力集中”;“这篇报道让你感同身受”;“你想知道这个新闻故事的结局”。量表信度α=.90。

喜爱度。采用Sundar提出的新闻内容喜爱度测量量表。包括“无聊”、“享受”、“有趣”、“生动”、“愉悦”。量表信度α=.90。

整体质量。采用直接评价方法向受试提问:“您认为节目的整体质量如何?”

五、结果

本研究采用IBM SPSS Statistics 26进行数据分析。

(一)人口学变量

交叉分析显示8个视频组在性别(X²(7,n=497)=2.00,p=.96)、年龄(X²(21,n=497)=18.05,p=.65)和教育(X²(21,n=497)=26.25,p=.20)方面均无显著差异。

分别使用单因素方差及独立样本T检验分析教育、年龄和性别在因变量上的差异性。表2显示,不同教育背景对可信度、喜爱度、代入感、整体质量均无显著影响;年龄显著影响受众对视频的感知可信度、喜爱度、代入感、整体质量;性别对喜爱度、代入感和整体质量无显著影响,但对可信度有显著影响,具体来说,女性比男性受众认为视频更加可信。

刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

相关性检验结果表明(见表3),年龄与可信度、喜爱度、代入感和整体质量存在较低但显著的正相关,说明年龄越大,对视频评价越高。然而年龄在各个组别间并无显著差异(见表2),因此在后续分析中不作为协变量处理。性别仅与可信度显著低相关,且在各个组别分布均匀,因此在后续分析中不做协变量处理。教育程度与因变量无显著关系。

刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

(二)结果

为了回答研究问题1-4,使用多因素方差分析方法,分析发现(见表4)主播类型、新闻类别和平台属性显著影响被试的内容感知与节目评价。此外,交互效应显示主播类型、新闻类别、平台属性不存在二阶或三阶效应。

刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究
刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究
刘娜 等 | 人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究

(二)结果

为了回答研究问题1-4,使用多因素方差分析方法,分析发现(见表4)主播类型、新闻类别和平台属性显著影响被试的内容感知与节目评价。此外,交互效应显示主播类型、新闻类别、平台属性不存在二阶或三阶效应。

1.主播类型

结果发现,主播类型对因变量均有显著影响。如表4、表5显示,主播类型显著影响可信度:F(1,489)=15.09,p=.000<.001,中等效应(partial η²=0.03)。其中,被试认为真人主播播报的视频可信度(M=4.02,SD=0.80)显著高于AI主播播报视频(M=3.69,SD=0.96);主播类型显著影响喜爱度:F(1,489)=17.03,p=.000<.001,partial η²=0.03)。比起AI主播播报的视频(M=3.48,SD=1.05),被试更喜欢真人主播播报的视频(M=3.85,SD=0.86);主播类型显著影响代入感:F(1,489)=15.65,p=.000<.001,中等效应(partial η²=0.03)。被试认为真人主播播报的视频(M=3.91,SD=0.86)代入感显著高于AI主播播报视频(M=3.55,SD=1.02);主播类型显著影响整体质量:F(1,489)=16.93,p=.000<.001,中等效应(partial η²=0.03)。被试认为真人主播播报的视频质量(M=3.81,SD=0.80)显著高于AI主播播报视频(M=348,SD=0.91)。

2.新闻类别

如表4、表5所示,新闻类别对整体质量无显著影响:F(1,489)=0.04,p=.84。被试认为民生新闻(M=3.64,SD=0.91)与时政新闻质量(M=3.63,SD=0.84)无显著差异。然而,新闻类别显著影响可信度:F(1,489)=4.20,p=.04,小效应(partial η²=0.01)。被试认为民生新闻的可信度(M=3.93,SD=0.77)显著高于时政新闻(M=3.76,SD=1.01);新闻类别显著影响喜爱度:F(1,489)=3.99,p=.05,小效应(partial η²=0.01)。比起时政新闻(M=3.56,SD=1.07),被试更喜欢民生新闻(M=3.75,SD=0.88);新闻类别显著影响代入感:F(1,489)=5.82,p=.02,小效应(partial η²=0.01)。被试认为民生新闻的代入感(M=3.83,SD=0.87)高于时政新闻(M=3.62,SD=1.05)。

3.平台属性

如表4、表5所示,平台属性对整体质量无显著影响:F(1,489)=1.01,p=.32。被试认为官方媒体发布的视频质量(M=3.69,SD=0.87)与自媒体发布的视频质量(M=3.59,SD=0.88)无显著差异;然而,平台属性对可信度有显著影响:F(1,489)=5.21,p=.02,小效应(partial η²=0.01)。被试认为官方媒体发布的视频可信度(M=3.96,SD=0.79)显著高于自媒体发布的视频(M=3.76,SD=0.97);平台属性对喜爱度有显著影响:F(1,489)=6.51,p=.01,小效应(partial η²=0.01)。比起自媒体发布的视频(M=3.55,SD=1.05),被试更喜欢官方媒体发布的视频(M=3.79,SD=0.87);平台属性对代入感有显著影响:F(1,489)=6.09,p=.01,小效应(partial η²=0.01)。被试认为官方媒体发布的视频代入感(M=385,SD=0.86)显著高于自媒体发布的视频(M=3.63,SD=1.03)。

六、结论与讨论

作为传播主体的新闻主播,经历了从专业化、精英化、泛众化再到智能化的变迁。随着AI的迅猛发展,真人主播的绝对主体地位受到挑战,AI主播是否能够替代真人主播引发热烈讨论。本文从受众视角探讨了对AI主播播报新闻的内容感知(可信度、新闻代入感)与节目评价(喜爱度、整体质量)。不同于AI与真人身份并不显著影响被试感知的既有研究结论,本研究发现显著差异:相比真人,受众对AI主播播报新闻的内容感知与节目评价明显较低。其原因可能在于:首先,先前研究鲜有使用真实实验材料,受众对AI主播的认知仅基于想象或过往经验,而本文制作了AI主播的视频,提供直观的感受与判断。其次,口播新闻的播报在很大程度上依赖于传播主体的创作能力。在主持人的表达创作中,有声语言的运动过程可以概括为:心理——生理——物理——生理——心理。前两者(心理、生理)的活动过程是传播者的加工过程,物理活动指传播媒介的运转过程,后两者的活动过程指受众的信息接收过程。现阶段AI主播的智能化程度、“情境认知”能力较弱,还未能摆脱语音机械化、表达单一化等问题,在播报中停连、重音缺失,语气节奏单调,直接弱化了受众的信息接收过程。第三,本文的实验材料展示了主播的坐姿播报,这种方式副语言主要通过上半身特别是面部展现,眼神交流的重要性因此被放大。专业主播为避免提词器导致的眼神僵硬,通常采用较广视角并稍微向下的镜头设置,以营造受众的平等参与感和互动真实感。然而,AI主播在模拟这种眼神的自然和活泼度上存在不足,不自然的视觉特性有时会触发不适的“恐怖谷效应”,这也可能是造成受众评价存在显著差异的原因之一。最后,研究结论证实了真人主播的不可替代性及真人主播提升专业定力的价值所在。真人主播在话语权分散的新媒体时代,更应发挥AI无法替代的能动性,增强人的主体创造性价值,坚持权威性、专业性、提高新闻表达力。注重信息传播的温度,做社会情绪的调节器,做公平正义的守望者。随着技术的不断发展,AI与媒体的深度融合已然成为新闻业的发展趋势,真人主播应转变思路,将AI主播这一“对手”变成“帮手”,人机合作,有效互补,良性深融。

在新闻类别上,民生新闻的可信度、代入感均显著优于时政新闻,更受被试喜欢。民生新闻本身具有贴近生活、故事化呈现等特点。受众偏好的新闻节目调研中,排名前两位的均为民生新闻吴。用富有“人情味儿”的方式讲述民众故事,无疑更具贴近性,激发更深的情感共鸣,这可能是其高代入感、可信度与喜爱度的主要原因。关于平台属性,官方媒体标识的视频被认为更可信、更有代入感且更被喜欢。可能与本次实验选定的新闻节目类型有关。研究显示,时政新闻、民生新闻、文化类内容是受众最喜欢官方媒体报道的类型,官方媒体被认为具有代表主流意识形态,传播公共信息的使命,具有较强的公信力。本次实验结果中官方媒体在多个维度上的优势也与其在新闻公信力、舆论引导力和社会影响力上的优势相吻合。

在理论层面上,首先,本文的研究结论为CASA范式提供实证支撑,说明了其在解释人机交互现象方面的适用性和局限性。CASA范式认为人们会自然地、无意识地将计算机或AI视为社会行动者,并以社交的方式与之交互。尽管数据显示,相较于真人主播,AI主播在可信度和喜爱度上得分较低,但其均值仍高于中等水平,与真人主播的差距较小(仅0.3左右),说明尽管受众可以清晰地区分真人主播与AI主播,但对AI主播的整体接受度和评价仍然是正向的。这表明,虽然受众更偏好真人主播,但并不否定CASA范式。研究发现人们确实是在以社交和情感的方式与AI主播互动,但由于多种因素(如传递面部表情和语音语调等社交线索的局限性),它仍未能达到与真人主播相同的效果。这一结果实际是CASA范式的一个实用案例。此外,CASA范式亦有其局限性。CASA范式更多关注个人面对机器时无意识地社会化反应,其提出于计算机开始普及的时代,人们对AI的理解以及AI本身智能性和普及度较低。CASA范式给人机交互设计领域一个重要的启示是可以使用社会化线索使得交互的过程更“社会化”和“情感化”,即更接近人人交互。然而,随着AI的迅猛发展,也有些学者指出这种拟人化倾向的潜在问题——过度拟人化可能使得人们将机器看作伙伴,而如果它无法完全满足社交和情感期望,可能会导致失望或其他不良后果;而保持一定的机器属性,使其被视为工具,可以降低这种期望,即“去拟人化”,限制其过度拟人化的倾向,保留其机器属性。近些年也有学者提出,AI越来越广泛渗透人类生活,我们应当跳出“人类中心主义”,其不应仅被视为模仿人类行为和情感的工具,也可以被视为自身具有独特功能和局限性的实体。这种视角在如今这个日益数字化的时代尤为重要,帮助我们更全面地理解AI在社会、心理和文化层面的影响,有助于降低人们对AI不切实际的期望。因此,人机交互设计中,不必过分追求拟人化,而应注重AI的功能性和效率,与AI和谐共存。其次,先前探讨AI新闻应用的实验研究,较多地关注“主体身份”问题,即通过告知被试不同的主体身份(人或AI),来形成实验刺激,从而获得被试对AI新闻应用,如AI诗歌绘画创作、机器新闻写作等的评价。正如前文所言,本研究通过自制AI主播与真人主播的视频材料,使受众感知基于真实、直观的体验,而非基于对技术的想象,这也是本文的创新点及贡献之一。无论是从主体身份的区分,还是基于实践的主体差别,这两类实验研究均对探讨AI背景下的人机关系具有重要意义。

本研究实施过程还存在一些局限,首先,本研究未对被试直接阐明AI主播的基本技术原理,被试可能对AI主播运转机制的评判标准不同,如:新闻稿件是由算法生成还是人类手动输入,类似这样的疑问会影响被试的判断。其次,只考察了时政新闻与民生新闻两种新闻类别,之后将会继续探究更多类别及其他维度的影响,为受众对AI主播的接受机制提供更多的理论视角与实证支撑。最后,实验素材上,尽管在性别、视觉年龄、服饰发型等方面尽可能追求两位主播的一致性,但仍无法排除长相、音色等因素带来的个体感知差异影响。理想的情况是,由AI主播的原型进行真人主播视频录制。但目前AI主播原型大多不具备新闻主播的业务能力与专业素养,而少部分按照专业主播建模打造的AI原型均为主流媒体平台的新闻主播,如央视的AI康辉、新华社的AI屈萌等,无法避免因主播自身的知名度影响,被试代入既往印象与评价从而对实验结果产生的干扰。

本文系国家自然科学基金项目“移动新闻媒体中的用户行为统计规律与建模”(项目编号:11875005)的阶段性研究成果。

原载于《新闻与传播研究》2024年第3期

囿于篇幅,公众号舍去注释,完整版本请见刊物

(编校:实习编辑 张竞壹、崔梦恬)

引用参考:

刘娜、李倩、刘茜、吴晔:《人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究》,《新闻与传播研究》2024年第3期。

刘娜,李倩,刘茜,吴晔.人工智能主播可以替代真人主播吗?——基于受众感知与评价的实验研究[J].新闻与传播研究,2024(3):47-61.

继续阅读