天天看點

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

作者:再建巴别塔

原文刊載于《全球傳媒學刊》2024年第2期“智能傳播”專欄。

賈煜:武漢大學媒體發展研究中心研究員,新聞與傳播學院副教授。

韋懿軒:武漢大學新聞與傳播學院大學生。

黃玥:武漢大學新聞與傳播學院大學生。

羅晨(通信作者):武漢大學新聞與傳播學院講師,跨文化傳播研究中心研究員。

【摘 要】在不同的使用場景下,使用者對ChatGPT的期望和需求可能存在顯著差異,這直接影響了使用者的使用體驗和滿意度。現有關于ChatGPT使用滿意度的研究相對有限,本研究從ChatGPT使用類型切入,立足于期望不一緻理論,探讨ChatGPT的不同使用類型(功能導向vs娛樂導向)對使用者滿意度的影響,并力圖揭示其後的作用機制。通過開展一項嵌入于真實情境的單因素組間随機實驗,研究者發現,與功能導向的ChatGPT使用相比,娛樂導向ChatGPT使用場景下使用者的滿意度更高。具體而言,在答案準确性和完整性滿意度上,娛樂導向的ChatGPT使用顯著高于功能導向使用,而在答案時效性方面,兩組不存在顯著差異。此外,挫敗感在ChatGPT使用類型與使用者滿意度之間起中介作用。與功能導向ChatGPT使用相比,娛樂導向使用情境中的使用者挫敗感更弱,進而導緻了更高的滿意度。

【關鍵詞】AIGC;人工智能;使用場景;挫敗感;期望不一緻理論

一、問題提出

随着人工智能技術的持續演進,人工智能産品與日常生活的聯系日益緊密(卡斯特爾,2019;王朝陽、尹琳鑫,2022),以ChatGPT為代表的AIGC類産品是人工智能技術不斷創新發展的階段性成果(彭蘭、安孟瑤,2023;喻國明、劉彧晗,2024)。ChatGPT具備了強大的資訊檢索、語言處理與内容生成能力,進而成為人類較為理想的人工智能對話夥伴(強月新、胡青山,2023)。2023年12月,中央經濟工作會議明确提出,要加快推動人工智能發展(新華網,2023)。由此可見,随着黨和國家對人工智能技術發展和應用的重視,AIGC類産品在經濟社會發展中扮演的角色日趨重要。

使用者滿意度意指使用者将體驗産品或服務後感覺的實際效果與體驗前期望進行比較後所形成的一種愉悅或失望的情感狀态(Yi,1990)。以ChatGPT為代表的AIGC類産品具有語料資料量大、交流人性化等優勢,其主要功能在于所提供的智能化生成内容能夠滿足使用者對資訊擷取和社交娛樂的需求(Ali et al.,2023)。目前ChatGPT的應用場景十分廣泛,其不僅在提供資訊服務、輔助日常工作等方面發揮着重要作用,還是使用者休閑娛樂時的“新夥伴”(Lee & Park,2023)。然而,在不同的使用場景下,使用者對ChatGPT的期望和需求可能存在差異,這可能會影響到使用者的使用體驗和滿意度(Niu & Mvondo,2024)。

在功能導向使用場景中,使用者往往期待ChatGPT能快速、準确地提供所需資訊或協助自己更加高效地完成任務。是以,此情境下的使用者滿意度可能更容易受到ChatGPT答案完整性、資訊準确性、任務完成效率的影響(Kim et al.,2024)。在娛樂導向的使用場景中,使用者則更關注與ChatGPT的互動體驗,如對話的趣味性、娛樂性以及随之産生的情感共鳴等。此情境下的使用者滿意度可能更多地與ChatGPT的娛樂性、情感支援、互動品質相關(Lee & Park,2023;Ma & Huo,2023)。鑒于不同使用場景下使用者有截然不同的需求,現階段的ChatGPT究竟是功能場景中的“好同僚”還是娛樂場景中的“好玩伴”?哪種使用類型下使用者的滿意度會更高?厘清這些問題對于ChatGPT等AIGC類産品的進一步優化以及增強人機互動體驗感具有較強的意義。

現有關于ChatGPT使用滿意度的研究相對有限,主要涵蓋兩個次元:第一,從ChatGPT固有特征着手,也即探讨ChatGPT的客觀屬性(如系統、資訊、服務、技術等)如何影響使用者滿意度(Cai et al.,2023;Chu,2023;Jo,2024);第二,從使用者特征切入,探讨特定使用者特征(如ChatGPT素養、技術感覺親和力、虛假資訊經曆等)對ChatGPT使用滿意度的影響(Amaro et al.,2023;Lee & Park,2023;Niu & Mvondo,2024)。但是,前人研究忽略了從使用特征的視角探讨不同使用類型對使用者滿意度的影響。為彌補這一局限,本研究意圖從期望不一緻理論(Expectancy Disconfirmation Theory,EDT)出發,重點關注在ChatGPT的兩種主要使用類型(功能導向vs娛樂導向)下,使用者的滿意度會存在何種差異以及其後的作用機制為何。具體而言,本研究希望回答兩大核心問題:(1)ChatGPT功能導向型使用與娛樂導向型使用相比,哪種類型的使用者滿意度更高?(2)使用類型與使用者滿意度關系背後的具體作用機制是什麼?

二、文獻回顧

(一)ChatGPT使用類型

作為一種先進的自然語言處理模型,ChatGPT具備強大的對話和文本生成能力(Ali et al.,2023;Wong et al.,2023)。它可以通過與使用者的互動來提供流暢的回答和自動化生成内容(Zhu et al.,2023)。目前,ChatGPT已被廣泛應用于傳媒、教育、醫療等領域(宋韻雅,2023)。現有研究對其使用類型有不同的劃定方式。一些研究将ChatGPT使用按具體任務細分為資訊檢索、對話生成、文本創作等類型(陳昌鳳,2023;Kim et al.,2023;姜智彬,2024);而根據使用類型的差異(Hazari et al.,2017),ChatGPT使用也可以分為功能導向的使用和娛樂導向的使用。

參照以往研究中對于産品或者服務的使用分類(Wakefield & Whitten,2006;Bridges & Florsheim,2008;Hazari et al.,2017),本研究将ChatGPT的主要使用類型概括為功能導向型、娛樂導向型兩類。同時,将功能導向型定義為使用者以明确的目标為導向(Hazari et al.,2017),通過使用ChatGPT來完成特定任務或解決具體問題。在此情境下,使用者希望ChatGPT可以為其完整、準确、高效地提供所需資訊(Bin-Nashwan et al.,2023)。諸多研究表明ChatGPT在功能導向型使用中展現出顯著優勢和可觀潛力。例如,一些研究指出ChatGPT能夠扮演個性化學習夥伴角色,幫助學生解決學習中遇到的問題,并提供定制化學習建議。通過與學生互動,ChatGPT能夠了解學生的學習風格和具體需求,進而提供更具針對性的學習資源和學習路徑(Rawas,2023;Zirar,2023;Boubker,2024)。在工作場合,ChatGPT也被廣泛應用于客戶服務、資料分析等多個方面。例如,ChatGPT可以作為智能客服,迅速回應客戶問題,并生成個性化解決方案,以此提升客戶的滿意度(Keiper,2023;Niu & Mvondo,2024)。

除功能導向型使用外,本研究将娛樂導向型使用定義為:使用者利用ChatGPT進行各種形式的休閑娛樂和社互動動活動,這些活動往往缺乏具體的目标和明晰的訴求。在娛樂領域,ChatGPT同樣展現出獨特的價值。一些研究表明,ChatGPT可以作為創意故事生成器,沿循使用者的需求和喜好編寫出充滿創意和想象力的故事。使用者還可以與ChatGPT展開互動來共同創作故事情節,享受創作樂趣(Lee & Park,2023;Ma & Huo,2023)。此外,ChatGPT能通過生成幽默的回答和有趣的對話為使用者提供輕松愉快的娛樂體驗(Lee &Park,2023;Thorp,2023)。綜合現有文獻,不難發現ChatGPT在功能導向型使用和娛樂導向型使用雙方面都具有廣闊的應用前景。是以,探讨ChatGPT不同使用類型下使用者的滿意度是否會存在差異具有重要價值。對這一問題的回答将協助研究者更深入地洞察使用者滿意度如何因不同的使用場景而異,亦可為AIGC産品的人性化設計和針對性應用提供啟示。

(二)ChatGPT使用滿意度

使用者滿意度是營銷傳播中的一個關鍵概念(Yi,1990)。Cardozo(1965)圍繞使用者滿意度進行了開創性研究,認為使用者對産品或服務的滿意度是一種主觀比較的産物。滿意度關涉使用者在使用或采納某産品或服務之前的期望以及使用後的感覺效果(Oliver,1980)。也有研究将使用者滿意度定義為使用者使用産品或采用服務用以滿足自身需求後産生的一種心理狀态,使用者的滿意度随着需求被滿足程度的提升而增強(Dubé & Schmitt,1991;郭曉姝等,2020)。

與其他産品或服務的使用者滿意度研究相比,有關ChatGPT的使用者滿意度研究相對有限,相關的文獻回顧如表1所示。概括而言,一方面,部分研究緊扣ChatGPT的内在特征探讨其客觀屬性如何影響使用者滿意度。例如,Cai等(2023)的研究聚焦學生對ChatGPT的使用,問卷調查結果顯示,ChatGPT的自主調節性、感覺趣味性、需求被滿足程度、資訊系統品質都能夠正向影響學生的滿意度。Jo(2024)通過對企業員工展開問卷調查,發現ChatGPT的感覺智能水準、服務品質、感覺有用性、知識管理能力對員工的使用滿意度具有正向影響。而Chu(2023)則通過實驗研究發現,ChatGPT的資訊品質、系統品質、服務品質正向影響使用者的使用滿意度。另一方面,部分研究嘗試探讨使用者特征對ChatGPT使用滿意度的影響。例如,Lee和Park(2023)關注有ChatGPT使用經曆的受訪者,調研結果顯示,使用者的ChatGPT素養對使用者ChatGPT使用滿意度具有正向影響。類似地,Niu和Mvondo(2024)的調查研究揭示出使用者對技術的感覺親和力也會正向影響ChatGPT使用滿意度。而Amaro等(2023)通過實驗研究發現,與使用ChatGPT後遭遇虛假資訊的經曆相比,在使用之前有過虛假資訊遭遇經曆的使用者對ChatGPT持有更低的使用滿意度。通過梳理以往文獻,可以發現大多數圍繞ChatGPT使用滿意度的研究高度重視ChatGPT的自身特征及使用者特征,但考慮到ChatGPT的使用類型亦有可能是預測使用者滿意度的重要因素,故有必要從使用類型的角度出發展開進一步的探索。

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

(三)期望不一緻理論

作為經典的使用者滿意度生成理論,期望不一緻理論主要探讨使用者的期望與實際體驗之間的差異如何影響他們的滿意度(Oliver,1977,1980)。該理論認為,使用者會将自己的預先期望與實際體驗進行比對,若實際體驗超越預先期望,則會增強滿意度;反之,使用者的滿意度會降低(Oliver,1993)。期望不一緻理論的落腳點在于“期望”和“感覺效果”之間的比較。期望是使用者在體驗之前對産品或服務所持有的預期,而感覺效果則是使用者在進行體驗後對産品或服務實際效用的評價(Burgoon & LePoire,1993)。期望和感覺效果之間的不等同會造就不一緻,也即期望與實際體驗之間的落差感。根據期望不一緻理論,使用者的心理狀态和滿意度是由預先期望與實際體驗之間的不一緻程度決定的(Tong & Walther,2015)。是以,期望不一緻理論為我們了解使用者态度和決策,特别是使用者滿意度的生成邏輯提供了重要的理論參考。

由于ChatGPT的應用廣泛性和開源性,使用者在使用ChatGPT之後,也會基于使用體驗與期望之間的差距來形成自己對ChatGPT的滿意度評估,這為期望不一緻理論應用于ChatGPT使用滿意度研究提供了契機。是以,本研究将以期望不一緻理論為依托來檢驗ChatGPT不同使用類型(功能導向型vs娛樂導向型)對使用者滿意度的影響,并試圖揭示其後的作用機制。

(四)研究假設

1. ChatGPT使用類型與使用滿意度

功能導向使用與娛樂導向使用是ChatGPT的兩種主要使用類型(Bin-Nashwan et al.,2023;Thorp,2023)。娛樂導向型使用通常不涉及高度專業化的知識或技能(Thorp,2023)。在這一使用場景下,使用者主要利用ChatGPT來進行一些輕松愉快的聊天或滿足情感需求(Keiper,2023)。相應地,使用者不會對ChatGPT的答案有過高的專業性期待或精準性要求,也不會過分在意答案的全面性(Keiper et al.,2023)。相較之下,使用者的功能導向型使用需要ChatGPT提供更加精确和深入的答案(Baek & Kim,2023)。基于期望不一緻理論,當使用者在使用ChatGPT時,會将自己使用前的期望與實際的使用體驗進行對照,如果ChatGPT的使用體驗滿足了使用期望,那麼使用者會有較高的使用滿意度;如果實際使用體驗無法滿足期望,那麼使用者的使用滿意度就會更低(Oliver,1993)。

ChatGPT的底層算法邏輯導緻其在回答使用者指令時主要遵循語義關聯優先原則而非知識準确優先原則(Ouyang et al.,2022)。這意味着ChatGPT在對話時更注重語義的連貫性和邏輯性,而非追求提供絕對準确的知識。ChatGPT的設計原則使其在回答問題時更易凸顯出自然性和流暢性,以此來更好地與使用者進行對話(Ouyang et al.,2022;袁毓林,2024)。然而,這也有可能導緻ChatGPT在某些場景下提供欠準資訊,即答案的精準性與可靠性不足(Ouyang et al.,2023)。相比于功能導向型使用,ChatGPT在設計原則上更貼近娛樂導向場景下的使用者需求。是以,娛樂導向型使用的實際體驗會更符合使用者期望,也會進一步帶來更高的使用者滿意度。基于此,我們提出如下假設。

H1:相比功能導向型ChatGPT使用,娛樂導向型ChatGPT使用會帶來更高的使用者滿意度,包括對答案準确性的滿意度(H1a)、對答案完整性的滿意度(H1b)、對答案時效性的滿意度(H1c)。

2. 挫敗感的中介作用

挫敗感是一個肇始于心理學領域的概念,屬于個體的常見情緒反應之一,與憤怒、煩惱、失望有關。挫敗感的産生源于對實作個體意志或目标的感覺阻力,當個體的意志或目标被否定或阻礙時,挫敗感就會出現(Maier,1942,1956;Crossman et al.,2009)。已有研究發現,挫敗感是預測人機互動效果的一項重要名額(Abd et al.,2017)。本研究認為,挫敗感在AIGC類産品使用類型與使用滿意度之間可能扮演中介角色,具體原因如下。

基于期望不一緻理論,當使用者在使用ChatGPT時,會将自己的使用期望與實際效果進行對比。使用期望是使用者在實際使用之前對ChatGPT的一個功能預期,實際效果是使用者在使用之後對ChatGPT的實際效用評價。使用期望和感覺實際效果之間的對比會引發不一緻狀态,而使用者的滿意度則是由這種不一緻狀态所決定的(Oliver,1993)。與功能導向型使用場景相比,娛樂導向型使用場景下的互動更加輕松,使用者通常不會對答案的準确性和回答深度抱有過高要求和期待。同時,ChatGPT的底層算法邏輯導緻其遵循互動性優先原則,而非精準性與可靠性優先原則(Bin-Nashwan et al.,2023)。是以,與功能導向型ChatGPT使用相比,娛樂導向型使用不會因為對話過程不符合預期而産生壓力情緒(Thorp,2023),使用者的挫敗感較低。而在功能導向使用場合,若ChatGPT的回答不夠準确或不夠深入,使用者可能會有更大的機率體驗到失望或困惑,進而引發較為強烈的挫敗感。

已有研究對挫敗感與滿意度之間的關系有較為豐富的記錄。不少研究者發現,挫敗感與滿意度之間呈顯著負相關關系(Fox & Spector,1999;Longo et al.,2016;Abd et al.,2017)。綜上,相比功能導向型ChatGPT使用,娛樂導向型使用會伴随着更低的挫敗感。而挫敗感越低,使用者的滿意度會越高。據此,我們提出如下的研究假設。

H2:挫敗感在ChatGPT使用類型與滿意度之間起中介作用。具體而言,與功能導向型ChatGPT使用相比,娛樂導向型使用會帶來更低的使用者挫敗感,進而關聯到更高的使用滿意度,包括對答案準确性的滿意度(H2a)、對答案完整性的滿意度(H2b)、對答案時效性的滿意度(H2c)。

三、研究方法

根據上文提出的兩則研究假設,研究者開展了一項單因素(使用類型:功能導向vs娛樂導向)組間随機化實驗。為更好地确定正式實驗的素材,研究者在正式實驗之前開展了一項先導實驗。具體地,在先導實驗階段,研究者設計了多則分屬于功能導向和娛樂導向的題目,并邀請來自華中地區某高校的45名大學生(Range年齡=18~25歲,M=20.60,SD=1.60;N女性=30人,占比66.67%)作為被試對實驗題目進行評價。評價内容涵蓋:(1)題目的功能性娛樂性得分;(2)對題目的喜愛程度、熟悉程度及對ChatGPT解決這些問題的預先期望程度。實驗資料回收後,研究者基于(1)功能性娛樂性的組間得分差異性(存在顯著差異)和(2)實驗題目的喜愛程度、熟悉程度以及對ChatGPT的預先期待程度的組間得分相近性(不存在顯著差異)兩大标準,篩選出功能導向型和娛樂導向型實驗組對應的實驗題目。

(一)正式實驗設計與被試情況

本實驗的被試被限定為具有ChatGPT使用經驗的個體。進入虛拟實驗室後,被試被随機配置設定至功能導向或娛樂導向組别中。剔除不合格樣本後,最終的有效被試數量為96人,其中功能導向組47人,娛樂導向組49人。

為檢驗本研究的樣本量是否滿足統計要求,研究者利用G*Power3.1軟體進行事後統計功效檢驗(Faul et al.,2007)。在效應量為0.4、顯著性水準為0.05、組數為2、樣本量為96、協變量個數為5的條件下,對應的統計檢驗力為0.97,超過基準水準0.8(張麗錦等,2021)。是以,本研究的樣本量符合要求。

通過執行卡方檢驗和獨立樣本t檢驗,研究者發現兩組被試在性别、職業、學科背景、學曆、年齡這些人口統計學變量上不存在顯著差異。被試的基本結構與組間對比結果如表2、表3所示。

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究
賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

(二)實驗流程與變量測量

根據先導實驗之結果,本研究确定了兩個不同實驗組别下的實驗素材(題目),這兩個題目皆與“海外旅行”這一話題相關。被試被要求在13至15分鐘内解決相應的問題,并要求與ChatGPT展開8至10分鐘的互動,以確定實驗操縱的有效性。在完成與ChatGPT的互動後,被試需在指定系統中上傳最終的互動記錄,以此來判斷被試的填答品質。在功能導向組,被試還被要求上傳完成的任務計劃書,以此來判斷被試回答的有效性和任務操縱的真實性。

前測階段,被試需彙報自身的人口統計學資訊(如:性别、年齡、職業、學曆、學科背景),彙報完畢後,被試被随機配置設定至功能導向組或娛樂導向組。為控制潛在混淆因素的幹擾,本研究的實驗材料嚴格基于預實驗的篩選結果。具體而言,在功能導向組,被試被要求完成一份針對2024年五一假期的五天四晚海外旅行計劃書,明确規定計劃書的詳細内容與具體要求。而在娛樂導向組,被試被要求與ChatGPT就海外旅行這個話題展開聊天,同時,研究者規定了被試與ChatGPT的互動時長和任務整體時長。具體實驗素材如表4所示。

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

實驗結束後,被試被邀請填寫後測問卷,其中包含操縱檢驗和本研究核心變量對應的測量題項。核心變量(挫敗感、使用者滿意度)的測量皆采用李克特七級量表形式。挫敗感題項改編自Peters等(1980)的研究,共包含3個題項,研究者進一步根據實驗任務對措辭予以微調,以更貼合ChatGPT的使用場景。使用者滿意度的測量方案借鑒了王娜、李傑(2023)的做法,共包含3個題項,分别測量對答案完整性的滿意度、對答案準确性的滿意度、對答案時效性的滿意度。挫敗感和使用者滿意度的具體測量題項、描述統計結果以及信度系數如表5所示。

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

四、研究結果

操縱檢驗的分析結果顯示,被試能夠清晰分辨娛樂導向型使用和功能導向型使用兩種場景(M娛樂=2.98,SD娛樂=1.84;M功能=6.10,SD功能=1.62,F(1,94)=78.15,p<0.001)。同時,不同組别的被試在對ChatGPT實驗題目的喜愛程度(M功能=5.09,SD功能=1.40;M娛樂=5.31,SD娛樂=1.25;F(1,94)=0.67,p=0.415)、熟悉程度(M功能=5.30,SD功能=1.18;M娛樂=5.35,SD娛樂=1.23;F(1,94)=0.04,p=0.843)以及感覺實驗困難程度(M功能=5.11,SD功能=1.59;M娛樂=4.76,SD娛樂=1.71;F(1,94)=1.08,p=0.301)上不存在顯著差異,符合被試随機性分派的要求。

本研究使用單因素方差分析(ANOVA)進行主效應檢驗,結果(圖1)顯示:(1)就整體滿意度而言,娛樂導向ChatGPT使用(M娛樂=5.19,SD娛樂=1.06)與功能導向ChatGPT使用(M功能=4.48,SD功能=1.15)相比,使用者滿意度顯著更高(F(1,94)=9.85,p<0.01)。(2)具體而言,娛樂導向ChatGPT使用在答案準确性(M娛樂=5.02,SD娛樂=1.13;M功能=4.17,SD功能=1.34;F(1,94)=11.35,p<0.01)和答案完整性(M娛樂=5.49,SD娛樂=1.33;M功能=4.34,SD功能=1.49;F(1,94)=15.95,p<0.001)滿意度兩項上的分值顯著高于功能導向ChatGPT使用。在答案時效性的評估上,兩組不存在顯著差異(M娛樂=5.06,SD娛樂=1.42;M功能=4.94,SD功能=1.22;F(1,94)=0.21,p=0.646)。是以,H1獲得了部分支援。其中,H1a和H1b得到了支援,而H1c則被拒絕。

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

為驗證H2中提出的中介機制,研究者利用SPSS中的Process插件(Model4)執行中介效應檢驗(Hayes,2013)。基于Bootstrap法(5000次)的分析結果顯示,中介效應顯著(indirecteffect=0.44,95%CI=[0.13,0.79]),且直接效應不顯著(directeffect=0.27,95%CI=[-0.07,0.61]),這說明挫敗感在使用類型(功能導向vs娛樂導向)與使用滿意度之間起完全中介作用,是以,H2得到了支援。具體的路徑系數如圖2所示,其中“a”代表ChatGPT使用類型對挫敗感的效應,“b”代表挫敗感對使用者滿意度的效應,“c”代表使用類型對使用者滿意度的總效應,“c'”代表使用類型對使用者滿意度的直接效應。與功能導向的ChatGPT使用相比,娛樂導向使用會降低使用者的挫敗感(B=-0.81,t=-2.83,SE=0.28,p<0.01),挫敗感與使用者滿意度之間存在顯著的負相關關系(B=-0.55,t=-9.20,SE=0.06,p<0.001)。最後,ChatGPT使用類型對使用者滿意度的直接效應不顯著(B=0.27,t=1.56,SE=0.17,p=0.122),總效應顯著(B=0.71,t=3.14,SE=0.26,p<0.01)。

具體來看,當因變量為針對答案準确性的滿意度評分時,中介效應顯著(indirect effect=0.42,95%CI=[0.12,0.80]),且直接效應顯著(direct effect=0.43,95%CI=[0.00,0.85]),這說明挫敗感在使用類型(功能導向vs娛樂導向)與使用者對ChatGPT答案準确性的滿意度之間起部分中介作用,是以,H2a得到了支援。當因變量為針對答案完整性的滿意度評分時,中介效應顯著(indirect effect=0.52,95%CI=[0.16,0.93]),且直接效應顯著(direct effect=0.63,95%CI=[0.17,1.09]),這說明挫敗感在使用類型(功能導向vs娛樂導向)與使用者對ChatGPT答案完整性的滿意度之間起部分中介作用,是以,H2b得到了支援。當因變量為針對答案時效性的滿意度評分時,中介效應顯著(indirect effect=0.38,95%CI=[0.11,0.71]),且直接效應不顯著(direct effect=-0.26,95%CI=[-0.75,0.23]),這說明挫敗感在使用類型(功能導向vs娛樂導向)與使用者對ChatGPT答案時效性的滿意度之間起完全中介作用,是以,H2c得到了支援。

賈煜、羅晨等|功能導向還是娛樂導向?ChatGPT使用類型對使用者滿意度的影響研究

五、結論與讨論

以期望不一緻理論為依托,本研究檢驗了ChatGPT使用類型與使用者滿意度之間的關系及相應機制。通過一項基于真實情境的單因素組間随機實驗,研究者發現,與功能導向型ChatGPT使用相比,娛樂導向使用情境下的使用者滿意度更高。具體而言,娛樂導向型ChatGPT使用使用者對回答的準确性、完整性滿意度高于功能導向型使用使用者,而在答案時效性滿意度方面,兩種使用類型間并未呈現顯著差異。進一步地,機制檢驗的結果顯示,娛樂導向型ChatGPT使用滿意度高于功能導向型的原因在于前者所引發的挫敗感更弱,進而導緻更高的滿意度。挫敗感在ChatGPT使用類型與使用者滿意度之間起到中介作用。

本研究的理論貢獻在于:首先,從使用特征的視角,發現娛樂導向型ChatGPT使用相比功能導向型使用來說,使用者的滿意度會更高。以往關于ChatGPT使用滿意度的研究常常從産品或服務的自身特征、使用者特征視角出發(Chu,2023;Wong et al.,2023;Niu & Mvondo,2024),本研究則從使用特征的視角切入,在産品或服務使用類型劃分的基礎上(Dhar & Wertenbroch,2000;Bridges & Florsheim,2008;Hazari et al.,2017)将ChatGPT的使用類型分成了功能導向型使用和娛樂導向型使用,延展了ChatGPT使用者滿意度的前因研究邊界。其次,本研究發現相較于功能導向型使用,ChatGPT娛樂導向型使用場景下使用者對答案完整性、答案準确性的滿意度會更高,而對答案時效性的滿意度在兩種使用場景間無顯著差異。這一結論揭示出ChatGPT使用滿意度的内部異質性。對使用者使用滿意度進行細分考察也有助于從更細微的角度辨識ChatGPT不同使用類型對使用者滿意度的具體影響。再者,本研究基于期望不一緻理論,發現挫敗感在用途與滿意度之間起完全中介作用,這為使用類型與滿意度之間關系的具體心理機制提供了一種可行的解釋方案,并揭示出期望不一緻理論應用于AIGC類産品滿意度領域的可能性(Tong & Walther,2015),同時,本研究發現挫敗感在人機互動過程中發揮着重要作用,這為未來的人機互動研究提供了一個可以重點關注的心理變量。

本研究之核心發現對ChatGPT等AIGC類産品的設計具有一定的參考價值。第一,AIGC類産品的設計者及開發商可以秉持“因地制宜”原則,即針對不同細分領域的實際情況和具體應用場景的特性對産品進行功能規劃與更新,以更好地提升使用者的體驗感和滿意度。例如,開發者可以為部署于日常工作場景、意圖實作特定功能的AIGC類産品注入更多的專業語料作為“養料”,以提升産品的應答準确率和答案的完整性。而面對部署于娛樂場景、無明确功能導向的AIGC類産品,開發者應着力設計出更多元的應用系統來追求豐富、靈敏的響應,而無須過度關注互動環節中的資訊精準性和全面性。第二,考慮到挫敗感發揮的中介效力,在優化人機互動時,設計者應加強使用者調研和社交聆聽(social listening),尤其是對使用者在互動過程中産生的挫敗感予以深入了解。源自使用者端的挫敗感回報可以為AIGC類産品的優化疊代提供明确方向,亦有益于後續人機互動滿意度的持續提升。除卻為産品供給端提供改進政策,本研究之發現對AIGC類産品的使用者端也有指導意義。具體來說,使用者可根據使用類型與滿意度之間的關系展開積極的自我調試,包括思考如何在異質性使用場景中更有效地結合AIGC類産品的可供性來滿足自身需求。這一使用目的驅動的調試政策有助于最大程度地達成科技賦能,同時避免墜入供求不對位的數字陷阱。

本研究仍存在一定局限。第一,ChatGPT的使用類型可能更為多元,本研究所采納的“功能導向—娛樂導向”二進制劃分方式僅觸及使用者使用模式的有限側面,并不能把全部使用情景囊括其中,且“功能導向”和“娛樂導向”并非決然對立,仍然可能存在交集。未來研究可吸納更多類型(如:社交導向型使用)或建構出窮盡且互斥的類型學體系,以發掘更為細緻的機制。兩類導向下的細分任務情景也值得深入挖掘。譬如,“功能導向”包括多種多樣的、精确性與可靠性參差不齊的具體任務,其内部的異質性有可能和使用者滿意度息息相關,對不同類型下具體任務的考察應被納入後續人機互動研究之議程。第二,在實驗設計方面,盡管研究者開展了先導實驗來篩選實驗題目,但正式實驗為單一實驗,這使得研究的外部效度和結論可擴充性受到一定程度的威脅。未來研究可以嘗試憑借多組實驗來檢驗本研究之核心結論的穩健性,并以此提升外部效度。第三,與“娛樂導向組”相比,“功能導向組”中缺乏相應的對話啟動提示詞,這可能會引入一些混淆因素,幹擾到後續的互動過程。如何在人機互動實驗中最大程度地保證非操縱要素的一緻、降低混淆因素的幹擾有待進一步探索。第四,在滿意度的測量方面,雖然本研究采納了與使用者滿意度相關的成熟量表,但是在測量内容的全面性方面還存在一定的不足。若未來研究能夠采用更加适用于ChatGPT使用滿意度的量表,相應的研究結論将更具内部效度。第五,雖然本研究基于期望不一緻理論驗證了挫敗感在ChatGPT使用類型和使用者滿意度之間所扮演的中介角色,但研究者并未排除可能存在的替代性假設。後續研究可以此為契機對競争性假設予以進一步驗證,包括識别其他的并行式中介變量以深化對人工智能産品滿意度影響機制的了解。

本文系教育部人文社會科學重點研究基地重大項目(項目準許号:22JJD860009)和湖北省委宣傳部武漢大學部校共建項目(項目準許号:2021XWZY009)的階段性研究成果。

本文參考文獻從略,完整版請參看刊物原文

本文引文格式:賈煜、韋懿軒、黃玥、羅晨:《功能導向還是娛樂導向?使用類型對使用者滿意度的影響研究》,全球傳媒學刊,2024年第2期,79-98頁。

繼續閱讀