天天看點

微軟AI新戰略:加速Copilot生态圈發展,支援标準的插件擴充成關鍵

作者:十輪網
微軟AI新戰略:加速Copilot生态圈發展,支援标準的插件擴充成關鍵

今年Build大會上,微軟不隻宣布将擴大支援生成式AI對話應用Copilot,還披露了微軟更大的戰略,是要建構出完整的Copilot開發生态系,不隻讓自家産品能夠全面支援Copilot,更要讓企業、開發人員都能将他們自己的應用和服務內建到Copilot中,并在各自的行業領域中應用。而微軟Copilot生态圈戰略發展其中一個很重要的關鍵,就是支援标準的插件程式。

微軟迄今推出多種類型的Copilot應用,适用于不同的微軟産品,從最早在GitHub中提供輔助程式開發的Copilot,到後來針對低程式代碼工具Power平台的專用Copilot,再到提高生産力而設計的Copilot,也就是M365 Copilot。此外,還有提升員工參與度的Viva使用的Copilot,以及支援CRM相關應用的Copilot,其他還有搭載在搜尋引擎Bing和浏覽器Edge上,用于網頁及安全相關Copilot,就連微軟Windows 11作業系統将很快支援Copilot,意味着Copilot将變成Windows桌面環境中的常駐程式,提供使用者更多支援和協助。

微軟全力發展Copilot開放生态系

微軟AI新戰略:加速Copilot生态圈發展,支援标準的插件擴充成關鍵

微軟要讓Copilot開始能夠支援插件擴充功能,就是為了替開發者打開一道入口,可以将Copilot連接配接到企業或開發者自己的軟體或服務中來進行互動。微軟首席技術官Kevin Scott甚至以數字世界中的驅動器來比喻插件的關鍵作用。(圖檔來源/微軟)

微軟雖然推出了許多不同用途Copilot,但是,微軟首席技術官Kevin Scott顯然認為這些延伸功能還不夠,還有許多有用的Copilot功能有待挖掘,需要更多開發人員和合作夥伴加入Copilot的開發行列,共同推動Copilot的發展,“Copilot必須成為一個開放的生态系統。”他這樣說道。

微軟讓Copilot開始能夠支援插件擴充功能,就是要打開一道入口,将Copilot連接配接到企業和開發人員擁有的軟體或服務中,來進行互動。

Kevin Scott甚至用“數字世界中的驅動器”來比喻插件的關鍵作用。當插件使用者以文本輸入提問時,Copilot會根據提問内容調用開發人員所建立的插件功能,來協助他們完成各種任務和操作,例如通路即時資訊、檢索消息或執行跨應用操作等。

微軟最先在Bing的Copilot中推出了OpenTable和Wolfram Alpha兩個插件功能,可以協助使用者查找和預定餐廳,或者回答計算和分析問題。随後,更多第三方插件加入Bing,包括Expedia、Instacart、Kayak、Klarna、Redfin、TripAdvisor和Zillow等,涵蓋了旅行規劃、購物、金融和房地産等領域。通過內建了這些插件功能,Copilot在Bing上能夠提供使用者更具體的回應,大大提升了其搜尋引擎的能力,“未來幾年,人們對于所有軟體都會期待用這種模式來運作。”Kevin Scott強調。

除了Bing Chat以外,微軟也宣布,将有更多微軟Copilot産品能夠支援這項插件機制,包括M365 Copilot、 Power Platform Copilot、 Dynamics 365 Copilot,以及Windows Copilot等。

舉例來說,在M365的Copilot插件中,還提供了三種不同插件形式,一個ChatGPT插件、Teams對話消息擴充元件和Power平台連接配接器。ChatGPT插件采用基于ChatGPT形式的插件API,Teams消息擴充元件和Power平台連接配接器則是具有能夠支援定制化消息和連接配接企業内部資料的插件功能。一開始就有多達50個第三方插件,可以支援M365的Copilot,包括Atlassian、Adobe、ServiceNow、Thomson Reuters、Moveworks和Mural等。微軟預計在未來幾個月内還會推出上千個插件,進一步擴大M365的Copilot功能和應用範圍。

插件生态圈也支援企業用Azure AI自建的Copilot

除了微軟官方和合作夥伴推出的第三方插件以外,企業還能為不同微軟服務的Copilot建立自己的插件功能,來滿足特定需求與業務場景。甚至,企業在Azure AI上通過語言模型微調或訓練而建立的Copilot,同樣可以利用這個插件機制,進一步擴充企業Copilot的能力,以滿足更多的應用需求。随着越來越多開發者加入并推出支援不同應用或服務的插件,将形成一個豐富且多樣的插件的生态系。

不僅如此,微軟更借助ChatGPT的影響力來加速其建立Copilot的插件生态圈,而決定采用與其相同的開放的插件标準,讓這兩個不同平台之間的插件可以彼此互通。對于開發人員而言,這樣做的好處是,隻要建立一個插件程式,就可以挂載到任何支援這個标準的Copilot或ChatGPT平台中,因為使用相同的插件标準,在其中一方建立的插件使用的檔案或檔案,也可以應用到另一方的插件中,不需重新建立。

微軟現有開發工具開始內建插件标準,來簡化插件功能的開發流程。例如,微軟已經将Visual Studio Code、GitHub Codespaces等工具與新的插件标準內建,可以直接在這些工具中來建立、部署或排程在Copilot接口運作的插件功能。對于想要在M365 Copilot中提供插件的開發者,也能夠利用Visual Studio和指令行接口(CLI)中提供的Teams Toolkit工具,協助其進行插件的建立、測試和排程。

快速了解ChatGPT插件标準

微軟AI新戰略:加速Copilot生态圈發展,支援标準的插件擴充成關鍵

微軟Copilot插件機制采用了與OpenAI ChatGPT相同的開放标準,是以,開發者在其中一方建立插件使用的檔案或檔案,也可以應用到另一方的插件中,不需重新建立。在插件API設計上,Copilot采用和ChatGPT一樣的OpenAPI規範作為标準。(圖檔來源/微軟)

由于微軟Copilot的插件功能采用了與OpenAI的ChatGPT相同的開放标準,開發者也能借由ChatGPT公開的插件規範,快速了解未來建立自己的Copilot應用時,所需遵循相關的标準和規範。

根據OpenAI的說明,開發人員可以利用ChatGPT的插件功能,将其與第三方應用程式進行連接配接,并使用API與ChatGPT互動。

不過,設計ChatGPT的插件時,開發者需建立至少一個調用的API端點,并在該檔案中包含标準化的manifest檔案。manifest檔案如同提供一個指南給ChatGPT,讓它知道何時該用這個插件來回應使用者。所有跟插件相關的metadata資訊都統一記錄于這個檔案中,例如插件名稱、logo商标等,其他還有記載身份驗證所需的資訊,如驗證類型、OAuth URL等。

在manifest檔案中還定義了插件各項功能,其中包含了對于API回應内文的字元數上限,以不超過10萬個字元為限,但同時也保留了未來調整的彈性空間。每個manifest檔案建立完成後,需存儲為JSON格式,并托管在插件API域名下指定”well-known“檔案夾路徑中。

ChatGPT插件的API設計采用OpenAPI規範作為标準,并參考了OpenAPI規範3.0.1版,來定義API中的插件名稱、描述和版本号等相關資訊,提供開發者在設計API時的參照和指引。舉例來說,插件名稱可設為”TODO plugin”,版本号則可以使用”v1”表示插件的初始版本。

此外,在API規範中,對于每個API端點的摘要和參數描述也設有上限,最多不能超過200個字元數,其他則遵照既有OpenAPI格式。公開的API端點中,除了manifest檔案之外,必須包含OpenAPI規範檔案。

一旦插件API端點建立完成并公開後,會有兩種插件的執行環境供開發者使用,本地的開發環境和遠端伺服器環境。考慮到安全性,遠端伺服器環境中要求使用HTTPS伺服器,而在本地開發環境中使用插件的話,則需要事先建立身份驗證機制,否則插件将無法執行。

繼續閱讀