“一個技術能實作商業化,才能實作正向循環。”
來源|多知
作者|徐晶晶
少有地,粉筆為了新産品開了次隆重的釋出會。粉筆創始人、CEO張小龍甚至按捺不住提前一個月便開始了新産品的劇透——足見内部對AI産品的重視與期望之高。
在今天的釋出會上,粉筆正式推出自主研發的首個專注于職教行業的垂域大模型,并宣布将于8月1日正式上線C端AI産品——粉筆AI老師 “粉筆頭”。
而且,粉筆相信,這款粉筆AI老師能“收得起費”。張小龍笃定:“一個技術能實作商業化,才能實作正向循環。”
01
“未來挑戰仍在,但是教育重塑的程序已不可阻擋”
據粉筆CTO陳建華介紹,粉筆AI老師将基于學員備考過程的十大服務場景(從入班測試到理論學習,再到強化練習、模拟套卷,直到最後的沖刺階段),全程陪伴。
陳建華回顧了粉筆内部探索AI的程序。
2022年底,當ChatGPT震撼釋出後,圍繞大模型技術如何為業務發展注入活力,團隊一直在思考三個問題:
1.prompt的重要性是被低估了還是被高估了?
粉筆認為,更多的時候prompt提示詞的重要性被低估了,一個高品質的prompt才能更好地發揮大模型的能力。而且一個高品質的prompt不僅需要很多的技巧和設計,更需要對問題所在領域的深入了解和抽象。
2.AGI通用人工智能會不會在短期内實作?
粉筆對AGI的了解是基于現有的大模型,還需要疊加長期記憶的能力,更好地邏輯推理能力和自我進化的能力。對于AGI的實作,粉筆長期保持樂觀,但是認為短期内會面臨比較大的挑戰。
3.垂直領域的模型有沒有存在的必要?
業内一直有一種觀點,認為随着通用大模型能力的普遍增強,垂直領域的模型沒有存在的必要,對此,粉筆并不同意。粉筆認為,基于獨有的資料、教研的長期積累和對使用者的深度洞察,垂域模型一定可以在職教這個領域做出比通用大模型更好的效果。
帶着初步的判斷,粉筆從2023年第一季度開始探索大模型和教育的結合,在教育等垂直場景中,通用大模型的表現存在局限:
在部分場景裡,通用大模型的表現不及預期。比如在答題場景下,通用大模型在回答行測這類客觀題時,正确率非常低;在命題場景下,通用大模型隻能模仿題目的形态,無法滿足題目的難度、内容和考點設定等需求。
當然,通用大模型也有擅長的地方,比如面試點評。
綜上,粉筆随後有了初步的結論與成果:
其一,大模型在B端内部提效方面容易率先落地。例如應用于面試點評場景,通過大模型給出點評的内容,然後再由輔導老師把關輸出到學生端,可以達到非常好的效果。
陳建華透露:“面試點評是學生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價高。借助AI輔助老師進行面試點評,真人老師的點評時間可以從20分鐘縮短到5分鐘之内。根據我們的評測,AI面試點評的可用率也可以在90%以上。”
其二,在點評這類受限的小場景下,通用大模型可以實作非常好的效果,并且可控。
其三,在準确性要求比較高的教育場景下,C端應用的落地會面臨着非常大的挑戰,其中最大的挑戰就是大模型的“幻覺”問題。而“幻覺”問題對于容錯率極低的教育行業來說非常緻命。
由此,粉筆也進一步明确接下來要走的路:
首先,垂域大模型開發極有必要。
“職教類考試擁有一套全面的、獨特的考察體系。而面對這類考察體系,通用大模型的表現并不盡如人意。開發垂域大模型就意味着我們可以用更小的模型、更低的成本實作更好的效果。對于粉筆來說這是非常必要的,而且是切實可行的。”
第二,可以借助RAG檢索輔助來克服幻覺。
在學生備考的場景中,粉筆積累了大量高品質的知識庫資料。通過RAG的方式可以讓大模型對于問題的了解更加契合學員的需求,回答也更加準确。
基于此,為了提供更專業精準的教育解決方案,粉筆決心投入開發自研垂域大模型。
當然,研發垂域大模型的過程中,粉筆也難免遭遇了一些挑戰。
第一個挑戰是意圖識别。
陳建華說:“在一個相對開放的環境中,讓垂域大模型真正擔任老師的角色、回答學員的問題時,學生提問的方式會比我們想象的複雜得多。比如一道題目,使用者既可以問題幹,又可以問選項,還可以結合題目對應的知識點延伸發問。而且學生得提問方式多變,他可能會問:‘老師,這道題目太難了,能再給我講一遍嗎?’這涉及的是題目的講解。他可能問:‘老師,這道題太難了,中心了解題該怎麼做?’這涉及到知識點的答疑。他還可能問:‘老師,這道題目太難了,行測該怎麼學?’這對學習規劃的需求。”
粉筆的解決思路是,經過十多輪的資料标注後,不斷地明确場景的邊界,優化算法政策。據介紹,粉筆助教及老師提供了約5億條對話模闆,粉筆題庫練習次數累計37.48億次,使用者做題量有613億道。在此基礎上,粉筆将使用者對話場景細分為11大類、42個小類,處理超過30萬條會話模闆,提升AI老師處理複雜對話的能力。陳建華表示,經過不斷的資料标注和算法優化,粉筆大模型意圖識别準确率可以達到98%以上,顯著改善大模型幻覺問題。
第二個挑戰是在如何避免幻覺的基礎上給出精準的回答。
一方面,基于粉筆10年來的教研積累、獨有資料,搭建RAG系統,同時利用CoT、思維鍊讓大模型按照步驟一步一步地進行推理;另一方面采用分治法,加強大模型對問題的了解,将複雜的問題拆分成足夠簡單的任務,效果遠好過于直接将複雜的任務交給模型處理。
從效果回報來說,陳建華透露,根據内測資料,以題目答疑場景為例,在“粉筆垂域大模型+RAG”的作用下,粉筆AI老師在言語、資料、常識、判斷、數量多方面表現均優于市面上主流通用大模型産品。
(圖源自粉筆)
據透露,下一步,粉筆正在開發更加豐富的AI場景:預計今年會上線申論AI老師,會采用啟發式答疑的方式引導學員審理梳理要點,進行作答,同時可以進行批改和講解。此外,粉筆也在籌備面試AI老師、事業機關和教師項目的AI老師等。
“未來挑戰仍在,但是教育重塑的程序已經不可阻擋。”陳建華說。
02
粉筆AI老師誕生背後:團隊如何協作?
釋出會上,粉筆副總裁劉帥從團隊搭建、教研視角講述了粉筆AI老師的誕生過程。
在團隊搭建方面,“為了能夠讓AI老師快速落地,我們首先搭建了一支非常專業的團隊,包括豐富授課經驗的大課老師、常年在一線為使用者提供輔導和答疑工作的輔導老師、還有常年深耕于教研的教研員、非常了解使用者溝通方式的營運同僚及大量為使用者提供咨詢的客服同僚。”
以上文提到的解決使用者的意圖識别為例,劉帥表示:“我們的輔導老師每天為使用者提供答疑類工作,非常清楚使用者的表述方式,了解使用者的意圖。我們最高峰期時曾經有3013位輔導老師同時在為使用者提供輔導和答疑類的工作。收集到這麼多學員的問題和意圖之後,再将其同步到教研和大課老師側,由他們再給予專業性的分類和專業的解答。”
接下來,團隊要解決的是,AI如何更加智能、更懂内容。
劉帥介紹,粉筆AI老師依托于粉筆自研職教垂域大模型,首先,需要将公考領域的專業知識轉化成AI可以識别的學習語言,為AI老師去搭建知識架構,為它提供學習的養料。粉筆收集了大量的圖書、題庫、課程、知識庫、考情等内容。其次,為了讓AI老師針對不同畫像的使用者給出針對性的學習建議和輔導,粉筆将每一個考點定義了能力值。此外,還要從學員的基礎和學員自身的情況出發,最終将學員分為了九大類。
接下來,粉筆需要針對不同的産品做不同的階段劃分。以系統班為例,包含理論、強化、刷題、沖刺四個階段。每個階段學習目标和學習任務都不一樣。如何在每個階段給使用者推送他的學習任務和目标,提供什麼樣的督學方案,就成為粉筆工作的重心。“我們最終會把學員的學習完成度和學員對這件事情的接受度都考慮進去,這也是我們工作的另一難點。”
目前,粉筆AI老師推出七大功能,劉帥介紹了其中三個重點功能:
關于課程脈絡功能。要實作課程脈絡,需要在授課過程中,知識點和知識點之間要有鮮明的過渡,題目和題目之間要有明确的切割。隻有這樣,AI老師才能快速識别定位到知識點和題目的位置,在學員提出疑惑的時候進行精準推送。
關于題目答疑功能。粉筆在題庫搭建時,已經标注了所有的易錯題目和易錯選項,這樣可以友善AI老師快速定位錯題點,并且精準為使用者提供題目答疑類的工作。
關于考情答疑功能。考情答疑其實是最個性化的一部分服務。粉筆職位小助手搜集了近些年的報考資料,再結合使用者自身的情況和對崗位的定位,就可以為使用者提供個性化針對性的報考的指導和建議。
劉帥表示,粉筆AI老師也将是未來粉筆主流的最高端的産品之一。
在内部提效方面,劉帥舉例,2021年2月,粉筆一位輔導老師同時隻能服務40位學員,到了2024年2月的時候,一位輔導老師可以同期服務120位學員,最高峰期時一位老師可以服務150位學員。
“我們希望在不久的将來,AI老師不僅可以提供答疑輔導類的工作,它還可以像一個真正的老師一樣以虛拟老師的身份出現在課堂上,為我們呈現各類課程的授課。”劉帥展望道。
釋出會上,劉帥還梳理了公考教育訓練行業業态的演變:從最初線下1.0階段,到線上大班課的2.0階段,到線上線下相結合的3.0階段,再到如今AI技術加持的4.0階段。
在這個演變過程中,粉筆經曆了2.0階段的系統班;2019年推出了3.0階段的OMO精品班。“接下來,随着AI技術的應用和更新,粉筆在2024年逐漸邁入了4.0階段。”
03
做一款“收得起費”的AI産品:“一個技術能實作商業化,才能實作正向循環”
張小龍一直以來的觀點是,一個現代化的企業應該是系統化、産品化的(不能有特别重的個人色彩)。多年來,粉筆也在沿着這個思路不斷前行:從早期的系統班,到今天的粉筆AI老師,都是典型的将新技術和優質内容結合的産品。
他認為:“科技是解放人、服務人的。它解放人之後,讓人的生活變得更有趣、更意義,人才能做更有創造力的事。新科技可能短期内會帶來陣痛,但中長期會創造出更多不同的就業種類和崗位。”
釋出會的最後,張小龍強調,粉筆AI老師作為一款C端的AI産品,是“收費”且“收得起費”的。
“我們相信這款産品是收得起費的,惟有商業模式成立,企業才能在技術上持續投入。一個技術能實作商業化,才能實作正向的循環。中國有非常廣闊的應用前景,實作商業化之後,又反過來可以加速技術的進步。”張小龍說。“希望早日實作技術在具體領域、在垂直領域的正向循環,這樣能夠讓各個行業、各個領域能夠得到更好更快速的發展,尤其是在應用領域得到更廣闊、更快速的發展。”
“中國科技領域的朋友們,不要都去盯着通用大模型,我們可以多一些針對具體領域的具體服務,早日實作商業化,為中國的社會經濟以及就業,做出企業應該做的貢獻。”張小龍最後建議道。
END
本文作者:徐晶晶
《教育科技這一年·2022》+《教育訓練行業這一年·2021》+《教育科技行業圖譜2022-2023》,重磅發售!