“一个技术能实现商业化,才能实现正向循环。”
来源|多知
作者|徐晶晶
少有地,粉笔为了新产品开了次隆重的发布会。粉笔创始人、CEO张小龙甚至按捺不住提前一个月便开始了新产品的剧透——足见内部对AI产品的重视与期望之高。
在今天的发布会上,粉笔正式推出自主研发的首个专注于职教行业的垂域大模型,并宣布将于8月1日正式上线C端AI产品——粉笔AI老师 “粉笔头”。
而且,粉笔相信,这款粉笔AI老师能“收得起费”。张小龙笃定:“一个技术能实现商业化,才能实现正向循环。”
01
“未来挑战仍在,但是教育重塑的进程已不可阻挡”
据粉笔CTO陈建华介绍,粉笔AI老师将基于学员备考过程的十大服务场景(从入班测试到理论学习,再到强化练习、模拟套卷,直到最后的冲刺阶段),全程陪伴。
陈建华回顾了粉笔内部探索AI的进程。
2022年底,当ChatGPT震撼发布后,围绕大模型技术如何为业务发展注入活力,团队一直在思考三个问题:
1.prompt的重要性是被低估了还是被高估了?
粉笔认为,更多的时候prompt提示词的重要性被低估了,一个高质量的prompt才能更好地发挥大模型的能力。而且一个高质量的prompt不仅需要很多的技巧和设计,更需要对问题所在领域的深入理解和抽象。
2.AGI通用人工智能会不会在短期内实现?
粉笔对AGI的理解是基于现有的大模型,还需要叠加长期记忆的能力,更好地逻辑推理能力和自我进化的能力。对于AGI的实现,粉笔长期保持乐观,但是认为短期内会面临比较大的挑战。
3.垂直领域的模型有没有存在的必要?
业内一直有一种观点,认为随着通用大模型能力的普遍增强,垂直领域的模型没有存在的必要,对此,粉笔并不同意。粉笔认为,基于独有的数据、教研的长期积累和对用户的深度洞察,垂域模型一定可以在职教这个领域做出比通用大模型更好的效果。
带着初步的判断,粉笔从2023年第一季度开始探索大模型和教育的结合,在教育等垂直场景中,通用大模型的表现存在局限:
在部分场景里,通用大模型的表现不及预期。比如在答题场景下,通用大模型在回答行测这类客观题时,正确率非常低;在命题场景下,通用大模型只能模仿题目的形态,无法满足题目的难度、内容和考点设置等需求。
当然,通用大模型也有擅长的地方,比如面试点评。
综上,粉笔随后有了初步的结论与成果:
其一,大模型在B端内部提效方面容易率先落地。例如应用于面试点评场景,通过大模型给出点评的内容,然后再由辅导老师把关输出到学生端,可以达到非常好的效果。
陈建华透露:“面试点评是学生备考的刚需,之前主要由老师人工完成,工作量大、效率低、单价高。借助AI辅助老师进行面试点评,真人老师的点评时间可以从20分钟缩短到5分钟之内。根据我们的评测,AI面试点评的可用率也可以在90%以上。”
其二,在点评这类受限的小场景下,通用大模型可以实现非常好的效果,并且可控。
其三,在准确性要求比较高的教育场景下,C端应用的落地会面临着非常大的挑战,其中最大的挑战就是大模型的“幻觉”问题。而“幻觉”问题对于容错率极低的教育行业来说非常致命。
由此,粉笔也进一步明确接下来要走的路:
首先,垂域大模型开发极有必要。
“职教类考试拥有一套全面的、独特的考察体系。而面对这类考察体系,通用大模型的表现并不尽如人意。开发垂域大模型就意味着我们可以用更小的模型、更低的成本实现更好的效果。对于粉笔来说这是非常必要的,而且是切实可行的。”
第二,可以借助RAG检索辅助来克服幻觉。
在学生备考的场景中,粉笔积累了大量高质量的知识库数据。通过RAG的方式可以让大模型对于问题的理解更加契合学员的需求,回答也更加准确。
基于此,为了提供更专业精准的教育解决方案,粉笔决心投入开发自研垂域大模型。
当然,研发垂域大模型的过程中,粉笔也难免遭遇了一些挑战。
第一个挑战是意图识别。
陈建华说:“在一个相对开放的环境中,让垂域大模型真正担任老师的角色、回答学员的问题时,学生提问的方式会比我们想象的复杂得多。比如一道题目,用户既可以问题干,又可以问选项,还可以结合题目对应的知识点延伸发问。而且学生得提问方式多变,他可能会问:‘老师,这道题目太难了,能再给我讲一遍吗?’这涉及的是题目的讲解。他可能问:‘老师,这道题太难了,中心理解题该怎么做?’这涉及到知识点的答疑。他还可能问:‘老师,这道题目太难了,行测该怎么学?’这对学习规划的需求。”
粉笔的解决思路是,经过十多轮的数据标注后,不断地明确场景的边界,优化算法策略。据介绍,粉笔助教及老师提供了约5亿条对话模板,粉笔题库练习次数累计37.48亿次,用户做题量有613亿道。在此基础上,粉笔将用户对话场景细分为11大类、42个小类,处理超过30万条会话模板,提升AI老师处理复杂对话的能力。陈建华表示,经过不断的数据标注和算法优化,粉笔大模型意图识别准确率可以达到98%以上,显著改善大模型幻觉问题。
第二个挑战是在如何避免幻觉的基础上给出精准的回答。
一方面,基于粉笔10年来的教研积累、独有数据,搭建RAG系统,同时利用CoT、思维链让大模型按照步骤一步一步地进行推理;另一方面采用分治法,加强大模型对问题的理解,将复杂的问题拆分成足够简单的任务,效果远好过于直接将复杂的任务交给模型处理。
从效果反馈来说,陈建华透露,根据内测数据,以题目答疑场景为例,在“粉笔垂域大模型+RAG”的作用下,粉笔AI老师在言语、资料、常识、判断、数量多方面表现均优于市面上主流通用大模型产品。
(图源自粉笔)
据透露,下一步,粉笔正在开发更加丰富的AI场景:预计今年会上线申论AI老师,会采用启发式答疑的方式引导学员审理梳理要点,进行作答,同时可以进行批改和讲解。此外,粉笔也在筹备面试AI老师、事业单位和教师项目的AI老师等。
“未来挑战仍在,但是教育重塑的进程已经不可阻挡。”陈建华说。
02
粉笔AI老师诞生背后:团队如何协作?
发布会上,粉笔副总裁刘帅从团队搭建、教研视角讲述了粉笔AI老师的诞生过程。
在团队搭建方面,“为了能够让AI老师快速落地,我们首先搭建了一支非常专业的团队,包括丰富授课经验的大课老师、常年在一线为用户提供辅导和答疑工作的辅导老师、还有常年深耕于教研的教研员、非常了解用户沟通方式的运营同事及大量为用户提供咨询的客服同事。”
以上文提到的解决用户的意图识别为例,刘帅表示:“我们的辅导老师每天为用户提供答疑类工作,非常清楚用户的表述方式,了解用户的意图。我们最高峰期时曾经有3013位辅导老师同时在为用户提供辅导和答疑类的工作。收集到这么多学员的问题和意图之后,再将其同步到教研和大课老师侧,由他们再给予专业性的分类和专业的解答。”
接下来,团队要解决的是,AI如何更加智能、更懂内容。
刘帅介绍,粉笔AI老师依托于粉笔自研职教垂域大模型,首先,需要将公考领域的专业知识转化成AI可以识别的学习语言,为AI老师去搭建知识框架,为它提供学习的养料。粉笔收集了大量的图书、题库、课程、知识库、考情等内容。其次,为了让AI老师针对不同画像的用户给出针对性的学习建议和辅导,粉笔将每一个考点定义了能力值。此外,还要从学员的基础和学员自身的情况出发,最终将学员分为了九大类。
接下来,粉笔需要针对不同的产品做不同的阶段划分。以系统班为例,包含理论、强化、刷题、冲刺四个阶段。每个阶段学习目标和学习任务都不一样。如何在每个阶段给用户推送他的学习任务和目标,提供什么样的督学方案,就成为粉笔工作的重心。“我们最终会把学员的学习完成度和学员对这件事情的接受度都考虑进去,这也是我们工作的另一难点。”
目前,粉笔AI老师推出七大功能,刘帅介绍了其中三个重点功能:
关于课程脉络功能。要实现课程脉络,需要在授课过程中,知识点和知识点之间要有鲜明的过渡,题目和题目之间要有明确的切割。只有这样,AI老师才能快速识别定位到知识点和题目的位置,在学员提出疑惑的时候进行精准推送。
关于题目答疑功能。粉笔在题库搭建时,已经标注了所有的易错题目和易错选项,这样可以方便AI老师快速定位错题点,并且精准为用户提供题目答疑类的工作。
关于考情答疑功能。考情答疑其实是最个性化的一部分服务。粉笔职位小助手搜集了近些年的报考数据,再结合用户自身的情况和对岗位的定位,就可以为用户提供个性化针对性的报考的指导和建议。
刘帅表示,粉笔AI老师也将是未来粉笔主流的最高端的产品之一。
在内部提效方面,刘帅举例,2021年2月,粉笔一位辅导老师同时只能服务40位学员,到了2024年2月的时候,一位辅导老师可以同期服务120位学员,最高峰期时一位老师可以服务150位学员。
“我们希望在不久的将来,AI老师不仅可以提供答疑辅导类的工作,它还可以像一个真正的老师一样以虚拟老师的身份出现在课堂上,为我们呈现各类课程的授课。”刘帅展望道。
发布会上,刘帅还梳理了公考培训行业业态的演变:从最初线下1.0阶段,到在线大班课的2.0阶段,到线上线下相结合的3.0阶段,再到如今AI技术加持的4.0阶段。
在这个演变过程中,粉笔经历了2.0阶段的系统班;2019年推出了3.0阶段的OMO精品班。“接下来,随着AI技术的应用和升级,粉笔在2024年逐渐迈入了4.0阶段。”
03
做一款“收得起费”的AI产品:“一个技术能实现商业化,才能实现正向循环”
张小龙一直以来的观点是,一个现代化的企业应该是系统化、产品化的(不能有特别重的个人色彩)。多年来,粉笔也在沿着这个思路不断前行:从早期的系统班,到今天的粉笔AI老师,都是典型的将新技术和优质内容结合的产品。
他认为:“科技是解放人、服务人的。它解放人之后,让人的生活变得更有趣、更意义,人才能做更有创造力的事。新科技可能短期内会带来阵痛,但中长期会创造出更多不同的就业种类和岗位。”
发布会的最后,张小龙强调,粉笔AI老师作为一款C端的AI产品,是“收费”且“收得起费”的。
“我们相信这款产品是收得起费的,惟有商业模式成立,企业才能在技术上持续投入。一个技术能实现商业化,才能实现正向的循环。中国有非常广阔的应用前景,实现商业化之后,又反过来可以加速技术的进步。”张小龙说。“希望早日实现技术在具体领域、在垂直领域的正向循环,这样能够让各个行业、各个领域能够得到更好更快速的发展,尤其是在应用领域得到更广阔、更快速的发展。”
“中国科技领域的朋友们,不要都去盯着通用大模型,我们可以多一些针对具体领域的具体服务,早日实现商业化,为中国的社会经济以及就业,做出企业应该做的贡献。”张小龙最后建议道。
END
本文作者:徐晶晶
《教育科技这一年·2022》+《培训行业这一年·2021》+《教育科技行业图谱2022-2023》,重磅发售!