先说结论:
o1模型的思维链,展示了思维的运动轨迹。对于教授逻辑推理、形式逻辑、解题套路的教培模式,o1 推理引擎是降维打击。
o1 的思考过程,像一个真实的人类在思考、解决一个真实问题。gpt 模型是脱口而出,偏感觉,偏自觉,迅速给你“生成”一个答案。而 o1 模型则会在开口之前先花 2~100 秒之间思考。问题越难,思考时间越长,推理步骤越多,和人的思考简直一模一样。
所以,虽然o1 模型发布无人问津,在中文互联网上几乎没有一点点回响,有点像 2022 年 11 月 30 日 ChatGPT 的发布。(互联网数据传输的速度接近光速,但是影响和意义的传递,往往需要三个月的时间。)
但是,o1推理模型开启了人工智能的新范式。这个模型和 gpt 系列模型是有本质差异的,在算法和数据上差异巨大,所以,openai 才会放弃 gpt品牌,单独命名为 o 系列模型。(所以,不能说“gpt-o1”模型,就像你不能把张三叫做李四)。
o1模型对人类的冲击,虽然还需要几个月才会被认识。所以不着急,我简单分享几个案例,分享一下目前的认识和思考。
实例
我选了几个案例,从简单到复杂,全方位由浅入深地展示o1引擎的本质。
实例 1:列出全部第三个字母是 A 的国家
这个题目很简单,但是很有意思,展示了gpt模型和o1模型的本质区别。
gpt4-o 作为直觉式的知识引擎,用 3 秒生成了一个错误回答,而 o1-mini 作为推理引擎,用 9 秒生成了正确的回答,而且让你看到思维运动的轨迹。
实例 2:小学数学题,方阵问题
这个例子来自学而思的小学数学练习册。题目很简单,关键看思维过程。如果你觉得简单,后面还有高考题和数学竞赛题的例子。
实例 3:2024 高考数学真题
让o1参考2024年高考的话,毫不费力可以满分。
我选了两个题,大家感受一下:
实例 4:阿里巴巴数学竞赛真题:概率问题
这是2024年阿赛真题,概率问题。
o1的解题过程如下。第一问:
第二问:
思考
学习的本质属性,是主动。有效的教育,一定是让学生学会主动思考,独立思考(think for yourself),同时要训练有素地思考复杂问题,头脑清晰。
而教培模式的一大问题是惰化思维,强化套路,看似应试分数提高,实际上思维能力衰弱,主动性和创造力更谈不上。
o1 模型把人脑中看不到的思维运动过程展示出来了。这还不是一般的人脑,而是物理博士、编程专家、数学奥赛选手级别的大脑思维过程。整个思维过程体现了o1模型在解决复杂问题时的步骤流程方法,孩子活成年学习者可以清晰地看到o1 模型如何提炼思考过程,如何尝试不同的解题策略,如何发现错误,如何根据错误来不断调整。
在教育场景,知识引擎 gpt 模型解决了注重世界知识的学习和教育需求(非形式逻辑、非强逻辑推理的领域),而逻辑引擎 o1 模型则解决了注重逻辑推理的学习和教育需求(科学、数学、编程等)。
或许,o1 的脑子如此清晰,提供的教育价值如此之大,如果不能靠它的帮助取得学习效果,只能靠别人教的话,建议别学了。
P.s. 昨天晚上做了 o1 的专场直播,用 2 个小时时间详细分享了对 O1 模型的思考,尤其是关于人类学习和教育的未来。有兴趣的朋友可以去看看。