人工智能领域知名团队「问小白」正式发布第四代开源力作——X-Bai 4。这款新模型在复杂逻辑推理与任务处理能力上实现重大突破,其Medium运行模式的综合性能已全面超越OpenAI的GPT-3.5,并在多项测试中展现出比肩Anthropic顶级模型Claude Opus的实力。

X-Bai 4最引人瞩目的创新在于其首创的「反思型生成范式」。该技术融合了长链思维(Long-CoT)强化学习与过程评分学习(Process Reward Learning),使模型不仅能进行深度推理,还能在生成过程中自主评估并优化推理路径。
技术突破:赋予模型「自我反思」能力
传统大模型往往只关注最终结果,而X-Bai 4的创新之处在于:
-
多路径推理: 面对复杂问题时,能同时生成多条推理路径,就像人类会从不同角度思考问题。
-
动态优化: 通过内置评分模块,实时评估各推理链质量,自动选择最优解。
值得一提的是,研发团队通过共享主干网络结构,将过程评分的计算开销降低99%。这一突破显著减少了资源消耗,为实际应用扫清了障碍。
性能表现:多项测试领先业界
X-Bai 4提供三种运行模式,适应不同场景需求。测试数据显示:
-
在Medium模式下,综合推理能力超越GPT-3.5,逻辑推理优势尤为突出。
-
在AIME数学竞赛题测试中,表现接近Claude Opus,展现强大抽象思维能力。
-
在编程挑战LiveCodeBench v5和中文评估C-EVAL中均取得领先。
测试结果表明,X-Bai 4在多领域、多语言任务中都具有出色的泛化能力。
目前该模型已在GitHub开源,项目地址:https://github.com/MetaStone-AI/XBai-o4
注意:使用前请确认设备满足最低运行要求。
