TeleAI “复杂推理大模型” 达竞赛级数学表现，评分超 o1-preview

近日，中国电信人工智能研究院（TeleAI）“复杂推理大模型” TeleAI-t1-preview 正式发布，即将上线天翼 AI 开放平台。TeleAI-t1-preview 使用了强化学习训练方法，通过引入探索、反思等思考范式，大幅提升模型在数学推导、逻辑推理等复杂问题的准确性。

早在 1500 多年前，数学家祖冲之就曾在《辩戴法兴难新历》中指出，复杂事物的运行规律并非超自然现象，而是可以通过实际观测、数据推理而严谨求得。

数学知识的系统性和相互关联性，以及通过推理找到问题根源，是几千年来数学发展的母题。大模型的创新也正在不断与之靠近，用严密的思维链路，摆脱幻觉的怪圈。

评分超 o1-preview，达竞赛级数学表现

在美国数学竞赛 AIME 2024 、MATH500 两项权威数学基准评测中，TeleAI-t1-preview 分别以 60 和 93.8 分的成绩，大幅超越 OpenAI o1-preview、GPT-4o 等标杆模型。在研究生级别问答测试 GPQA Diamond 中，TeleAI-t1-preview 得分超过 GPT-4o，并比肩 Claude 3.5 Sonnet 的性能水准。