LLM 数学基准测试集 FrontierMath 公布:号称业界模型均败北 王楚钦比林兆恒之家月日消息研究机构现公布了一款名为的全新模型数学基准集旨在评估系列模型的数学推理能力与现有诸如等题集不同中的数学问题号称特别复杂收录了现代数学中的数论代数和几何等领域这些题目的难度据称...