字節跳動基於雲雀模型開發的AI工具豆包大模型團隊宣布開源SuperGPQA,具備高區分度的知識推理基準測試。該數據集覆蓋285個研究生級學科,包括26,529道專業問題,涵蓋主流學科,並納入輕工業、農業及服務科學等長尾學科,填補長尾知識評估領域的空白。(ta/a) 相關內容內地積極推進試點工作 吸引帶動更多社會資本支持科企發展