标语:一项评估专家级科学推理能力的基准测试
介绍:前沿科学测评(FrontierScience)是评估人工智能在物理、化学和生物领域达到专家水平科学推理能力的全新标准。它既衡量人工智能解决类似奥林匹克竞赛风格问题的能力,也考量其完成实际研究任务的表现,有助于跟踪先进模型在支持和加速科学研究工作方面的成效。
Product Hunt: 查看详情
产品网站: 立即访问
关键词:OpenAI,FrontierScience,科学推理评估基准,物理化学和生物学,奥赛风格问题解决,实际研究任务,加速科学工作
票数:🔺212
是否精选:是
发布时间:2025年12月20日 PM04:01 (北京时间)