点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
【洞见·TMT】
国际权威大模型评测平台
LiveBench于近日发布最新榜单
阿里巴巴开源推出的
新一代通义千问模型
Qwen3-235B-A22B
在本次排名中
位列全球开源模型首位
Qwen3在LiveBench本次排名中
位列全球开源模型首位
图源:通义千问
在指令遵循(Instruction Following)
这一关键能力上
Qwen3超越了
包括o3 High、o4-Mini High、
Gemini 2.5 pro等在内的
多个国际顶级闭源模型
位居全球第一
LiveBench榜单
由图灵奖得主、Meta首席AI科学家
与纽约大学等机构联合发起
评估维度涵盖数学、推理、编程
和语言理解等多个复杂领域
该榜单采用动态更新的测试题库
确保评测过程公平公正
因此被誉为
“全球首个无法作弊的模型基准测试”
图源:新智元
Qwen3是阿里巴巴
于4月29日凌晨正式发布的
开源新一代通义千问模型
其参数量仅为DeepSeek-R1三分之一
但综合性能全面领先R1、
OpenAI-o1等国际一流模型
同时大幅降低了使用成本
值得一提的是
Qwen3还实现了“混合推理”
即将“快思考”与“慢思考”机制
融合于同一架构之中
对于简单任务可快速作答
显著降低算力需求
而对于复杂问题
则可通过多步骤深度分析
给出更高质量的结果
显著提升性能的同时
Qwen3的部署门槛也明显降低
只需配备4张H20显卡
即可运行Qwen3的完整版本
其显存占用
也仅为同类性能模型的三分之一
极大提升了部署效率与实用性
参考:上海证券报、观点网、中关村在线、新智元
撰文:雷渺鑫 统筹:李政葳