性能提升40% 阿里开源千问3向量模型

2025年06月06日 | 查看: 58938

6月6日，阿里开源通义千问3全新的向量模型系列Qwen3-Embedding（简称千问3向量模型）。该模型以千问3为底座，专门为文本表征、检索和排序等核心任务进行优化训练，性能较上一版本可提升40%，在MTEB等权威专项榜单中超越了谷歌、OpenAI、微软等公司的顶尖模型。

Qwen3-Embedding 系列模型

性能提升40% 阿里开源千问3向量模型
图片来源于网络，如有侵权，请联系删除

向量模型像是AI的“翻译器”，它可以将文本、图片等人类可认知的非结构化信息，映射到机器更易理解的向量空间，再基于这些向量实现高效的信息分类、检索或排序。也正因此，向量模型对于提升AI的语义理解、信息检索、多模态融合等核心能力至关重要。基于千问3模型，通义团队通过对比训练、SFT、模型融合等方法，打造出全新的千问3向量模型，包含文本嵌入模型 Qwen3-Embedding以及文本排序模型Qwen3-Reranker。

性能提升40% 阿里开源千问3向量模型
图片来源于网络，如有侵权，请联系删除

千问3向量模型系列训练过程图

相较于上一个版本，千问3向量模型在文本检索、聚类、分类等核心任务上提升最高40%以上的性能。同时，得益于千问3的多语言能力，千问3向量模型系列率先支持超100种语言，并涵盖多种编程语言，可实现强大的多语言、跨语言及代码检索能力。

为方便开发者，此次有9款千问3向量模型开源，涵盖0.6B、4B、8B等不同尺寸及GGUF版本。开发者可从中找到最符合需求的模型，自由组合模块，还可自定义向量或指令，实现特定任务、语言和场景的深度优化。比如，开发者可在智能搜索、推荐系统中采用Qwen3-Embedding作文本向量化，或者在RAG实践中用Qwen3-Reranker提升最终结果的相关性和准确性，甚至与视觉理解模型结合，探索前沿的跨模态语义理解。

目前，千问3 Embedding和Reranker模型均已在魔搭社区、Hugging Face和GitHub等平台上开源，开发者也可直接通过阿里云百炼使用API服务。

【纠错】【责任编辑:凌纪伟】

阅读下一篇：

深度观察

新华全媒头条丨携手推动绿色发展共筑生态文明之基

新华全媒+丨各美其美！共绘美丽中国建设新画卷
文化新观察丨第二十一届中国国际动漫节展现产业新气象
拍案丨保护长江生态，这些案例彰显法治之力
新闻分析丨AI时代的物流创新：人类依然是决策核心
经济参考报丨多部门释放金融加力支持科技创新信号
新华每日电讯丨外婆村医：“赶考”半生，只为护佑一村

“三北”工程很科技
一袋垃圾见证绿色守护

关键词：

上一篇：新华社消息｜我国成功发射卫星互联网低轨卫星

下一篇：以旧换新换出增长新动能

科技

性能提升40% 阿里开源千问3向量模型

其它推荐