阿里千问全模态模型上线 多模态能力显著增强

  阿里千问宣布全模态大模型Qwen3.5-Omni上线。这一系列包括Plus、Flash、Light三种尺寸的Instruct版本实时热点,支持256k长上下文,能够处理超过10小时的音频输入及超过400秒的720P(1FPS)音视频输入。该模型在大量文本、视觉以及超过1亿小时的音视频数据上进行了原生多模态预训练,展现出卓越的全模态感知与生成能力。相比之前的Qwen3-Omni,新版本在多语言能力上有了显著提升,能够支持113种语种和方言的语音识别及36种语种和方言的语音生成。阿里千问全模态模型上线 多模态能力显著增强