3月27日报道,今天,阿里巴巴通义千问发布了新一代端到端多模态旗舰模型 Qwen2.5-Omni-7B 。这一模型能够 实时处理文本、图像、音频和视频 等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输出。