內媒報道,阿里千問正式發布最新一代全模態大模型Qwen3.5-Omni。該模型在215項第三方性能測試中取得SOTA(當前最優效果),在音視頻理解與實時交互等多項核心指標上超越Google Gemini-3.1 Pro。
技術層面上,Qwen3.5-Omni系列包含Plus、Flash及Light三種尺寸的Instruct版本,支持256k長上下文,模型支持超過10小時的音頻輸入及超過400秒的720P(1FPS)音視頻輸入。模型在海量文本、視覺以及超過1億小時的音視頻數據上進行原生多模態預訓練,該模型展現出卓越的全模態感知與生成能力。相比Qwen3-Omni及Qwen3.5-Omni多語言能力大大增強,能夠支持113種語種和方言的語音識別和36種語種和方言的語音生成。
相關內容《大行》富瑞降美圖(01357.HK)目標價至7元 維持「買入」評級
目前,Qwen3.5-Omni的Plus、Flash、Light三種API已在阿里雲百鍊平台上線。其API調用定價為每百萬Tokens輸入不足0.8元人民幣,不到Gemini-3.1 Pro價格的十分之一。阿里表示,千問目前服務涵蓋互聯網、金融、消費電子及汽車等行業超過100萬家客戶,穩居內地企業級大模型調用量首位。(ta/w)
AASTOCKS新聞