【環(huán)球網(wǎng)科技綜合報道】8月25日,記者從阿里云方面獲悉,阿里云推出大規(guī)模視覺語言模型Qwen-VL,一步到位、直接開源。Qwen-VL以通義千問70億參數(shù)模型Qwen-7B為基座語言模型研發(fā),支持圖文輸入,具備多模態(tài)信息理解能力。
據(jù)了解,Qwen-VL是支持中英文等多種語言的視覺語言(Vision Language,VL)模型,相較于此前的VL模型,Qwen-VL除了具備基本的圖文識別、描述、問答及對話能力之外,還新增了視覺定位、圖像中文字理解等能力。
多模態(tài)是通用人工智能的重要技術(shù)演進方向之一。業(yè)界普遍認為,從單一感官的、僅支持文本輸入的語言模型,到“五官全開”的,支持文本、圖像、音頻等多種信息輸入的多模態(tài)模型,蘊含著大模型智能躍升的巨大可能。
Copyright ? 2001-2026 湖北荊楚網(wǎng)絡(luò)科技股份有限公司 All Rights Reserved
互聯(lián)網(wǎng)新聞信息許可證 4212025003 -
增值電信業(yè)務(wù)經(jīng)營許可證 鄂B2-20231273 -
廣播電視節(jié)目制作經(jīng)營許可證(鄂)字第00011號
信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證 1706144 -
互聯(lián)網(wǎng)出版許可證 (鄂)字3號 -
營業(yè)執(zhí)照
鄂ICP備 13000573號-1
鄂公網(wǎng)安備 42010602000206號
版權(quán)為 荊楚網(wǎng) m.gzjqrwl.com 所有 未經(jīng)同意不得復(fù)制或鏡像