(相關資料圖)
湖北日報訊(記者張真真、通訊員詹欣芮)透過《月光曲》就可以暢談貝多芬的故事,在三維場景里實現(xiàn)精準定位,通過圖像與聲音結合完成場景分析……6月16日,在人工智能框架生態(tài)峰會2023上,中國科學院自動化研究所聯(lián)合武漢人工智能研究院正式發(fā)布“紫東太初”全模態(tài)大模型,種種新奇表現(xiàn)贏得現(xiàn)場觀眾熱烈反響。
“紫東太初”全模態(tài)大模型,是在千億參數(shù)多模態(tài)大模型“紫東太初”1.0基礎上升級打造的2.0版本。
2021年9月,中國科學院自動化研究所成功打造了“紫東太初”1.0多模態(tài)大模型,貫通語音、圖像、文字等信息。比如,AI(人工智能)在學習時,“看到”貓的圖像或者聽到貓的叫聲,就能準確識別出是貓。
除“圖-音-文”外,“紫東太初”2.0加入了視頻、傳感信號、3D點云等更多模態(tài),完成了音樂、圖片和視頻等數(shù)據(jù)之間的跨模態(tài)對齊,能夠處理音樂視頻分析、三維導航等多模態(tài)關聯(lián)應用需求,并可實現(xiàn)音樂、視頻等多模態(tài)內容理解和生成。
中國科學院自動化研究所相關負責人表示,從1.0到2.0,“紫東太初”大模型打通了感知、認知乃至決策的交互屏障,使人工智能進一步感知世界、認知世界,從而延伸出更加強大的通用能力。
“紫東太初”2.0以自動化所自研算法為核心,以國產化基礎軟硬件平臺昇騰AI為基礎,依托武漢人工智能計算中心算力支持,著力打造全棧國產化通用人工智能底座,協(xié)同構建我國通用人工智能自主可控發(fā)展生態(tài)。
目前,“紫東太初”大模型已展現(xiàn)出廣闊的產業(yè)應用前景,在神經(jīng)外科手術導航、短視頻內容審核、法律咨詢、醫(yī)療多模態(tài)鑒別診斷、交通違規(guī)圖像研讀等領域開始了一系列引領性、示范性應用。
在醫(yī)療場景,“紫東太初”大模型部署于神經(jīng)外科機器人,可實現(xiàn)在術中實時融合視覺、觸覺等多模態(tài)信息,協(xié)助醫(yī)生對手術場景進行實時推理判斷,并嘗試在人類罕見病診療這個挑戰(zhàn)性醫(yī)學領域有所突破。
關于我們| 聯(lián)系方式| 版權聲明| 供稿服務| 友情鏈接
咕嚕網(wǎng) www.fyuntv.cn 版權所有,未經(jīng)書面授權禁止使用
Copyright©2008-2023 By All Rights Reserved 皖ICP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com