在今天召開的火山引擎Force原動力大會上,豆包大模型1.8正式發(fā)布,多模態(tài)Agent能力媲美全球頂尖模型。
據(jù)了解,豆包大模型1.8面向多模態(tài)Agent場景進(jìn)行了定向優(yōu)化。其工具調(diào)用能力、復(fù)雜指令遵循能力及OS Agent能力顯著增強(qiáng),大幅提升了模型在處理復(fù)雜任務(wù)時的規(guī)劃與執(zhí)行水平。
評測數(shù)據(jù)顯示,豆包大模型1.8在視覺推理、通用視覺問答、空間理解及視頻理解等任務(wù)中,均獲得最佳或接近最佳成績;在通用智能體測評集BrowseComp上表現(xiàn)全球領(lǐng)先。
此外,在數(shù)學(xué)與推理等語言模型基礎(chǔ)能力維度上,整體水平也接近全球頂尖的通用模型。
目前豆包1.8模型已在火山引擎上線,面向企業(yè)和開發(fā)者開放API。
豆包音視頻創(chuàng)作模型Seedance 1.5 pro一同發(fā)布,原生支持音視頻聯(lián)合生成,在視聽協(xié)同、視覺張力和敘事協(xié)調(diào)性等方面實(shí)現(xiàn)突破。已在豆包App(灰度測試)、即夢AI、火山引擎體驗(yàn)中心上線。