用戶名: 密碼: 驗證碼:

字節(jié)跳動發(fā)布兩款視頻生成大模型 面向企業(yè)市場開啟邀測

摘要:字節(jié)跳動火山引擎發(fā)布豆包視頻生成模型,采用DiT架構和擴散模型訓練,具備多鏡頭語言能力,正在內(nèi)測,未來將開放給用戶。

  ICC訊 9月24日,字節(jié)跳動旗下火山引擎發(fā)布兩款視頻生成大模型(豆包視頻生成-PixelDance、豆包視頻生成-Seaweed),首次面向企業(yè)市場開啟邀測。

  火山引擎介紹,豆包視頻生成模型基于DiT架構,通過高效的DiT融合計算單元,能更充分地壓縮編碼視頻與文本,讓視頻在大動態(tài)與運鏡中自由切換,擁有變焦、環(huán)繞、平搖、縮放、目標跟隨等多鏡頭語言能力。

  此外,豆包視頻生成模型另外一大技術創(chuàng)新是全新設計的擴散模型訓練方法攻克了多鏡頭切換的一致性難題。該模型還使用深度優(yōu)化的Transformer結構,大幅提升視頻生成的泛化能力。

  字節(jié)跳動透露,目前,新款豆包視頻生成模型正在即夢AI內(nèi)測版小范圍測試,未來將逐步開放給所有用戶。

1、凡本網(wǎng)注明“來源:訊石光通訊網(wǎng)”及標有原創(chuàng)的所有作品,版權均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載我方內(nèi)容的單位,也必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和本站來源。
2、免責聲明,凡本網(wǎng)注明“來源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。因可能存在第三方轉載無法確定原網(wǎng)地址,若作品內(nèi)容、版權爭議和其它問題,請聯(lián)系本網(wǎng),將第一時間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right