首页 > 实用技巧 > 干货教程 > AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

发布时间:2024-06-19 22:58:06

Runway前脚刚发布Gen-3 Alpha,Google后脚就跟了个王炸。

 

北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐逼真的音效,甚至是人物之间的对话

 

V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由自家在五月份发布的生成视频模型“Veo”和V2A技术合作打造

 

有不少网友表示,这下终于可以给用Luma生成的meme视频配上声音了!

 

从Google Deepmind官网发布的Blog上看,V2A技术会采用视频像素文本提示来生成与底层视频同步的音频波形。

 

首先,V2A会对视频和文本提示进行编码,并通过扩散模型迭代运行,将随机噪声细化为与视频和所提供的文本提示相匹配的真实音频,最后再对音频进行解码并与视频数据相结合。

 

X网友纷纷表示太赞了,但就是有一个小小小小的问题,和同样是凌晨发布的Runway的视频生成模型Gen-3 Alpha一样,这

又是一个大家都用不上的超赞模型,到底啥时候开源让咱们试试水!

干货教程更多>>

捷尼赛思计划五年内欧洲销量增长650%,全系车型将推Magma高性能版本 现代IONIQ 6 N正式在英国开启预订,起售价65,800英镑 特斯拉成加州去年市场份额流失最多的车企 一图读懂2025全球汽车销量TOP10国家 钧舵机器人牵手四家企业,组建生态联盟 1.1万家汽修厂苦等“接盘侠”,还有2.8万新玩家进场,谁被淘汰、谁在狂飙? 赛恩领动获全球头部车企定点 4D成像雷达量产进程再提速 频获海外项目定点,保隆科技“全球化2.0”做对了什么? 谷歌承认安卓“读出所选内容”功能 BUG 会导致音量键失灵 小米高管谈企业喷同行模仿 因羡慕嫉妒恨:苹果谷歌也大量买和抄 现代汽车聘请前英伟达、特斯拉高管领导自动驾驶业务 王小川,计划再造一个IPO,这是否意味着未来AI将大规模代替专业医生? 对手更惨,特斯拉第四季度美国电动汽车份额大增至59% 快手将推出“圈圈”App, 滴滴上线家政搬家入口,大厂抢食58同城 中国电动车在欧洲设定最低价意味着什么?专家解读 苹果用上了安卓AI,马斯克为啥急得跳脚? 不再只卖给女生,欧拉5这次能靠“15万级城区智驾”杀回来吗? 11月买车权益盘点:车企的“糖衣炮弹”这次砸向了老车主 谁能成为车展顶流?广州车展12款重磅新车前瞻 大换防,重出海,添增程,绑华为!阵痛广汽,尘埃落定? 玩换电,推增程,埃安电车到底要干什么 关于智能驾驶路线,L3就在眼前,但何小鹏却不要了 汽车“换道超车”,伪命题or真理? 出海 “搞钱”,中国机器人军团卷向全球 2025年1-9月电气化供应商装机量排行榜:弗迪系领跑多领域,车企自供模式持续强化 小鹏汽车今日宣布,小鹏 G7 官方改色上新“宠粉色”,并发布 AI 辅助生成海报 用AI视角看灿谷,矿企重估的开始 谷歌为其车联系统 Android Auto 集成 Gemini AI,为驾驶员带来更智能、更安全的车载交互体验 罗福莉首个小米成果!开源具身大模型 三星京东方握手言和:撤诉ITC,三年OLED专利战落幕