可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效
可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效
可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效6月27日,可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用(shǐyòng)可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到(dào)与视频精准匹配、富有空间感的立体声音效,真正实现“所(suǒ)见即所听”的沉浸(chénjìn)式体验。目前,该功能已无缝集成至文生视频、图生视频、多模态编辑等多种创作模式中,并限时免费开放。
与此同时,平台原有的“音效生成”也进一步升级,新增(xīnzēng)“视频生音效”功能。用户(yònghù)现在不仅可以通过文本生成音效,更可以直接上传本地视频,或选用在可灵(kělíng)平台创作的历史视频,一键(yījiàn)为(wèi)无声的画面匹配(pǐpèi)上语义契合、节奏同步的音效,自动适配动作、环境、氛围等多种场景,极大地提升了视频内容的表现力和沉浸感,有效降低了创作者在音频后期制作上的时间与技术成本。
从实际效果来看,可灵AI的音效功能在多个(duōgè)典型案例中展现(zhǎnxiàn)了极高的音画同步精度和极佳的空间听感。例如,在生成“婴儿(yīngér)在活泼地笑”的视频片段中,模型不仅还原了婴儿清亮的笑声,甚至(shènzhì)连婴儿笑容间隙短促的吸气声都完美捕捉,与画面中肉(zhōngròu)嘟嘟脸颊的起伏动作精准(jīngzhǔn)匹配,其富有空间感的立体声效果,让整个画面的温馨感与生命力扑面而来。
在另一段山体滑坡导致巨石砸中汽车的视频中,系统自动生成了金属(jīnshǔ)扭曲断裂声、石块飞溅与尘土扬起的细节音效,声音定位清晰(qīngxī)、动态层次丰富(fēngfù),提升了整体灾难场景的视觉冲击力与沉浸感。
据悉(jùxī),上述功能的实现,依托于可灵AI自主研发的多模态视频(shìpín)生音效模型——Kling-Foley。Kling-Foley 支持(zhīchí)基于视频内容与(yǔ)可选文本提示自动生成与视频画面语义相关、时间同步(tóngbù)的高质量立体声音频,涵盖音效、背景音乐等多种类型声音内容。它支持生成任意时长的音频内容,还具备立体声渲染的能力,支持空间(kōngjiān)定向的声源建模和渲染。
今年3月,可灵AI首次推出AI音效功能(gōngnéng),用户可通过输入文本生成相应的环境音或动作音,并可进一步结合平台生成的视频(shìpín)进行语义(yǔyì)理解(lǐjiě)与自动匹配。随后,在可灵2.1模型中正式加入了视频音效功能,在生成视频的同时(tóngshí),系统也会自动生成与之匹配的音效,增强了整体视听体验。随着视频音效生成技术的成熟落地,将进一步释放可灵AI在广告创意、影视、短(duǎn)视频、游戏等内容等领域的发展潜力。
(本文来源:日照新闻网。本网转发此文章(wénzhāng),旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。对文章事实(shìshí)有疑问,请与有关方核实或与本网联系(liánxì)。文章观点非本网观点,仅供读者参考。)
6月27日,可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用(shǐyòng)可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到(dào)与视频精准匹配、富有空间感的立体声音效,真正实现“所(suǒ)见即所听”的沉浸(chénjìn)式体验。目前,该功能已无缝集成至文生视频、图生视频、多模态编辑等多种创作模式中,并限时免费开放。
与此同时,平台原有的“音效生成”也进一步升级,新增(xīnzēng)“视频生音效”功能。用户(yònghù)现在不仅可以通过文本生成音效,更可以直接上传本地视频,或选用在可灵(kělíng)平台创作的历史视频,一键(yījiàn)为(wèi)无声的画面匹配(pǐpèi)上语义契合、节奏同步的音效,自动适配动作、环境、氛围等多种场景,极大地提升了视频内容的表现力和沉浸感,有效降低了创作者在音频后期制作上的时间与技术成本。
从实际效果来看,可灵AI的音效功能在多个(duōgè)典型案例中展现(zhǎnxiàn)了极高的音画同步精度和极佳的空间听感。例如,在生成“婴儿(yīngér)在活泼地笑”的视频片段中,模型不仅还原了婴儿清亮的笑声,甚至(shènzhì)连婴儿笑容间隙短促的吸气声都完美捕捉,与画面中肉(zhōngròu)嘟嘟脸颊的起伏动作精准(jīngzhǔn)匹配,其富有空间感的立体声效果,让整个画面的温馨感与生命力扑面而来。
在另一段山体滑坡导致巨石砸中汽车的视频中,系统自动生成了金属(jīnshǔ)扭曲断裂声、石块飞溅与尘土扬起的细节音效,声音定位清晰(qīngxī)、动态层次丰富(fēngfù),提升了整体灾难场景的视觉冲击力与沉浸感。
据悉(jùxī),上述功能的实现,依托于可灵AI自主研发的多模态视频(shìpín)生音效模型——Kling-Foley。Kling-Foley 支持(zhīchí)基于视频内容与(yǔ)可选文本提示自动生成与视频画面语义相关、时间同步(tóngbù)的高质量立体声音频,涵盖音效、背景音乐等多种类型声音内容。它支持生成任意时长的音频内容,还具备立体声渲染的能力,支持空间(kōngjiān)定向的声源建模和渲染。
今年3月,可灵AI首次推出AI音效功能(gōngnéng),用户可通过输入文本生成相应的环境音或动作音,并可进一步结合平台生成的视频(shìpín)进行语义(yǔyì)理解(lǐjiě)与自动匹配。随后,在可灵2.1模型中正式加入了视频音效功能,在生成视频的同时(tóngshí),系统也会自动生成与之匹配的音效,增强了整体视听体验。随着视频音效生成技术的成熟落地,将进一步释放可灵AI在广告创意、影视、短(duǎn)视频、游戏等内容等领域的发展潜力。
(本文来源:日照新闻网。本网转发此文章(wénzhāng),旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。对文章事实(shìshí)有疑问,请与有关方核实或与本网联系(liánxì)。文章观点非本网观点,仅供读者参考。)




相关推荐
评论列表
暂无评论,快抢沙发吧~
你 发表评论:
欢迎