最近,许多朋友都在询问关于数字人的概念及其制作方法。简单来说,数字人就是创建一个虚拟的自我克隆,只需输入文案,就能生成一个模拟自己说话的视频。今天,我将详细指导大家如何使用数字人工具,让你无需亲自出镜,也能轻松制作出自己的数字人。制作数字人主要分为两个步骤,接下来我将逐步解析其背后的逻辑。
第一步是让数字人动起来。为了实现这一点,我们可以使用可灵AI,因为它提供的动态生成效果既稳定又真实。具体有三种实现方式:
第一种方法是使用可灵AI的文生视频功能。通过这个功能,我们可以选择参考人脸(此功能仅限铂金会员以上使用)。例如,如果你想使用自己的人脸,可以选择“羊羊”作为参考,但需要提前录制好自己的人脸素材。在左上角的创意描述区域,使用“羊羊”的人脸,并详细描述你的眼神、背景、动作以及整体画面风格等。描述完成后,填入不希望呈现的内容,如变形、扭曲、毁容等,然后点击立即生成,就能得到一个以你的人脸为主,动作稳定的视频。这个视频可以用于后期的对口型操作。
第二种方法是采用图生视频的方式。获取一张生成的图片,将其上传到指定位置后,在创意描述处输入你期望图片会呈现的动作。这种方式的优点在于图片美观,背景可自由设定,可控性强,同时还能更精细地控制动作。
第三种方式是自己拍摄。你可以自己拍一张照片,然后上传到可灵AI的图生视频中。接着在图片创意描述处输入相关描述,比如让人物动起来,描述其眼神状态等。建议让动作缓慢些,人物动态效果不要太强烈,因为人正常面对镜头说话时,动作幅度不会特别大,而且动作幅度太大容易出现手指变形的bug。上传照片并完成描述后,点击立即生成,就能得到我们想要的视频。
接下来进入第二步——对口型。对口型有两种方式,第一种是我们可以直接使用可灵AI的对口型功能。点击对口型后,在左边上传视频,配音音频有文本驱动和声音驱动两种方式可选。如果选择文本驱动,还能挑选音色,输入想说的文本就能生成数字人讲解这段话的视频。但不足之处在于,尽管音色选择多样,却无法使用自己的声音,难以达到与本人声音一模一样的效果。不过对口型也有好处,我们可以选用他人音色,说不定会更加悦耳动听。对口型还有声音驱动这种方式,我们能上传一段自己的音频,可灵AI支持MP3等常见音频格式。上传音频后即可直接生成视频。不过,可灵AI每次仅支持生成5秒的片段。我们可以通过变速将音频尽量压缩至5秒以内,但这并长久之计,比较适合制作短口播视频、短数字视频,或者将多个片段组合起来使用。
第二种方式,我们还可以使用必火AI工具。它的优势在于能够进行形象克隆和声音克隆,且生成效果较好。具体操作流程如下:上传视频以克隆数字分身,将前面可灵AI生成的动态视频上传;接着,在声音克隆处克隆自己的声音;在数字分身板块进行创作,若采用文本驱动,输入想要数字人说的话,选择自己克隆好的声音,点击提交,就能生成一段数字人视频。若采用音频驱动方式,上传自己的一段声音,同样可以生成数字人视频。
最关键的就是这两步:先生成一段动态视频,再让这段动态视频完成对口型操作,这样一来,我们想要的数字人视频便制作完成了。😊🎥
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...