AIAI·

【人工智能】AI虚拟主播制作初体验:从生成数字人到视频创作全流程

Publié à 2024-08-27 11:09:10Vu 36 fois
Article ordinaire
Réimpression Veuillez indiquer la source

💯AI虚拟主播

随着人工智能技术的不断进步,AI虚拟主播正逐渐成为内容创作领域的一大热点。通过AI技术生成的虚拟形象不仅能够高度还原真人的外观,还能够与观众进行互动,提供更加个性化的内容体验。无论是在广告宣传、教育培训,还是在直播与社交平台上,AI虚拟主播都展现出了巨大的潜力。本文将带你进行一次初步探索,感受AI虚拟主播的魅力。通过使用AI绘画工具生成逼真的数字人形象,并借助D-ID等平台让这些静态的形象“活”起来。

💯使用AI绘画工具生成数字人

首先,我们要使用AI绘画工具为我们生成一个虚拟的数字人形象,这种数字人会非常接近真人的形象。这里使用的AI绘画工具比较推荐Midjourney,如果没有Midjourney也没关系,还会推荐一款在线网页版的文生图的国内AI网站也可生成数字人,供我们使用。

补充:D-ID内也可直接生成数字人形象。

借助GPT生成数字人所需的提示词

首先我们要去构思如何编写创建数字人形象的提示词,我们通常会设定一些条件,比如他所从事的行业、年龄范围以及五官的具体特征等。这些设定有助于生成一个更符合我们需求的虚拟形象。

  • 以下是一些参数可以参考:
参数
基础国家、身份(学生/上班族/明星/网红/女装模特)、年龄
容貌面部(眼睛/鼻子/嘴巴/脸型)、肤色、身材、追加附魔词
服装面部(眼睛/鼻子/嘴巴/脸型)、肤色、身材、追加附魔词
场景地点、时间、天气、光线
摄影现实、人像摄影、构图 (占比)
动作默认也可以设定
比例9:16或3:4宽高比
  • 这里提供一个现成模板用于测试
中国、网红
女明星,五官立体,身材好,
白色连衣裙
街拍,购物街道,
索尼,85mm
走路,
9:16
  • 可以让AI为我们生成提示词
现在你是一名基于输入描述的提示词生成器,你会将我输入的自然语言想象为完整的画面生成提示词。请注意,你生成后的内容服务于一个绘画AI,它只能理解具象的提示词而非抽象的概念。我将提供简短的中文描述,生成器需要为我提供准确的提示词,必要时优化和重组以提供更准确的内容,也只输出翻译后的英文内容。
请模仿示例的结构生成完美的提示词。
示例输入:“一个坐在路边的办公室女职员”
示例输出:1 girl, office lady, solo, 16yo,beautiful detailed eyes, light blush, black hair, long hair, mole under eye, nose blush , looking at viewer, suits, white shirt, striped miniskirt, lace black pantyhose, black heels, LV bags, 
thighhighs,sitting, street, shop border, akihabara , tokyo, tree, rain, cloudy, beautifully detailed background, depth of field, loli, realistic, ambient light, cinematic composition, neon lights, HDR, Accent Lighting, pantyshot, fish eye lens.
请仔细阅读我的要求,并严格按照规则生成提示词,如果你明白了,请回复"我准备好了",当我输入中文内容后,请生成我需要的英文内容。注意,英文连着写,不要标序号。
  • 使用KIMI、文心一言等AI工具也同样可以帮助我们生成提示词,这里以GPT为例:
  • 以下是生成好的提示词,已加上分辨率9:16
Chinese celebrity, internet star, female, detailed facial features, attractive body, white dress, street photography, shopping street, Sony 85mm lens, walking, realistic, urban background, fashion, vibrant colors, natural lighting, candid moment. --ar 9:16

方案一:使用Midjourney生成数字人

1. 向Midjourney输入上一步GPT给我们生成的提示词

2. 放大我们需要的那张图,保存到本地。

方案二:使用TensAI生成数字人

如果没有Midjourney,可先使用这个国内的AI工具,使用在线文生图功能:

TensAI:https://tensai.tenclass.com/?invite_code=4fdhLK

1. 选择文生图功能,工具勾选M-J-P生成人像效果更佳。

2. 接着跟Midjourney一样输入提示词

3. 生成后找一张适合的进行放大


4. 保存到本地。

补充方案三:在D-ID内直接生成数字人

  • 写到一半才发现D-ID原来也可以在线生成数字人。

  • 生成速度挺快的,效果也不错,这样子方便很多。

💯使用D-ID生成数字人视频

在生成了逼真的数字人图像后,下一步就是让这些静态的图片形象“活”起来。这时,我们可以借助D-ID来实现这一目标。D-ID 是一款先进的AI技术平台,它能够将静态的图像转化为生动的面部动画和视频。通过D-ID,你可以为你的数字人赋予逼真的表情和语音,让他们看起来更具生命力。

D-ID:https://www.d-id.com/

D-ID注册与消耗积分说明

  • 这里我们需要注册一下才能使用图片转视频功能

  • 注册过程就不详细介绍了。

  • 这个网站都是英文,所以开启了Google翻译。
  • 注意:D-ID每个账号注册后有20个免费积分,每个代理会话消耗1个积分,生成每一分钟视频消耗4个积分(15s视频消耗1积分)。
  • 理论上来说,如果你拥有多个邮箱,可以不断注册新账号,这样就能够持续获得免费积分,从而使点数几乎用不完。

D-ID 让数字人“活”起来

1. 点击创建视频

2. 点击上传我们的AI数字人图像

3. 可选择视频中数字人所表现的情绪和整个形象所在位置

4. 可以为数字人选择不同地区的语言,甚至是方言,并根据需要调整音色。此外,平台还支持根据你提供的音频样本进行声音模仿。

6. 在脚本处可以输入数字人视频中说的话,还可以调整说话风格、语速

  • 可以提供本地音频供AI模仿

6. 还可以选择自定义视频中数字人所处的背景,但应该是类似PS的图层,是需要先将数字人抠图才能完美融合背景。

7. 可在视频中自定义位置加上文字,类似水印

  • 还可自定义文字信息。

8. 可对生成视频自定义命名

9. 生成成功后可以保存在本地

💯小结

  • 数字人这个概念其实早在前几年就已经引起了广泛关注。然而,当时生成数字人的技术还没有如今这样成熟和易于操作,更多的是一些高端玩家才能够玩转,对于大众来说几乎是遥不可及的。而现在,随着AI技术的发展,我们可以借助AI绘画工具生成数字人图像,并通过D-ID让其“活起来”,大致了解AI虚拟主播的生成,时代的发展让更多人也能感受到科技带来的便利。
  • 本文只是对虚拟主播的一个简单制作体验教程,并不全面,还有许多功能没有深入探索。作为一个对于AI虚拟主播的初步探索,这篇文章也是为了让读者在尝试中体验到AI发展带来的乐趣,感谢阅读~
public class Main {  
    public static void main(String[] args) {  
        System.out.println(“愿你所到之处皆为热土,愿你所遇之人皆为挚友;愿你余生不负忧,自在如风常欢笑。”);  
    }  
}

原文链接:https://blog.csdn.net/2201_75539691/article/details/141474531

Section des commentaires

Pas encore de commentaire, ajoutez le premier.

弦圈热门内容

暗物质:奇异黑洞可能是暗物质的副产品

对于我们能看到的每一公斤物质,无论是你桌上的电脑,还是遥远的恒星和星系,都有5公斤不可见的物质渗透在我们的周围。这种“暗物质”是一种神秘的存在,它规避了所有形式的直接观测,然而却通过它对可见物体的无形牵引力让我们感受到它的存在。图片来源网络五十年前,物理学家斯蒂芬·霍金提出了一个关于暗物质可能是什么的想法:一个黑洞群体,它们可能在大爆炸后不久就形成了。这样的“原始”黑洞不会是我们今天探测到的巨人,而是微观区域的超密物质,它们会在大爆炸后的第一枚万亿分之一秒形成,然后崩溃并散布在宇宙中,以一种可以解释我们今天所知的暗物质的方式牵引周围的时空。现在,麻省理工学院的物理学家发现,这个原始过程也会产生一些意想不到的伴侣:更小的黑洞,它们拥有前所未有的称为“色荷”的核物理属性的数量。这些最小的,“超负荷”的黑洞将是一种全新的物质状态,它们可能在诞生后不久的一小部分秒内蒸发。然而,它们仍可能影响了一个关键的宇宙学转变:第一次原子核被锻造的时候。物理学家假设,带色荷的黑洞可能影响了融合核的平衡,在一种天文学家将来可能通过未来测量检测到的方式。这样的观测将有说服力地指向原始黑洞作为今天所有暗物质的根源 ...

cover

最新发现:火星上有大量液态水,多到可覆盖整个火星,且水深1.6公里

多年来的探测数据表明,在火星表面存在着大量类似地球河道和河床的地形结构,其长度往往可达数百公里,明显是由液态水长时间侵蚀和冲刷而形成的,而火星表面的很多盆地和低洼地区,其边缘还存在着类似海岸线的特征。除此之外,在火星表面,还发现了广泛分布的水合矿物以及类似于地球上由水过程形成的沉积岩,这些分层岩石通常显示出交错层理等特征,被认为有水流过时形成的痕迹。所以科学家据此认为,在遥远的过去,火星表面曾经也存在由大量液态水形成的江河湖海,而那时的火星很可能也像地球一样宜居。然而我们都知道,现在的火星表面是一片干涸的荒芜世界,那么,火星上的水到哪里去了呢?对此,一个常见的观点就是,由于火星太小,其核心早早地冷却了,这会导致其磁场的消失,在没有了磁场的保护之后,火星的大气就被太阳风持续剥离,这导致了火星表面的气压显著下降,使得液态水无法在表面存在,于是水开始蒸发并被太阳风不断地“吹”走,而火星大气的变薄还导致了火星表面的温度急剧下降,于是剩余的液态水都冻结起来,形成了火星两极的冰盖或隐藏在火星地下的冰土之中。(↑火星北极的冰盖)可以看到,这样的解释是比较合理的,该观点也因此得到了较多的认同,所以人们 ...

cover

如果一个人身体死了但大脑活在营养液中,是不是活在虚拟世界里?

在现代科幻电影的奇异世界中,常常会出现这样的场景:一个人的身体已经死亡,但大脑却被保存在营养液中,继续在虚拟世界里体验着生命。《黑客帝国》中的就是这样一种构想,人类的大脑通过电信号与计算机系统连接,生活在一个被编程的虚幻世界中。然而,这种幻想并非纯粹的娱乐创作,它也反映了人们对大脑与身体关系的深层思考。哲学家希拉里·普特南提出的“缸中之脑”假想,把这种思考推向了极致。他设想了一个邪恶科学家通过手术将人的大脑取出,放置在营养液中维持生命,再通过计算机程序向大脑输入信息,制造出一个人工的虚拟现实。在这个假想中,被操作的大脑仍然可以体验到生活的一切,但所有的感知和记忆都可能是虚假的。这样的假想引发了一个问题:如果一个人的大脑被置于这样的环境中,那他或她是否真的活在虚拟世界里?揭秘大脑的复杂运作机制要探讨这个问题,我们需要从大脑的运作机制入手。每个人体内都存在着一个错综复杂的神经系统,这个系统由神经纤维构成,包括各种神经组织,如大脑和脊髓。这些神经组织负责将神经信号传递给身体的各个器官,同时也将各个器官的信号传递回大脑和脊髓。正是通过这样的信号传递,我们才能感受到外部世界的各种刺激,并做出相应 ...

光速存在极限是因为处理器有局限?

长期以来,物理学家一直在努力解释,为什么宇宙一开始就具备条件适合生命进化?为什么物理定律和常数,恰好是允许恒星、行星以及生命最终能出现的非常具体的数值?而让宇宙膨胀的那种力,暗能量,就比理论认为的要弱得多。实际应该是让宇宙物质全都聚集在一起,而不是像观察到的在膨胀撕裂。一个常见的答案是我们生活在一个无限多的宇宙中,即多重宇宙,所以我们不应该对其中至少有一个宇宙 会变成我们这个宇宙感到惊讶。但另一个看上去天方夜谭的答案,却越来越被重视,那就是我们的宇宙是被一个外在的计算机模拟出来的,这个计算机有人(或许是一个先进的外星物种)在微调各种参数。这个看上去很离谱的理论,目前已经得到信息物理学这门科学分支的理论支持。信息物理学认为时空和物质并不是宇宙的本质。相反,我们所处的物理现实,本质上是由信息比特组成的,而我们感受到的时空体验就是从这些信息比特中产生的。而所谓的温度,只是原子聚集在一起运动的另一种说法。从根本上说,没有一个原子具有温度。这极大地让科学家相信,我们的整个宇宙,实际上只是计算机模拟出来的事实,存在巨大可能性。不过,这个想法并不是最近才提出的。早在1989 年,传奇物理学家约翰·阿 ...

cover

有感而发,给小猫咪讲讲康德

前言:某日某夜,路遇小猫,小猫两步一回头,最后谨慎地坐在我脚边蹭我,我兴致忽起,遂边投喂边给小猫讲起来康德1 给猫讲康德在【牛顿猫】和【莱布尼茨猫】发展了微积分后,猫界对自然哲学的 研究就突飞猛进,而大众对猫的【认识论】依旧停滞不前,基础不牢,则地动山摇,科学认知的大厦有摇摇欲坠的风险。此时的认识论两派打架,分别是以【莱布尼茨猫】为代表的【纯粹理性派】,和以【休谟猫】为代表的【经验派】。那时候【亚里士多德猫】主义派把知识判断分为两类,【分析的】和 【综合的】。【分析】意思的可以从主体对象上直接得到的,比如这句话“一 只聪明的小猫 ”,“聪明 ”这一个特性可以直接从我们的主体,也就是这整 句话分析得到,我们就会说“小猫 ”的特性是“聪明 ”;而【综合】则代表其包括了其他的经验性的东西, 比方说“小猫 ”的特性是“吃小鱼干 ”, 我们从“一只聪明的小猫 ”这句话里,得不出“吃小鱼干 ”这个特性,“小猫 ”和“吃小鱼干 ”这作为认识到的经验我们曾见过,会很自然地联系起来。那么猫如何认识这个世界的呢?当然是靠芝士(知识)! 一只小猫天生就会喝奶,它不需要任何感观经验,这叫【先天知识】,一只小猫 ...