AIAI·

【人工智能】AI虚拟主播制作初体验:从生成数字人到视频创作全流程

投稿時間:2024-08-27 11:09:10閲覧数:35
一般記事
転載は出所を明記してください

💯AI虚拟主播

随着人工智能技术的不断进步,AI虚拟主播正逐渐成为内容创作领域的一大热点。通过AI技术生成的虚拟形象不仅能够高度还原真人的外观,还能够与观众进行互动,提供更加个性化的内容体验。无论是在广告宣传、教育培训,还是在直播与社交平台上,AI虚拟主播都展现出了巨大的潜力。本文将带你进行一次初步探索,感受AI虚拟主播的魅力。通过使用AI绘画工具生成逼真的数字人形象,并借助D-ID等平台让这些静态的形象“活”起来。

💯使用AI绘画工具生成数字人

首先,我们要使用AI绘画工具为我们生成一个虚拟的数字人形象,这种数字人会非常接近真人的形象。这里使用的AI绘画工具比较推荐Midjourney,如果没有Midjourney也没关系,还会推荐一款在线网页版的文生图的国内AI网站也可生成数字人,供我们使用。

补充:D-ID内也可直接生成数字人形象。

借助GPT生成数字人所需的提示词

首先我们要去构思如何编写创建数字人形象的提示词,我们通常会设定一些条件,比如他所从事的行业、年龄范围以及五官的具体特征等。这些设定有助于生成一个更符合我们需求的虚拟形象。

  • 以下是一些参数可以参考:
参数
基础国家、身份(学生/上班族/明星/网红/女装模特)、年龄
容貌面部(眼睛/鼻子/嘴巴/脸型)、肤色、身材、追加附魔词
服装面部(眼睛/鼻子/嘴巴/脸型)、肤色、身材、追加附魔词
场景地点、时间、天气、光线
摄影现实、人像摄影、构图 (占比)
动作默认也可以设定
比例9:16或3:4宽高比
  • 这里提供一个现成模板用于测试
中国、网红
女明星,五官立体,身材好,
白色连衣裙
街拍,购物街道,
索尼,85mm
走路,
9:16
  • 可以让AI为我们生成提示词
现在你是一名基于输入描述的提示词生成器,你会将我输入的自然语言想象为完整的画面生成提示词。请注意,你生成后的内容服务于一个绘画AI,它只能理解具象的提示词而非抽象的概念。我将提供简短的中文描述,生成器需要为我提供准确的提示词,必要时优化和重组以提供更准确的内容,也只输出翻译后的英文内容。
请模仿示例的结构生成完美的提示词。
示例输入:“一个坐在路边的办公室女职员”
示例输出:1 girl, office lady, solo, 16yo,beautiful detailed eyes, light blush, black hair, long hair, mole under eye, nose blush , looking at viewer, suits, white shirt, striped miniskirt, lace black pantyhose, black heels, LV bags, 
thighhighs,sitting, street, shop border, akihabara , tokyo, tree, rain, cloudy, beautifully detailed background, depth of field, loli, realistic, ambient light, cinematic composition, neon lights, HDR, Accent Lighting, pantyshot, fish eye lens.
请仔细阅读我的要求,并严格按照规则生成提示词,如果你明白了,请回复"我准备好了",当我输入中文内容后,请生成我需要的英文内容。注意,英文连着写,不要标序号。
  • 使用KIMI、文心一言等AI工具也同样可以帮助我们生成提示词,这里以GPT为例:
  • 以下是生成好的提示词,已加上分辨率9:16
Chinese celebrity, internet star, female, detailed facial features, attractive body, white dress, street photography, shopping street, Sony 85mm lens, walking, realistic, urban background, fashion, vibrant colors, natural lighting, candid moment. --ar 9:16

方案一:使用Midjourney生成数字人

1. 向Midjourney输入上一步GPT给我们生成的提示词

2. 放大我们需要的那张图,保存到本地。

方案二:使用TensAI生成数字人

如果没有Midjourney,可先使用这个国内的AI工具,使用在线文生图功能:

TensAI:https://tensai.tenclass.com/?invite_code=4fdhLK

1. 选择文生图功能,工具勾选M-J-P生成人像效果更佳。

2. 接着跟Midjourney一样输入提示词

3. 生成后找一张适合的进行放大


4. 保存到本地。

补充方案三:在D-ID内直接生成数字人

  • 写到一半才发现D-ID原来也可以在线生成数字人。

  • 生成速度挺快的,效果也不错,这样子方便很多。

💯使用D-ID生成数字人视频

在生成了逼真的数字人图像后,下一步就是让这些静态的图片形象“活”起来。这时,我们可以借助D-ID来实现这一目标。D-ID 是一款先进的AI技术平台,它能够将静态的图像转化为生动的面部动画和视频。通过D-ID,你可以为你的数字人赋予逼真的表情和语音,让他们看起来更具生命力。

D-ID:https://www.d-id.com/

D-ID注册与消耗积分说明

  • 这里我们需要注册一下才能使用图片转视频功能

  • 注册过程就不详细介绍了。

  • 这个网站都是英文,所以开启了Google翻译。
  • 注意:D-ID每个账号注册后有20个免费积分,每个代理会话消耗1个积分,生成每一分钟视频消耗4个积分(15s视频消耗1积分)。
  • 理论上来说,如果你拥有多个邮箱,可以不断注册新账号,这样就能够持续获得免费积分,从而使点数几乎用不完。

D-ID 让数字人“活”起来

1. 点击创建视频

2. 点击上传我们的AI数字人图像

3. 可选择视频中数字人所表现的情绪和整个形象所在位置

4. 可以为数字人选择不同地区的语言,甚至是方言,并根据需要调整音色。此外,平台还支持根据你提供的音频样本进行声音模仿。

6. 在脚本处可以输入数字人视频中说的话,还可以调整说话风格、语速

  • 可以提供本地音频供AI模仿

6. 还可以选择自定义视频中数字人所处的背景,但应该是类似PS的图层,是需要先将数字人抠图才能完美融合背景。

7. 可在视频中自定义位置加上文字,类似水印

  • 还可自定义文字信息。

8. 可对生成视频自定义命名

9. 生成成功后可以保存在本地

💯小结

  • 数字人这个概念其实早在前几年就已经引起了广泛关注。然而,当时生成数字人的技术还没有如今这样成熟和易于操作,更多的是一些高端玩家才能够玩转,对于大众来说几乎是遥不可及的。而现在,随着AI技术的发展,我们可以借助AI绘画工具生成数字人图像,并通过D-ID让其“活起来”,大致了解AI虚拟主播的生成,时代的发展让更多人也能感受到科技带来的便利。
  • 本文只是对虚拟主播的一个简单制作体验教程,并不全面,还有许多功能没有深入探索。作为一个对于AI虚拟主播的初步探索,这篇文章也是为了让读者在尝试中体验到AI发展带来的乐趣,感谢阅读~
public class Main {  
    public static void main(String[] args) {  
        System.out.println(“愿你所到之处皆为热土,愿你所遇之人皆为挚友;愿你余生不负忧,自在如风常欢笑。”);  
    }  
}

原文链接:https://blog.csdn.net/2201_75539691/article/details/141474531

コメント欄

まだコメントがありません。最初のコメントを投稿しましょう!

弦圈热门内容

cover

VueやNuxtで数学公式をレンダリングする方法は次のとおりです。

ウェブページ上で、美しい数学公式をレンダリングする方法はたくさんあります。しかし、これらの方法は基本的にVue.jsやNuxt.jsに直接適用できません。この記事では、Vue.jsまたはNuxt.jsでKaTeXとMathJaxを使用して数学公式をレンダリングする方法について説明します。KaTeXすべてのページ上の数学公式を自動的にレンダリングするには、CDNを使用してKaTeXをロードする必要があります:<!-- index.html --> <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <link rel="icon" href="/poem-studio-favicon-black.svg"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <link rel="stylesheet ...

Vue初学记录

网站开发,需要前端与后端的开发。前端指用户端、浏览器端,是用户能看得到的部分。后端指服务器端,是用户看不到的部分。前端开发,需要用到CSS3和HTML5以及JavaScript。后端开发能用的编程语言则很多了,主流的有python、java等,只要我们电脑能够使用的编程语言,服务端都能使用。目前流行前后端分离,后端只需要提供好接口就行了,前端直接使用后端的接口。前端三大框架:Vue、react、AngularVue是目前中国使用比较多的框架,因为创造这个框架的是中国人——前谷歌员工Even You。React框架则是Meta公司(原Facebook公司)创造的框架,Angular是谷歌建立的框架。从最近GitHub的数据上看,Vue是目前全世界下载量最多的框架,第二大的为React,第三为Angular。前端框架建立的目的,其实是为了方便开发,提高开发效率,降低开发难度。本质上,最后到浏览器那里,都是转换为CSS3、HTML5、JavaScript的语言。前端的开发,代码实现前,还需要设计UI界面,提高用户体验。因此,网站前后端开发分别对应三个职位——前端工程师、后端工程师、UI设计师 ...

Nuxtを使用してコードブロックをハイライト表示する方法は次のとおりです。

他のウェブサイトのように、ユーザーが書いたコードブロックをハイライト表示することもできますか?これを実現するのに役立つ2つのJavaScriptライブラリがあります。それぞれPrism.jsとhighlight.jsです。このチュートリアルでは、コードブロックのハイライトを実現する方法としてPrismJSを使用します。まず、npmを使用してPrismJSをインストールします:npm install prismjs次に、composablesフォルダに移動し、新しいファイルprism.jsを作成します。内容は以下の通りです:import Prism from 'prismjs' import 'prismjs/themes/prism-tomorrow.css' // 他のテーマを選択することもできます export default Prismこれで、PrismJSがインストールされ、設定できました。コードをハイライト表示する必要があるときは、highlightAll()関数を呼び出すだけで済みます。具体的な例は以下の通りです:<script lang="ts" setup&gt ...

Nginx服务器反向代理

1. nginx服务器Nginx与Apache为两大主流web服务器。而我的轻量级云服务器使用了nginx。因为nginx相比与apache更轻量,性能更好,不怎么占内存,适合中小型服务器。同时Nginx善于应对高并发场景,在多用户同时点击的情况下,服务器能负荷得住。又由于nginx的负载均衡,让多个用户打开网站没那么卡。nginx官网安装教程Installing NGINX Open Source | NGINX DocumentationDebian12安装nginx:sudo apt-get update sudo apt-get install nginx最后输入sudo nginx -v验证安装。2. Nginx服务器反向代理客户端对代理是无感知的,只需将请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据后,再返回给客户端,此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器IP地址

代数几何简介

1. Introduction代数几何是数学的核心领域,也是如今国际数学界的主流。代数几何与许多数学分支都存在广泛的联系,比如数论、微分几何、代数拓扑、复几何、表示论、同调代数、交换代数、偏微分方程等等,这些分支的发展同时也对代数几何起到促进作用。数学史上的许多重大的事件,比如,费马大定理、莫德尔猜想、韦伊猜想的证明都跟代数几何有关。同时,代数几何存在广泛的应用,比如密码学、弦理论、大数据、统计学习理论等等。代数几何之下有众多分支,比如复代数几何,热带几何,算术几何,远阿贝尔几何,$p$进霍奇理论(complex algebraic geometry, tropical geometry, arithmetic geometry, anabelian geometry, p-adic hodge theory),每个分支代表代数几何研究的一个大方向,而在每个大方向下,又有各种以不同的问题为导向的子方向。在这篇文章中,我们将会对代数几何,包括它的分支算术代数几何,做一个简短的介绍。2. An Introduction to Arithmetic Geometry算术几何是算术代数几何的简 ...

Python pip安装SSL证书错误

问题描述:正常使用pip install xxx安装会弹出错误,导致下载失败。必须增加trust host字段,才能下载成功:pip --trusted-host pypi.python.org install在cmd运行python -c "import ssl; print(ssl.get_default_verify_paths())"在默认路径里没有找到ca证书,而在Lib\site-packages\certifi文件夹中,却发现了cacert.pem文件。故而认为原因是ca证书丢失或者寻找ca证书路径出错,因此尝试修改pip的默认ca证书路径。pip.ini文件中有大量的pip配置信息,因此需要先找到该文件。在cmd通过pip -v config list发现,在多个路径中,都没有找到pip.ini文件。且了解到,pip会有一个默认的pip.conf文件(其实就是pip.ini),因此断定默认pip.ini配置文件丢失。解决办法:在python根目录中,新建pip.ini,在里面写上[global] index-url = https://mirrors.aliyun.co ...