Day09:数字人和爬虫

deepseek+数字人

探索从创意文案到逼真数字人视频的全流程,让你掌握未来内容创作的秘密和数字时代副业变现之路,开启你的虚拟人类时代之旅

1. 数字人介绍

e2903eed-fd72-4c8c-ae84-0a34ac2f4974

数字人(Digital Human)是指利用先进的数字技术和人工智能创建的虚拟人类形象,能够模拟人类的外貌、行为和情感。数字人不仅可以在视觉上表现出真实的人类特征,还可以通过自然语言处理与用户进行互动。

近年来,随着人工智能、计算机图形学和虚拟现实等技术的迅速发展,数字人已经取得了显著的进展:

  1. 技术进步:图形渲染技术的提升使得数字人的外观更加逼真,同时,深度学习算法的应用使得数字人的行为和对话能力得到了显著增强。
  2. 市场需求:在自媒体、娱乐、教育等领域,对数字人的需求日益增加,推动了相关技术和应用的快速发展。
  3. 多样化应用:数字人不仅限于单一形象,而是可以根据不同需求定制,具备多种不同的角色和功能。

数字人的价值

  1. 成本效益:数字人可以替代真人进行多种任务,降低了人力成本。例如,在客服和销售领域,通过数字人处理常见问题,可以节省大量人力资源。
  2. 24/7 可用性:数字人可以全天候工作,不受时间和地点的限制,为用户提供随时随地的服务。
  3. 个性化体验:数字人能够根据用户的偏好和行为进行个性化的互动,提升用户体验和满意度。
  4. 增强品牌形象:企业可以通过数字人塑造独特的品牌形象,增强与消费者的互动,提升品牌认知度。

数字人在自媒体领域的应用越来越广泛,主要体现在以下几个方面:

  1. 内容创作:数字人可以作为网络主播或视频博主,通过生成内容与观众互动,吸引粉丝和流量。
  2. 虚拟代言人:品牌可以利用数字人作为代言人,参与广告宣传和活动,增强品牌的吸引力和影响力。
  3. 社交互动:在社交媒体平台上,数字人可以与用户进行实时互动,回答问题,分享信息,增加用户粘性。
  4. 教育和培训:数字人可以在在线教育平台上担任讲师角色,提供生动的教学内容,提升学习效果。

数字人作为一种新兴的技术应用,正在改变我们的生活和工作方式。随着技术的不断进步,数字人的应用领域将进一步扩大,其潜在价值也将不断被挖掘。在自媒体等领域,数字人的创新应用将为企业和个人带来新的机遇和挑战。

2. 需求文档

【1】需求背景(市场痛点)

(1)内容创作流程割裂

当前市场上,文案生成、语音克隆、数字人生成需依赖多个独立工具(如ChatGPT、语音合成工具、3D建模软件),导致操作复杂、效率低下,且多平台切换易造成风格不统一。

案例:某电商团队制作一条数字人带货视频需5人协作,耗时3天。

(2)高成本与高门槛:语音克隆需大量原始音频(通常需数小时录音),且专业级克隆工具价格高昂。

数字人生成依赖3D建模师或动画师,人力与时间成本极高,中小企业难以负担。

(3)真实感与个性化不足:现有AI语音生硬,缺乏情感波动;数字人动作僵硬,难以适配多样化场景(如直播、教育、客服)。

用户无法快速生成与品牌/个人IP高度一致的“数字分身”。

【2】解决方案

Coze通过全链路AI生成技术,实现从文案→语音→数字人的无缝衔接,打造“输入需求,输出完整数字人内容”的一站式平台,解决以下问题:

(1)效率提升:
用户仅需输入文案或关键词,AI自动生成配套语音及数字人视频,耗时从“天级”缩短至“分钟级”。

成本降低:语音克隆仅需1分钟原始音频即可生成高保真音色;

数字人支持模板化生成+个性化微调,无需专业设计能力。

(2)真实感增强:

语音支持多情感模式(欢快、严肃、悲伤等);

数字人动作基于AI捕捉真人微表情,口型与语音100%同步。

(3)版权合规:
提供区块链存证功能,明确生成内容版权归属,支持商业化授权管理

感谢前网易AI产品经理的小林老师!

3. Coze - 全链路AI数字内容生成引擎

#  音频文件、文案文本、视频模板
1. 准备音频文件(获取音色)
2. 准备文案文本
3. 音频与文案基于大模型生成该文案的音频文件
4. 基于该文案的音频文件与视频模板利用大模型训练数字人视频
5. 混剪

image-20250326下午52010681

1. 基于大模型和输入的提示词生成文案(口播内容)
2. 基于生成文案和音色生成音频文件
3. 基于音频文件和准备好的视频素材生成最后的口播视频

数字人插件推荐:

image-20250326下午53144881

image-20250326下午60906055

我们的工作流思路:

1. 根据音色名转换音色ID
2. 根据文本和音色生成音频
3. 原视频和生成音频生成视频
   generate_talking_face和一会用到的get_virtual_video是一个插件的两个方法
4. 获取生成视频的路径
5. 循环询问
sourceurl:https://yueliangwan.jackit.cn/%E8%B7%AF%E9%A3%9E.mp4
text:我想做自媒体课程赛道的博主,帮我写一篇关于如何培养自媒体快速起号的短视频。口播内容要求开头要钩子,能够吸引用户观看,中间要有观点和案例,结尾要提炼金句总结,帮我生成一篇两分钟左右的短视频内容

image-20250326下午64648062

【1】音色名转ID

image-20250326下午53414802

image-20250326下午64935554

【2】根据文本和音色生成音频

这里我们选择https://fish.audio/zh-CN/

image-20250326下午54209660

Fish Audio 提供自然的 AI 语音合成,支持多种语言,并且具备强大的声音克隆和配音功能。该平台致力于提供全面的语音解决方案,适合各种应用场景。

image-20250326下午54429820

Authorization

image-20250326下午65145661

【3】原视频和生成音频生成视频

image-20250326下午54615025

【4】获取生成视频的路径

image-20250326下午62317944

【5】循环询问

image-20250326下午62428976

posted @ 2025-04-25 14:55  凫弥  阅读(372)  评论(0)    收藏  举报