傍晚网_企业培训网课、创业交流、自媒体教程资讯

傍晚网

热门关键词:  管理制度 股权激励 创业副业

数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!(3)

来源: 作者:Pendragon 时间: 浏览:
[ 导读 ] 当前AI数字人的市场需求比较旺盛,市面上也有至少几十家的数字人品牌,比如腾讯、百度、科大讯飞、硅基智能、风平智能、闪剪、元分身等等,选择虽然很多但有一个问题,就


数字人普遍支持声音驱动

数字人的声音也很重要,数字人一般有两种驱动方式,一种是文本驱动,一种是真人声音驱动。其中文本驱动是用AI合成的声音输出来配合数字人,目前除了百度曦灵的声音库数量偏少外,硅基智能、风平智能和闪剪目前声音库基本都有50款以上,里面都会有效果好的,也有效果差一些凑数的,一般用平台默认推荐的几个声音都比较好。有必要说明的是,闪剪智播里虽然有AI合成声音的插件和功能,但无法用于数字人驱动,只能用录音文件驱动,这点前面提到过。

另外,AI合成的声音还有一种更高级的存在,就是克隆自己的声音,用自己克隆的声音匹配自己的数字人模型,口型匹配度非常高,数字人更容易达到以假乱真的水平,刘润的数字人短视频作品就是例子,难以识别真假。但声音克隆的成本比较高,一般费用要8000元或更多,风平智能和硅基智能都有声音克隆的选项。

还有一个容易被忽视的问题,就是私有数字人的隐私安全,行业还没有广泛形成统一的规范。如果自己的数字人被制作公司,被他人盗用,危害程度远比个人信息和照片隐私泄露可怕,如果有人用你的数字人形象和声音发表不正当言论,后果非常严重。目前多数数字人公司可以做到定制数字人时,对定制人的授权确认,防止在未经本人允许的情况下定制的数字人。除此之外的隐私安全措施,绝大多数数字人品牌都没有额外提及,可以搜索查找到的,只有风平智能对数字人安全态度积极,产品里有一个拥有专利技术的5AS风险管理系统。

另外想额外提一下扩展能力。其实在更早的时候市面上出现过一些3D数字人产品,但由于算力和成本等问题,它们不太适合直播带货使用,所以逐渐被2D数字真人取代。但3D数字人在一些领域也有市场,比如游戏、VR等领域。所以如果有特别的需求,可以额外关注数字人平台是否支持3D数字人。


「风平IP智造」使用Unity底座

这次评测的4款数字人产品,经过一些资料查找和确认,风平智能的「风平IP智造」基于Unity 底座,平台可以直接支持3D数字人,不需要另外的平台。而且Unity也方便跨平台导入其他应用,比如VR、元宇宙应用等,具有未来的扩展性。而另外3款数字人平台都是基于2D数字真人打造的,无法直接支持3D数字人。如果有3D数字人业务,应该会是另外一套不同的平台,另外一套收费。

总的来看,四款产品里数字人整体效果比较好的是风平智能、硅基智能和闪剪,三者都采用更真实的数字人建模方法,并且可以定制克隆声音,数字人效果的上限很高,比如刘润、金错刀、环球网等大V、媒体号上的数字人,就是具体的案例。而百度曦灵由于采用一个相对简易的模型训练方法,定制效率虽然大大提高,但是数字人的效果相对不佳,会有一定的机械感,用来做短视频或者直播比较影响效果。

数字人直播效果

数字人用于直播是现在需求量最大的,但在选择数字人直播产品时,有一个不能忽视的问题,就是用数字人直播有可能在一些平台上,比如抖音、视频号上出现违规的问题。其中态度最明确的是抖音,在今年5月份出台具体的规范,在认可数字人直播的同时也做出了一些限制,比如画面中需要标明为AI生成的内容,另外要求数字人要由人工驱动或参与,不能全AI驱动。

但是, 我们使用数字人做直播希望达到的就是无人工驱动,这样才能达到降本增效的目的,所以也会有各种数字人防封禁的策略。所以在选择数字人直播产品的时候,一定要注意这方面的表现,包括一些避开平台规则的改变画面与声音的措施,也包括数字人的互动能力。终极解决办法肯定是更高级别的AI交互能力,让平台,甚至包括我们自己都识别不出来直播的到底是真人还是数字人。所以说,数字人直播最终比拼的还要是AI能力,看谁家的数字人AI互动能力最高。

首先来看看百度曦灵,相比它的短视频功能,直播功能相对完善,并针对带货直播做了一些优化,可以通过文心一言来AI生成话术,直接从文案里提取互动的问题线索,可以大大节省人力,提高搭建直播间的效率。但不足是,输出的视频还是绿幕的形式,需要在直播伴侣里再去扣绿幕加背景,这样的操作不仅繁琐,而且实时扣绿幕会明显增加直播电脑的CPU负担,如果电脑配置不够高,会明显降低直播帧率,甚至出现卡顿情况。

另外开播上,百度灵犀云端版只提供了“窗口捕获”一种导入直播伴侣的方法,就是曦灵会单独弹出来一个网页窗口页面,然后用直播伴侣的“窗口捕获”获取画面源。这种方式其实也会增加平台判违规的风险。因为理论上,各个平台的直播伴侣有可能具备一定的内容甄别功能,如果直播内容是从一个窗口里获取的,而不是从一个硬件摄像头设备获取的,理论上容易被视为录播内容。另外,硅基智能默认也是窗口捕获的方式,但另外提供直播间推流与拉流的方式,不过这两种方式也一定程度上存在提高被判录播概率的风险。相对而言,风平智能和闪剪则是将数字人视频流虚拟成一个摄像头硬件设备,在直播直播伴侣里添加摄像头即可获取画面流,理论上可以一定程度降低被判录播的风险。

然后是硅基智能和风平智能,他们是直播功能做的最好的两家,「小播秀」和「风平IP智造」在防封禁上都做出了很多的尝试,也开发出了一些功能措施,比如实时时钟,就是画面里放一个与标准时间的时钟来证明不是录播,比如直播时话术场景的顺序可以随机切换,比如故意给画面和声音制造一些噪音噪音,干扰平台的判断等等。总体来说,两家的数字人直播功能大体相似,但也有一定的区别。

重点是直播交互能力,「小播秀」和「风平IP智造」都支持自动应答、自动回复功能,也都支持插播和真人接管功能。自动回复方面,两家都可以支持插播功能,就是在直播过程中,可以根据直播的情况,可以随时通过文本驱动数字人,临时插入任意新加入的内容。

还有真人接管功能,得益于实时驱动能力,「小播秀」和「风平IP智造」可以用真人说话来实时驱动数字人。从抖音平台的规范看,这种就属于人工驱动的数字人,是规则被允许的不属于违规行为。其实这算是一个悖论,用数字人的目的是省去人工,但为了符合平台要求而用人工驱动数字人,又偏离了AI数字人节省人工成本的目的。而「小播秀」和「风平IP智造」加入这个功能的初衷,更多的是在数字人直播中如果出现一些特殊情况,可以人工接管进行应对。

闪剪的 「闪剪智播」的易用性很好,其界面和功能设计应该是比较多的借鉴了直播伴侣,可插入的素材方面最为全面,不只是图片、视频和音频,还可以插入窗口、浏览器、摄像头、麦克风到其中。只是这些功能在直播伴侣里都可以实现,把他们挪到软件里,似乎不太符合直播的操作习惯。

「闪剪智播」的直播和互动能能还比较初级,缺少一些高阶功能。首先,「闪剪智播」是4款产品中唯一不具备实时驱动的数字人直播产品,简单的解释就是创建一个新的话术,需要先提交训练,训练完成后才能直播使用,相当于把数字人的话术提前生成为视频,直播时再去播放。这种方式的不足是,一是训练是需要时间的,所以闪剪说明文档里建议在开播前一天提交训练;二是如果训练完成后发现有话术错误,想要修改需要重新提交训练,需要生成时间不仅会打乱直播计划,而且还会消耗合成时长;三是如果直播要暂停,那么数字人就完全静止不动了。

而实时驱动的数字人,无需预先训练无需等待,新插入的文案话术都可以直接开直播,话术写错了直接改过来就可以,无需训练等待。另外还有一个小优点,就是直播中如果按暂停,数字人也只是闭嘴不说话,身体都是会动的。

「闪剪智播」具备基本的交互能力,可以设定条件话术,在直播中回答用户的问题。而其他防封禁策略上,「闪剪智播」除去场景循序打乱之外,只能用录音文件驱动数字人,算是半强迫的让用户去真人录音,从而降低封禁的风险。

百度曦灵使用文心一言自动识别与提取文本中的问答

最后谈谈数字人直播真正核心的能力——AI互动,它的实现基础是ChatGPT、文心一言这类大预言模型。百度、硅基智能和风平智能三家对外宣传中都提到这样的功能,但截稿时只有风平智能的「风平IP智造」具备这一功能。

百度曦灵理论上背靠自家的文心一言,有近水楼台的优势,但文心一言的功能仅限于产品话术生成与从文案脚本快速学习生成问答库问题,其中具体问答还需要人工筛选与确定,属于比较初级的AI。

硅基智能对外宣传中提到高级版具备AI大脑功能,基于GPT4可根据直播间数据实时优化直播话术,但目前版本还未实现这一功能,而且也不具备话术生成等辅助AI功能。而闪剪的短视频工具虽然有AI文案功能,但直播工具却完全没有,有些遗憾。

电商运营必备的3个AI做图工具

电商运营必备的3个AI做图工具

2025-01-09 洪笛童

Midjourney(图片来源:网络)作为 2022年 3 月才刚刚面世的 AI 绘画工具,Midjourney仅一年时间就已经火爆全球,它基于Discord平
字节跳动大赢家:抖音短剧小程序月活逼近2亿,红果月活1.2亿

字节跳动大赢家:抖音短剧小程序月活逼近2亿,红果月活1.2亿

2024-12-19 洪笛童

字节跳动成为短剧行业大赢家,除了抖音小程序月活达到2亿外,旗下免费短剧APP红果短剧月活也达到1.2亿。
最新上线“对口型”功能 开放API服务

最新上线“对口型”功能 开放API服务

2024-12-13 洪笛童

9月30日,快手自研的“可灵AI”再次升级,全新上线“对口型”功能,也是可灵AI自今年6月发布以来,累计第十次升级,并且全面开放API服务,推动行业发展。
视频号挂载短剧是“鸡肋”?我们和多位从业者聊了聊

视频号挂载短剧是“鸡肋”?我们和多位从业者聊了聊

2024-11-18 洪笛童

近日,关于视频号内测挂载短剧小程序的消息引发业内关注。微信显然也瞄准了这一点,开启了生态内的流量布局,近来被热议的视频号加热内测挂载功能便是其中一环。
百度网盘SVIP代理赚钱攻略:售卡、外链分享、邀请好友,三管齐下赚大钱!

百度网盘SVIP代理赚钱攻略:售卡、外链分享、邀请好友,三管齐下赚大钱!

2024-09-18 洪笛童

在百度网盘联盟目前有3种赚钱方式,第一种是自己售卡赚佣金;第二种是外链分享(分销联盟);第三种是邀请好友加盟,好友售卡,自己得提成收入。在下面,我将为大家带来详
生成海报