【案例】
浙报“数智人”是这么诞生的!
最近,数智人正悄然掀起一场媒体行业AI新风潮! 1月18日,浙江日报报业集团社长、党委书记姜军的数智人分身“老姜”亮相传播大脑两周年发布会,TA不仅能流利地讲多国语言,还能挥毫泼墨书写春联,现场送上新春祝福。
2月18日潮新闻两周年发布会上,浙报集团超60人的“数智人矩阵”集体营业,勾画出数智人与新闻行业融合的未来遐想。
而最近,“老姜”又有了新身份,变身老杭州美食家,带着大家打卡杭帮菜美味,探寻杭州美食背后的秘密——
轻松变装,多国语言随意切换,还能“穿越时空”场景秒切换……AI技术正在将科幻叙事转化为商业现实,数智人不再是小说中的概念,甚至有可能成为你身边实实在在,又能力超群的“新同事”!
那么问题来了:数智人到底是怎样诞生的? 数字分身打造术 数智人“老姜”和浙报“数智人矩阵”其实都是传播大脑通过“数智人众创平台”打造哒,通过这个平台,利用AI技术将虚拟与现实结合,操作起来就像“捏脸游戏PLUS”! Step 1: 从“脸”到“形”,打造你的数字分身 和本尊几乎一模一样的数智人怎么打造?AI助力之下,一切变得简单。 用户只需在摄像机前摆几个动作,随意切换坐姿与站姿,再把拍摄素材上传至“数智人众创平台”后,AI便能够精准捕捉用户的每个特征点进行训练,72小时内,一键生成用户的专属数智人形象,连鼻梁弧度都能一比一还原,微表情细节更是精准拿捏,活脱脱就是本尊上线~~
Step 2: 声纹克隆术,“塑料普通话”也能出道 形象造型随心变装,多国语言还能丝滑切换,这又是怎么实现的呢? 用户使用设备进行语音采集后(Ps:即使用手机录音也可以),AI会对用户上传的语音素材,进行降噪和标准化处理,确保声音清晰一致,接着,系统会对音频进行分段标注和频域处理,精准分析声音的细节,提取声学特征和时序特征,捕捉用户的“声音指纹”,最后,通过模型训练,专属用户的声音模型就生成啦。 同时,结合语音分析与口型同步技术,可以让用户的声音与唇形完美匹配,真正做到“声形合一”。
Step 3: 内容生成平台,你的数字创作全能助手 到了这一步,数字分身前置工作已经完成,最后TA还需要一个用于组合重塑的“创意工坊”——内容生成平台。
内容生成平台不仅能帮用户分类、预览、编辑视频,轻松搞定从草稿到成品的全流程,还能自定义数字人形象和音色,完美匹配品牌调性。
平台的背景设置还提供了海量模板,能够适配各种场景,形象库可以自由调整数智人外观,支持文本/语音驱动播报内容,这些自定义设置让用户的数智人视频独一无二。 数智人玩法大揭秘 数智人只能播新闻?那可不止! 格局再打开,TA可是个六边形战士! 在产品发布会、企业宣传等「高端演讲」场合,数智人能以高度还原的外貌和声音,轻松hold住全场。 在企业服务领域,数智人可以是24小时在线的「智能客服」 ,TA能理解复杂查询,实时响应客户问题,精准又高效,宛如服务界的“卷王”。
在「文旅宣传」场景,从景点讲解到非遗推广、从美食安利到文化出海,数智人能切换多国语言为文旅代言,外国友人看了都想打卡。 数智人正以AI技术,重塑千行百业的无限可能!
编辑:张家乐
|