探访新力量⑥|与数字人共舞,改变了什么
来自河北新闻网
扫码阅读手机版
■ 阅读提示
它可以24小时不间断直播带货;它可以帮助人完成导游、导购等简单重复性工作;它可以提高交通事故处置效率,并自动生成处置报告……
它,就是渐渐走进我们生活的数字人。
近日发布的《中国虚拟数字人影响力指数报告》显示,去年我国新增数字人相关企业同比上涨超四成。
什么是数字人?它如何改变我们的生活?数字人不再神秘的背后,预示着怎样的创新与变革?
5月17日,河北抖快淘视电子商务有限公司运营的数字人主播正在直播。河北日报记者魏雨摄
数字人主播
从4小时极限直播到全天候在线
——把人从高强度工作中解脱出来
5月17日,河北抖快淘视电子商务有限公司办公区,大厅里空无一人,30多台电脑全部开机运行。显示器画面上,数字人主播正在直播带货。
“数字人主播卖货,可以直播24小时不间断,全程几乎不需要人为干预。”公司总经理李鹏超说。
什么是数字人主播?
在这家公司搭建的摄影棚,记者目睹了数字人主播的诞生过程。
只见一位女性真人主播端坐在摄像头前,她的脸型特征迅速被记录下来。接着,她开始活动头部、手臂,张嘴说话,她的动作特点被摄像机准确捕捉。摄像过程持续约5分钟。
这是生成数字人主播的第一步——人像视频拍摄。
接下来是声音信息采集。
对着收音器,这位主播说了十几句关于产品信息的话。从这段话中,可以得到她的音色、说话节奏、流畅度等信息。
完成这两步后,将音视频信息进行预处理,再经过自动化数据标注、3D人脸重建、口唇驱动训练等,最快3个小时,一个数字人主播就生成了。
“我们目前有近100名数字人主播,都是通过这种方法‘生产’出来的。”李鹏超说,这些数字人主播与真人非常相似。
形象有了,数字人如何在直播中侃侃而谈?
记者看到,这来自事先准备的脚本。
工作人员会为数字人主播写一个3000字至5000字的脚本,内容包括产品信息和引导顾客下单的话术。数字人主播除了按脚本“读稿”,当直播间评论中打出如价格、材质、快递等词语时,脚本中设置的关键词被触发,这时数字人主播会将相关信息播报一遍。
为何不用真人而要用数字人?
“使用数字人主播成本低,一次制作,长期使用,而且日常运维简单,最大的成本是电费。”李鹏超说,公司10个员工负责近100个数字人主播的运维工作,包括选品、数字人制作、后台监控等。
抖快淘视公司数字人直播间,有的在线人数近百人,有的是个位数。但是胜在直播时长长,总流量大,平均下来,每个直播间日均销售额在3000元左右。
记者调查发现,在直播带货行业,数字人主播的应用越来越多。
“直播带货这种新消费形态刚出现时,冲动消费的情况很多。如今,人们消费趋于理性,主播的个人魅力对消费的影响力在减弱,人们更看重的是商品本身。也就是说,消费者需要的,仅仅是一个导购员而已。”李鹏超说。
在这个背景下,数字人主播价值开始得到体现。
数字人不如真人主播灵活多变、有创造力、有人格吸引力,但是它可以胜任产品导购员的工作,而且稳定性高,不知疲倦。
对真人主播来说,4小时通常是直播时长的极限。单纯论直播效果,数字人不如真人,未来也不可能完全取代真人,但它可以帮助人从高强度的工作中部分解脱出来。
对数字人主播的出现,李鹏超有一个比喻,如同制造业追求生产自动化,对直播行业来说,数字人主播实现的是销售自动化。
“数字人主播本质是以数字人形象代替真人形象,实现语言表达、形象展示功能。从这个意义上来说,数字人还有广泛的应用空间,比如服务业的数字人导购,文旅行业的数字人导游,都可以使用数字人辅助人完成相关工作。”李鹏超说。
5月16日拍摄的河北联通数字员工平台数据板。河北日报记者魏雨摄
数字员工
一项财务报表用时从19分到29秒
——让人从事更多创造性活动
在河北联通,记者第一次听到了“数字员工”这个词。
“我们现有数字员工80名,服务15个部门。”河北联通AI技术创新团队负责人潘晖介绍,公司数字员工数量还会大幅增长,预计年底将突破120人。
他告诉记者,数字员工是由人工智能、机器人流程自动化、计算机视觉等新技术驱动的数字劳动力,可代替实体员工在手机端、电脑端开展有规则的重复性工作,具备简单推理、认知和决策能力。
与数字人主播不同,数字员工并没有具体形象,而是电脑运行的软件系统。在河北联通,通常将一台电脑视为一个数字员工。
规范明确、流程清晰的工作内容是数字员工的强项,财务管理和人力资源管理很符合这一要求,因此是数字员工重要的应用领域。此外,法务、采购、政企等部门也使用数字员工。
“我们将财务流程按步骤分解,每个步骤写出相应的程序,最后合成为一个软件。实际执行财务流程时,让软件自动跑完这些程序,也就是由数字员工完成这项工作。”潘晖说。
速度快、效率高,是数字员工的最大特点。
询价单报表数据加工,是财务人员常做的一项工作,基于此,河北联通对人工和数字员工的效率进行了测算。
在一段对比视频上,记者看到,人工操作的步骤是查询字段、筛选关键数值,按照规则进行计算加工、新建表单、分类存储数据。整个过程,需要在Excel表格、Word文件、PDF文件、网页间来回切换,最终用时19分钟。
而数字员工仅用29秒,就完成了一样的工作。时间主要省在了收集数据和填报数据环节。
“对财务人员来说,在不同类型的文件中转换进行数据收集,会耗费大量时间,但这些工作又不得不做。数字员工借助自动化程序,实现了数据快速收集、填报。”潘晖说。
在不同平台间收集和处理数据,常常是令人头疼的事。许多公司内部形成了多个业务平台,平台之间信息不畅通。而数字员工的使用,可以实现数据协同,提高工作效率。
数字员工的另一个特点是准确性高。
“数字员工的运行程序都是标准化的,不易出错。人有时候工作会马虎,会受情绪影响,但它不会。财务之类的工作,对准确性要求极高,数字员工再合适不过了。”潘晖说。
数字员工的使用,把人从重复性劳动中解放出来。不过,节省下的人力做什么呢?
在做数字员工项目之前,潘晖曾经和团队做过调研。调研结果显示,很多行政部门的员工,每天要花费两三个小时甚至更多时间,在填报数据、表单以及整理信息这些重复性工作上,光是需要登录的平台就有十几个。
这让潘晖陷入深思:这些基础工作很重要,但又没有太多技术含量。如果员工日常被束缚在“表格”中,他们的价值能真正得到实现吗?
当数字员工能帮助人完成简单重复性工作后,人就有时间来进行创新。
今年以来,数字员工已为河北联通各部门节约工作日数6518个。多出来的这部分时间和精力,公司财务部门用在数据分析上,为企业决策提供有效信息;人力资源部门更多考虑如何吸引人才、培养人才或者优化人事管理制度。
“技术进步的意义,一方面是解放人的体力劳动,另一方面是挖掘人的潜力,让人从事更多创造性的活动。”潘晖表示。
5月17日,河北抖快淘视电子商务有限公司的摄影棚内,工作人员正在调试数字人主播的合成设备。河北日报记者魏雨摄
智慧公路AI数字人
应急事件处置时长缩短50%
——做到人做不到的事
“在京哈高速K56+100北京方向,小璐监测到一起追尾事故。”
“小璐小璐,帮我做一个应急处置预案。”
“推荐1号处置预案,已在自动搜索周边救援资源,预计工作人员10分钟内可到达现场,事故影响将在40分钟后完全消除。”
…………
5月16日,在河北高速集团,记者听到这样一场高速运营人员和AI数字人之间的对话。
河北高速集团去年联合百度,发布了行业首个智慧公路AI数字人“简璐璐”。目前,百度正在对数字人不同场景下的功能进行调试,预计今年10月,“简璐璐”将正式“入职”高速公路管理队伍。
与其他数字人比,“简璐璐”有何特别之处?
记者采访了解到,“简璐璐”是一款基于交通大模型的AI产品,拥有对话式全新交互系统,结合语音语义理解能力形成全新交互模式,能够通过对话完成业务处理。依托大模型的知识增强能力与内容生成能力,拥有对相关业务进行智能决策处理、智能生产所需内容的能力。
“说直白点儿,它是真正具备了一定智力水平的数字人。它有很强的自我学习能力,能够与人进行对话,而不是机械地回答‘题库’中的问题。它也能做出判断,能根据人的需求制定方案或者写一份报告。”河北高速集团技术创新管理部部长李春杰说。
在某些方面,“简璐璐”还拥有超越人的能力,能做到人做不到的事。
发现和处置交通事件是高速管理人员的日常职责。人做这项工作,一般通过观察高速公路上监控画面,判断是否发生碰撞、抛洒等行为。但由于摄像机的拍摄距离和清晰度有限制,太远了拍不清,如果是夜间或者恶劣天气条件下,画面质量也会受损,这会影响人的判断。
数字人怎么解决这个问题呢?
“如果是夜间,或者暗环境下拍摄的画面,可以使用算法为画面补色,将其清晰度还原到明亮光源下的画面。有时因为距离远,拍到的画面模糊,人很难判断发生了什么。这时,数字人通过大样本视频画面学习,分析此类事件可能是什么,学习样本越大,对事件的判断准确率越高。”百度项目负责人说。
目前,高速公路抛洒物监测,70厘米见方的物体,数字人监测准确率能达到90%;20厘米见方的物体,准确率能达到70%。
数字人不但聪明,而且能干。利用强大的信息处理能力,数字人化身为超级助手,提高了交通事件的处置效率。
一个交通事件发生后,数字人第一时间向管理人员报告。接到管理人员指令后,数字人启动仿真模拟程序,生成处置方案。处置方案往往需要多部门协同,包括路政、交警、医疗救援等,数字人会找到离现场最近的工作人员,通知他们,实时跟踪他们的进展。
同时,数字人会自动编辑信息,发送到高速公路显示屏上,提醒往来车辆。如果发生严重交通事故,数字人还会为导航App和电台广播发送消息。事故处置完毕,数字人自动生成处置报告。
经过测算,使用数字人,应急事件处置时长缩短了50%,道路安全隐患下降了30%。
基于AI技术的数字人,还可以提供进阶版智能导航。
近日,河北高速集团与百度合作开发了一款预约出行软件。该软件不仅能提供线路规划,还能提供沿途服务区的信息,包括服务区有哪些餐厅、充电桩有多少等。
“数字人的应用,提高了道路安全性,提升了出行效率,也满足了人们对美好生活的需求。”李春杰说。(河北日报记者 魏 雨 姜 艳)
■ 记者观察
数字人开启“数智”赋能新赛道
在网络直播间,数字人主播能流畅地介绍商品信息;在旅游景点,数字人导游可提供景区全程导航;在学校课堂,数字人讲师将实现学生个性化学习和多样化需求……
从文旅到教育,从政府到企业,不同形式、更广领域的数字人应用场景不断涌现,逐渐取代一些重复性、机械性的人力劳动,并成为数字经济发展的新增长点。
数字人也叫虚拟人,是利用数字技术打造的、模拟人类特征的虚拟人物。随着AI、虚拟现实等技术的飞速发展,数字人正加速融入人们的日常生活,我们也迎来一个前所未有的数字人时代。
数据显示,2023年我国数字人相关企业99.3万余家,其中新增41.7万余家。相关机构预测,到2025年,中国虚拟人带动的产业市场规模和核心市场规模将分别达6402.7亿元和480.6亿元,增长态势强劲。
数字人走红的背后,得益于技术迭代更新。数字人核心技术涵盖计算机图形学、动作捕捉、图像渲染等多个领域。特别在AI大模型加持下,数字人制作水平、精细度明显提升,数字人产业加快走向成熟。
随着数字人从技术创新走向产业应用,各地纷纷加速布局数字人赛道。
作为国内首个数字人产业专项支持政策,《北京市促进数字人产业创新发展行动计划》提出,到2025年,北京数字人产业规模突破500亿元。
上海则鼓励数字领域企业发展虚拟时尚,重点发展数字精品、数字时装、数字虚拟人等新时尚。
浙江省近日表示,要抢抓电子商务直播快速发展机遇,发展数字人虚拟主播、元宇宙新消费场景等新业态新模式。
发力数字人产业,河北如何作为?
人工智能大模型是数字人发展的重要基础。近年来,我省加大数字技术研发力度,推出一系列大模型产品。就在今年5月,我省提出,推动建设人工智能软硬件适配中心,加快构建全栈自主可控的人工智能大模型技术体系;充分利用人工智能计算丰富资源,加快培育孵化行业应用大模型。
数字人普及还带来对算力需求的爆发式增长。对此,我省也有相应规划,将充分发挥京津冀枢纽节点算力资源优势,促进算力、数据、算法协同应用,努力建设协同京津、国内领先的人工智能产业创新发展高地。到2025年,力争算力规模达到35EFlops(EFlops指每秒百亿亿次浮点运算次数)以上。
尽管发展迅猛,也应看到,目前数字人产业仍处在成长期,仍须补短板强弱项。
一方面,要持续在人工智能、虚拟现实等核心技术上实现突破,提升数字人的交互能力。另一方面,要通过技术升级进一步降低数字人制作成本,充分释放数字人的产业价值。
但可以预见的是,未来,数字人将会延伸渗透进更多应用场景,从而发挥出其激发产业新活力的作用。
期待在相关政策引领下,河北抓住数字人发展新机遇,赋能千行百业实现数字化、智能化转型。
文/河北日报记者 姜 艳 魏 雨
凡注有“河北新闻网”电头或标明“来源:河北新闻网”的所有作品,版权均为本网站与河北日报报业集团所有(本网为河北日报报业集团独家授权版权管理机构)。未经许可不得转载、摘编、复制、链接、镜像或以其它方式使用上述作品,违者将依法追究法律责任。
河北日报
微信公众号
河北新闻网
微信公众号
燕赵都市报
微信公众号
河北日报
客户端