河北新闻本网原创

探访新力量⑥|与数字人共舞,改变了什么

2024-05-23 07:43:52 来源:河北新闻网

扫码阅读手机版

■ 阅读提示

它可以24小时不间断直播带货;它可以帮助人完成导游、导购等简单重复性工作;它可以提高交通事故处置效率,并自动生成处置报告……

它,就是渐渐走进我们生活的数字人。

近日发布的《中国虚拟数字人影响力指数报告》显示,去年我国新增数字人相关企业同比上涨超四成。

什么是数字人?它如何改变我们的生活?数字人不再神秘的背后,预示着怎样的创新与变革?

5月17日,河北抖快淘视电子商务有限公司运营的数字人主播正在直播。河北日报记者魏雨摄

数字人主播

从4小时极限直播到全天候在线

——把人从高强度工作中解脱出来

5月17日,河北抖快淘视电子商务有限公司办公区,大厅里空无一人,30多台电脑全部开机运行。显示器画面上,数字人主播正在直播带货。

“数字人主播卖货,可以直播24小时不间断,全程几乎不需要人为干预。”公司总经理李鹏超说。

什么是数字人主播?

在这家公司搭建的摄影棚,记者目睹了数字人主播的诞生过程。

只见一位女性真人主播端坐在摄像头前,她的脸型特征迅速被记录下来。接着,她开始活动头部、手臂,张嘴说话,她的动作特点被摄像机准确捕捉。摄像过程持续约5分钟。

这是生成数字人主播的第一步——人像视频拍摄。

接下来是声音信息采集。

对着收音器,这位主播说了十几句关于产品信息的话。从这段话中,可以得到她的音色、说话节奏、流畅度等信息。

完成这两步后,将音视频信息进行预处理,再经过自动化数据标注、3D人脸重建、口唇驱动训练等,最快3个小时,一个数字人主播就生成了。

“我们目前有近100名数字人主播,都是通过这种方法‘生产’出来的。”李鹏超说,这些数字人主播与真人非常相似。

形象有了,数字人如何在直播中侃侃而谈?

记者看到,这来自事先准备的脚本。

工作人员会为数字人主播写一个3000字至5000字的脚本,内容包括产品信息和引导顾客下单的话术。数字人主播除了按脚本“读稿”,当直播间评论中打出如价格、材质、快递等词语时,脚本中设置的关键词被触发,这时数字人主播会将相关信息播报一遍。

为何不用真人而要用数字人?

“使用数字人主播成本低,一次制作,长期使用,而且日常运维简单,最大的成本是电费。”李鹏超说,公司10个员工负责近100个数字人主播的运维工作,包括选品、数字人制作、后台监控等。

抖快淘视公司数字人直播间,有的在线人数近百人,有的是个位数。但是胜在直播时长长,总流量大,平均下来,每个直播间日均销售额在3000元左右。

记者调查发现,在直播带货行业,数字人主播的应用越来越多。

“直播带货这种新消费形态刚出现时,冲动消费的情况很多。如今,人们消费趋于理性,主播的个人魅力对消费的影响力在减弱,人们更看重的是商品本身。也就是说,消费者需要的,仅仅是一个导购员而已。”李鹏超说。

在这个背景下,数字人主播价值开始得到体现。

数字人不如真人主播灵活多变、有创造力、有人格吸引力,但是它可以胜任产品导购员的工作,而且稳定性高,不知疲倦。

对真人主播来说,4小时通常是直播时长的极限。单纯论直播效果,数字人不如真人,未来也不可能完全取代真人,但它可以帮助人从高强度的工作中部分解脱出来。

对数字人主播的出现,李鹏超有一个比喻,如同制造业追求生产自动化,对直播行业来说,数字人主播实现的是销售自动化。

“数字人主播本质是以数字人形象代替真人形象,实现语言表达、形象展示功能。从这个意义上来说,数字人还有广泛的应用空间,比如服务业的数字人导购,文旅行业的数字人导游,都可以使用数字人辅助人完成相关工作。”李鹏超说。

5月16日拍摄的河北联通数字员工平台数据板。河北日报记者魏雨摄

数字员工

一项财务报表用时从19分到29秒

——让人从事更多创造性活动

在河北联通,记者第一次听到了“数字员工”这个词。

“我们现有数字员工80名,服务15个部门。”河北联通AI技术创新团队负责人潘晖介绍,公司数字员工数量还会大幅增长,预计年底将突破120人。

他告诉记者,数字员工是由人工智能、机器人流程自动化、计算机视觉等新技术驱动的数字劳动力,可代替实体员工在手机端、电脑端开展有规则的重复性工作,具备简单推理、认知和决策能力。

与数字人主播不同,数字员工并没有具体形象,而是电脑运行的软件系统。在河北联通,通常将一台电脑视为一个数字员工。

规范明确、流程清晰的工作内容是数字员工的强项,财务管理和人力资源管理很符合这一要求,因此是数字员工重要的应用领域。此外,法务、采购、政企等部门也使用数字员工。

“我们将财务流程按步骤分解,每个步骤写出相应的程序,最后合成为一个软件。实际执行财务流程时,让软件自动跑完这些程序,也就是由数字员工完成这项工作。”潘晖说。

速度快、效率高,是数字员工的最大特点。

询价单报表数据加工,是财务人员常做的一项工作,基于此,河北联通对人工和数字员工的效率进行了测算。

在一段对比视频上,记者看到,人工操作的步骤是查询字段、筛选关键数值,按照规则进行计算加工、新建表单、分类存储数据。整个过程,需要在Excel表格、Word文件、PDF文件、网页间来回切换,最终用时19分钟。

而数字员工仅用29秒,就完成了一样的工作。时间主要省在了收集数据和填报数据环节。

“对财务人员来说,在不同类型的文件中转换进行数据收集,会耗费大量时间,但这些工作又不得不做。数字员工借助自动化程序,实现了数据快速收集、填报。”潘晖说。

在不同平台间收集和处理数据,常常是令人头疼的事。许多公司内部形成了多个业务平台,平台之间信息不畅通。而数字员工的使用,可以实现数据协同,提高工作效率。

数字员工的另一个特点是准确性高。

“数字员工的运行程序都是标准化的,不易出错。人有时候工作会马虎,会受情绪影响,但它不会。财务之类的工作,对准确性要求极高,数字员工再合适不过了。”潘晖说。

数字员工的使用,把人从重复性劳动中解放出来。不过,节省下的人力做什么呢?

在做数字员工项目之前,潘晖曾经和团队做过调研。调研结果显示,很多行政部门的员工,每天要花费两三个小时甚至更多时间,在填报数据、表单以及整理信息这些重复性工作上,光是需要登录的平台就有十几个。

这让潘晖陷入深思:这些基础工作很重要,但又没有太多技术含量。如果员工日常被束缚在“表格”中,他们的价值能真正得到实现吗?

当数字员工能帮助人完成简单重复性工作后,人就有时间来进行创新。

今年以来,数字员工已为河北联通各部门节约工作日数6518个。多出来的这部分时间和精力,公司财务部门用在数据分析上,为企业决策提供有效信息;人力资源部门更多考虑如何吸引人才、培养人才或者优化人事管理制度。

“技术进步的意义,一方面是解放人的体力劳动,另一方面是挖掘人的潜力,让人从事更多创造性的活动。”潘晖表示。

5月17日,河北抖快淘视电子商务有限公司的摄影棚内,工作人员正在调试数字人主播的合成设备。河北日报记者魏雨摄

智慧公路AI数字人

应急事件处置时长缩短50%

——做到人做不到的事

“在京哈高速K56+100北京方向,小璐监测到一起追尾事故。”

“小璐小璐,帮我做一个应急处置预案。”

“推荐1号处置预案,已在自动搜索周边救援资源,预计工作人员10分钟内可到达现场,事故影响将在40分钟后完全消除。”

…………

5月16日,在河北高速集团,记者听到这样一场高速运营人员和AI数字人之间的对话。

河北高速集团去年联合百度,发布了行业首个智慧公路AI数字人“简璐璐”。目前,百度正在对数字人不同场景下的功能进行调试,预计今年10月,“简璐璐”将正式“入职”高速公路管理队伍。

与其他数字人比,“简璐璐”有何特别之处?

记者采访了解到,“简璐璐”是一款基于交通大模型的AI产品,拥有对话式全新交互系统,结合语音语义理解能力形成全新交互模式,能够通过对话完成业务处理。依托大模型的知识增强能力与内容生成能力,拥有对相关业务进行智能决策处理、智能生产所需内容的能力。

“说直白点儿,它是真正具备了一定智力水平的数字人。它有很强的自我学习能力,能够与人进行对话,而不是机械地回答‘题库’中的问题。它也能做出判断,能根据人的需求制定方案或者写一份报告。”河北高速集团技术创新管理部部长李春杰说。

在某些方面,“简璐璐”还拥有超越人的能力,能做到人做不到的事。

发现和处置交通事件是高速管理人员的日常职责。人做这项工作,一般通过观察高速公路上监控画面,判断是否发生碰撞、抛洒等行为。但由于摄像机的拍摄距离和清晰度有限制,太远了拍不清,如果是夜间或者恶劣天气条件下,画面质量也会受损,这会影响人的判断。

数字人怎么解决这个问题呢?

“如果是夜间,或者暗环境下拍摄的画面,可以使用算法为画面补色,将其清晰度还原到明亮光源下的画面。有时因为距离远,拍到的画面模糊,人很难判断发生了什么。这时,数字人通过大样本视频画面学习,分析此类事件可能是什么,学习样本越大,对事件的判断准确率越高。”百度项目负责人说。

目前,高速公路抛洒物监测,70厘米见方的物体,数字人监测准确率能达到90%;20厘米见方的物体,准确率能达到70%。

数字人不但聪明,而且能干。利用强大的信息处理能力,数字人化身为超级助手,提高了交通事件的处置效率。

一个交通事件发生后,数字人第一时间向管理人员报告。接到管理人员指令后,数字人启动仿真模拟程序,生成处置方案。处置方案往往需要多部门协同,包括路政、交警、医疗救援等,数字人会找到离现场最近的工作人员,通知他们,实时跟踪他们的进展。

同时,数字人会自动编辑信息,发送到高速公路显示屏上,提醒往来车辆。如果发生严重交通事故,数字人还会为导航App和电台广播发送消息。事故处置完毕,数字人自动生成处置报告。

经过测算,使用数字人,应急事件处置时长缩短了50%,道路安全隐患下降了30%。

基于AI技术的数字人,还可以提供进阶版智能导航。

近日,河北高速集团与百度合作开发了一款预约出行软件。该软件不仅能提供线路规划,还能提供沿途服务区的信息,包括服务区有哪些餐厅、充电桩有多少等。

“数字人的应用,提高了道路安全性,提升了出行效率,也满足了人们对美好生活的需求。”李春杰说。(河北日报记者 魏 雨 姜 艳)

■ 记者观察

数字人开启“数智”赋能新赛道

在网络直播间,数字人主播能流畅地介绍商品信息;在旅游景点,数字人导游可提供景区全程导航;在学校课堂,数字人讲师将实现学生个性化学习和多样化需求……

从文旅到教育,从政府到企业,不同形式、更广领域的数字人应用场景不断涌现,逐渐取代一些重复性、机械性的人力劳动,并成为数字经济发展的新增长点。

数字人也叫虚拟人,是利用数字技术打造的、模拟人类特征的虚拟人物。随着AI、虚拟现实等技术的飞速发展,数字人正加速融入人们的日常生活,我们也迎来一个前所未有的数字人时代。

数据显示,2023年我国数字人相关企业99.3万余家,其中新增41.7万余家。相关机构预测,到2025年,中国虚拟人带动的产业市场规模和核心市场规模将分别达6402.7亿元和480.6亿元,增长态势强劲。

数字人走红的背后,得益于技术迭代更新。数字人核心技术涵盖计算机图形学、动作捕捉、图像渲染等多个领域。特别在AI大模型加持下,数字人制作水平、精细度明显提升,数字人产业加快走向成熟。

随着数字人从技术创新走向产业应用,各地纷纷加速布局数字人赛道。

作为国内首个数字人产业专项支持政策,《北京市促进数字人产业创新发展行动计划》提出,到2025年,北京数字人产业规模突破500亿元。

上海则鼓励数字领域企业发展虚拟时尚,重点发展数字精品、数字时装、数字虚拟人等新时尚。

浙江省近日表示,要抢抓电子商务直播快速发展机遇,发展数字人虚拟主播、元宇宙新消费场景等新业态新模式。

发力数字人产业,河北如何作为?

人工智能大模型是数字人发展的重要基础。近年来,我省加大数字技术研发力度,推出一系列大模型产品。就在今年5月,我省提出,推动建设人工智能软硬件适配中心,加快构建全栈自主可控的人工智能大模型技术体系;充分利用人工智能计算丰富资源,加快培育孵化行业应用大模型。

数字人普及还带来对算力需求的爆发式增长。对此,我省也有相应规划,将充分发挥京津冀枢纽节点算力资源优势,促进算力、数据、算法协同应用,努力建设协同京津、国内领先的人工智能产业创新发展高地。到2025年,力争算力规模达到35EFlops(EFlops指每秒百亿亿次浮点运算次数)以上。

尽管发展迅猛,也应看到,目前数字人产业仍处在成长期,仍须补短板强弱项。

一方面,要持续在人工智能、虚拟现实等核心技术上实现突破,提升数字人的交互能力。另一方面,要通过技术升级进一步降低数字人制作成本,充分释放数字人的产业价值。

但可以预见的是,未来,数字人将会延伸渗透进更多应用场景,从而发挥出其激发产业新活力的作用。

期待在相关政策引领下,河北抓住数字人发展新机遇,赋能千行百业实现数字化、智能化转型。

文/河北日报记者 姜 艳 魏 雨

责任编辑:张永猛
电子报

凡注有“河北新闻网”电头或标明“来源:河北新闻网”的所有作品,版权均为本网站与河北日报报业集团所有(本网为河北日报报业集团独家授权版权管理机构)。未经许可不得转载、摘编、复制、链接、镜像或以其它方式使用上述作品,违者将依法追究法律责任。