华为副总裁、ISP与互联网系统部总裁 岳坤
2024年8月20日举行的第三十一届(BIRTV)北京国际广播电影电视展览会上,华为副总裁、ISP与互联网系统部总裁岳坤在主题报告会上发表《数智化引领传媒行业新质生产力变革》的精彩演讲,分享了“数智化如何为传媒行业注入新动力”的最新思考与实践,以下是发言概要:
一、在传媒行业,数字化是智能化的基石,不能轻言跨过数字化直接进入智能化
IT行业经历了电子化、信息化、数字化、智能化四个发展阶段,传媒行业同样也在与时俱进。随着生成式AI的发展,业内逐渐出现要求跨越数字化,直接演进到智能化的声音。关于这点,我们认为:对于传媒行业,数字化是智能化的基石,不能轻言跨过数字化直接进入智能化,主要有如下三个考虑:
1.相对数字原生的行业,传媒行业目前的数据整理、存储和分析等数字化环节还存在很大提升空间,特别是历史保存在非电子化及模拟系统中的语料。缺乏高质量、标准化的数据,无法为智能化提供足够的“原料”和支撑。
2.当前智能化技术难以满足传媒行业发展的需要。众所周知,人工智能是一个概率统计学,即便最理想的情况下,精度无限接近1也不可能做到100%准确;在部分场景,有70-80%精度的场景即可满足日常应用需求。但在传媒领域,多模态技术正处于初期发展阶段,当前精度还不能支撑所有场景的规模应用。
3.传媒行业的数字化建设刚刚进入深水区,还需要一定的时间来通过创新管理和交易机制,提升行业整体价值资本变现能力,为传媒可持续发展奠定坚实基础。
综上,在传媒行业中,数字化是迈向智能化的必经之路,做好传媒智能化的前提是做好传媒数字化。
二、夯实传媒数字化工作,做好系统化超高清建设与媒体融合转型
近年来广播电视行业协同发展,超高清与媒体融合成为两大趋势,为传媒数字化奠定良好基础。超高清在当前的赛事节目中应用效果尤为明显,通过“4K超高清 三维声”的应用,为电视机前的观众带来身临其境的视听体验。媒体融合则是将一切媒体的资讯数字化,通过融媒平台将资讯以最便捷的方式进行传播,同时也驱动了各类媒体信息共享和价值传递。
在超高清领域,华为根据当前行业痛点和发展趋势,联合行业客户、主流媒资设备厂商和ISV伙伴等,从以下三点出发,打造了行业领先的超高清制播IP化解决方案,共同构建新一代超高清制播体系。
1.在国家科技部、国家广电总局和央视总台带领下,华为深度参与超高清制播IP化标准制订和产业研制工作。
2.依托由科技部批准建设的超高清视音频制播呈现国家重点实验室,同中央广播电视总台、相关厂商开展了一系列4K/8K超高清IP化制播的研究与实践,助力中央广播电视总台建成全国首个4K/8K总控IP化调度系统。该系统具备超远程制播能力,支持超两千路4K无压缩信号调度,采用SDN架构实现无压缩信号制播。目前该超高清制播IP化方案已经成功商用交付上线。
在媒体融合方面,很多存量生产系统ICT基础设施“烟囱”林立,形成信息孤岛;很多传统硬件平台在支撑融媒体业务的生产与部署过程中面临诸多挑战。华为通过构建融合数智化云底座来解决媒体单位在媒体融合业务部署过程中遇到的挑战。
1.融合数智化云底座构建媒体行业“平台即服务”理念,沉淀行业共性能力,满足媒体融合生产要求;提供统一的超高清存储池,提供更强大的文件存储能力、实现素材的快速迁移;促进应用软件与底层硬件平台解耦,更好满足媒体融合生产的要求。
2.通过融合数智化云底座,可实现新闻视音频素材的“随采随编”及内容的智能生产及审核,减少生产制作环节内容泄露风险。
3.融合数智化云底座实现云化部署,统一建设与运营计算、存储、网络平台,提升资源利用率。
三、拥抱AI,共建传媒大模型,强化监管,促进行业健康发展
1.深化人工智能技术应用,构建AI叙事与评价能力
AIGC在传媒领域部分场景已经能够原生生成各种类型的内容,正逐步成为传媒行业新质生产力的发动机。三中全会提出把中国故事讲好,不是一件容易的事情。我们国家有5000年的绚烂文化,用这5000年的文化数据作为语料输入,结合人工智能大模型训练推理,构建良好的叙事体系及评价能力,文化与科技结合,一定能够讲好中国故事。因此,实现传媒数智化需要积极拥抱人工智能,不能作壁上观。
2.形成传媒行业价值语料合力,共同构建传媒行业垂类模型
目前国内外各大厂AI大模型已形成“百模千态”的局势,但各大厂的投入方向主要聚焦在大语言模型、计算机视觉、多模态等基础模型构建。成熟可应用的传媒行业模型尚未发现,其主要原因在于传媒行业价值语料分散在不同媒体机构手中。因此需要广播电视行业的头部机构牵头发力,统一建设广播电视大模型平台,构建传媒行业垂类模型,服务传媒行业智能化发展。
3.强化行业监管,保障传媒行业健康发展
AIGC为传媒行业带来生产力的提升,但也伴随诸多挑战。如何确保AI生成内容的准确性和公正性、处理版权问题、以及防止AI技术被滥用以传播虚假信息等问题,需要整个传媒行业、国家部委、行业监管机构等多方共同努力,制定出相应的规则和标准,以确保AIGC在传媒行业的健康和可持续发展。去年7月,七部委联合发布“生成式人工智能服务管理暂行办法”,是我国首个生成式AI的监管文件,从生成式人工智能服务提供者的算法设计与备案、训练数据、模型、到用户隐私、商业秘密的保护,监督检查和法律责任等方面提出了相关要求。因此,需要行业监管机构制定落地细则(如AI生成的视频强制水印机制等),确保传媒行业人工智能的健康发展。
在部署行业人工智能大模型过程中,解决方案往往会伴随着试错环节,这一过程中难免会陷入以下常见的误区:
1.方式误区:用传统建设大数据或者私有云平台的方式去部署智算大模型平台
过去做大数据或者私有云平台的时候,主要投资是服务器,网络性能往往被忽视。而随着AI平台建设的逐步完善与发展,AI服务器利用率与网络性能之间的正比关系也逐渐清晰。于是,如何尽可能提升AI服务器的使用率,已成为投资部门评审的关键。
2.算力认知误区:重硬件,轻软件
由于大模型的算力系统是把几万个数据处理单元连接起来,且几万个器件的连接一旦出现故障或者阻塞,就会导致训练中断,训练中断就需要checkpoint回退,一旦回退就会造成时间浪费。于是,断点续训成为当下业界普遍面临的难题。目前业界通用的训练中断时间是2.8天,即平均每2.8天就会出现一次中断。但如果checkpoint设置合理,即便中断,恢复速度也将大幅提升。因此,一个优秀的算力调度平台是算力系统建设的核心要素。
3.语料认知误区:重语料数量,轻语料质量
部分行业大模型训练容易陷入过于强调数据量的认知误区,认为语料越多,模型越精准。这种观点并不完全正确。尽管数据量对于训练行业大模型极为重要,但它并非是决定模型性能的唯一因素。语料的质量、多样性和代表性同样重要。即使拥有大量的语料,如果质量不高,仍然可能导致模型训练效果不佳。此外,过多的语料还可能引起模型过拟合的问题,影响其泛化能力。实际上,在训练或微调行业模型时,还需要重视语料的质量、多样性和代表性等,并采取适当的数据预处理措施以确保模型训练的有效性和准确性。
因此,整个大模型智算系统的建设是一个系统工程,需要全面考虑。作为全球领先的ICT(信息与通信)基础设施和智能终端提供商,华为在这方面积累了丰富的经验,已经成功完成了多个行业的大模型系统建设,为我们客户提供了全栈AI能力。如:
1.对算存网进行系统性设计,整合算力、存力和运力,构建高性能、高稳定、高带宽的算力集群系统。
2.构建可演进、可开放、可承受的算力调度平台,实现训练与推理资源统一管理和分时复用,支持训推资源共池、跨域诊断、断点续训的能力,兼容各类开、闭源模型,面向未来可持续演进。
3.构建语料治理平台,针对媒体行业的文本、语音、视频等多模态语料进行获取、加工、标注和发布等治理工作,管理数据生命周期,并具备数据溯源、数据水印等全域资产可视化管理能力。
此外,华为开发了一系列的媒体行业AIGC能力,提供数字人生成与实时交互、实拍视频转动漫、视频翻译与AI原生同传,AIGC-3D等服务,实现文本、图像、视频、音频的跨域感知,多模态识别与创作分析。
视频超高清及媒体融合的发展,推动IP化技术和云计算在广播电视行业的深度应用。生成式人工智能进一步开启了广播电视领域的数智化新篇章,将引领整个行业数智化进程。
面对前所未有的发展机遇,华为将持续投入传媒行业,助力其数智化转型升级。我相信,在超高清技术、媒体融合与人工智能的共同驱动下,传媒行业将迎来全新发展阶段。让我们携手同行,共创传媒行业美好未来!