数字文娱「起风」,华为云盘古「扬旗」

新闻资讯   2023-07-30 10:05   93   0  

文娱产业加载的想象力,正由华为云实现。


世界第一台电子计算机ENIAC诞生后的一年内,计算机、人工智能之父艾伦·图灵写下了第一行游戏代码,从此数字文娱产业便与计算机、人工智能有了长久的链接。
草蛇灰线,伏脉千里。数十年间,人们经历了从物质生活匮乏,到精神生活极大丰富的过程,包括电子游戏在内,一大批新的文娱产品和业态涌现,不断满足人们衍变的需求,在此期间,新技术成为了文娱产业的极大助力。
最早,电子游戏是人工智能研究的附属品,科学家们用它来研究博弈,后来计算机和人工智能无处不在,每一次技术浪潮迭代,都会重新塑造文娱产业的生态面貌,承载信息的各种媒介、细致入微的显示画面、沉浸式体验等,无一不仰仗于新技术的发展。
如今,数字文娱、计算机和AI技术形成了稳固的三角循环关系,数字文娱产业总是呼唤更强大的算力,从而实现更好的体验,计算机算力指数级增长,训练出了更为强大的AI,如今火热的AI算力,起初便是用于图形处理的GPU。
2023年,以大模型为代表的AI技术掀起又一次高潮,三角关系出现了一个短暂不平衡的缺口,算力和AI技术的价值,还没有完全兑现到数字文娱产业。产业发展历史告诉我们,每当三角关系的任一极,有了更精妙的想法、更大的算力、更具革命性的应用,其他两极总是能迅速消化并跟上,重新形成稳固的三角关系。
7月28日,全球数字娱乐领域最具知名度与影响力的年度盛会之一——ChinaJoy拉开帷幕,作为中国数字娱乐产业蓬勃发展的缩影,ChinaJoy映射出我国数字娱乐产业从无到有,由弱变强的发展历程。

而本届ChinaJoy有所不同,其主题更聚焦科技变革时代数字娱乐产业的发展和提升,主打新科技驱动下的“娱乐+科技”,1946年人工智能飞向文娱产业的那只“蝴蝶”,来到了2023年的ChinaJoy。

大模型,文娱产业的无限可能

置身于今年的ChinaJoy大会现场,可以清晰地感受到,从展示内容上,ChinaJoy从以游戏为主,更多蔓延到动漫、电竞、互联网影视与音乐等数字文娱相关领域,同时科技属性更加浓重,很多云计算、大数据、出海相关的技术公司也来参展。
“AI”成为展会的最大核心亮点。AIGC爆发元年,ChatGPT、Midjourney等AI应用场景和产品层出不穷,ChinaJoy也适时而变,全新增设数字科技创新主题展区、ChinaJoy AIGC大会等,很多游戏厂商也展出了AI技术支持下的游戏产品。
以大模型为代表的新技术与形态丰富的文娱产业在ChinaJoy集中交汇,很大程度上是因为,大模型为文娱产业擘画了一副极具想象力的远景。
麦肯锡最新发表的《生成式人工智能的经济潜力》报告指出,生成式人工智能对生产力的影响可以为全球经济增加数万亿美元的价值。在麦肯锡分析的63个案例中,生成式人工智能每年可以增加相当于2.6万亿美元至4.4万亿美元的产值。其中在文娱领域,将会带来600亿-1100亿美金的产值提升。
ChinaJoy期间,以“越AI 越FUN”为主题的华为云数字文娱AI创新峰会2023召开,华为云全球 Marketing与销售服务总裁石冀琳表示,AI帮助企业提高内容生产的效率,生成更加丰富多元、动态且可交互的内容,优化传统互动模式。AI正从激发生产力、打造新内容、构建新体验多层面重塑着数字文娱行业。

正如石冀琳所言,目前大模型之于文娱产业的效用,大致可以分为三类:提高生产效率、激发创意、提升体验。
首先是提高生产效率,以大模型为代表数字技术,提供了迄今为止最大的采集、处理、存储和生成各种文化元素的能力,极大提高了内容生产和运行效率,也为企业发展提供了新的机遇。
其次是创意辅助,大模型与内容的结合,能够激发出许多意想不到的创意引导,诸如用大模型生成一幅游戏原画,创作一篇剧情框架,对于设计师、文案写作者、艺术家等内容创作者,大模型能够辅助他们进行艺术创作。

最后是体验的革命性变化,大模型的互动性较为友好,AIGC可以实现自然语言和机器语言的便捷交互,既可改变现有体验,也可创造出新的体验方式。例如,在游戏行业,随着 AIGC的发展逐步深入,头部的游戏公司已经将大模型赋能到游戏角色中,助推游戏角色多维度呈现更为鲜活的人物表现,角色可基于人设和游戏剧情分支回答问题,还可以接受礼物、切磋武艺等,大大优化了玩家的交互方式和体验。

落地现实前的关卡

如前叙及,数字文娱、计算机和AI技术形成了稳固的三角循环关系,大模型带来了新的机会点,也是新的洗牌点。在达到新平衡点的过程中,往往伴随着淘汰与新生,大模型落地文娱领域并不是一帆风顺。
华为云EI大数据与AI产品总经理李伟表示,通用大模型落地行业存在一些困难,大模型通用性强,但专业性比较弱,落地行业需要具备专业知识,了解行业里的工作流程,给出专业准确的回答。
大模型知识虽然多,但技能不足,目前通用大模型多为通用大语言模型,而复杂的企业场景需要大模型“能说会看”,同时还要“能想会算”,多模态是必需能力。
此外,以前厂商要生成一张3D原画时,通常用开源模型A生成线稿,再放到通用模型B里生成三维立体效果,这种割裂式的体验对用户还不足够友好。
文娱产业的公司或者开发者,在接入大模型时候缺少相关技术经验和积累,在基于大模型构建AI应用或自训大模型,欠缺工程化的平台和方法,例如基于开源大模型构建公司内部的AIGC平台时,缺少便捷的微调和二次开发工具针对特定的场景构建场景模型。
当下紧缺的算力也是摆在企业面前的现实难题,大模型的训练、微调、推理各环节都离不开AI算力,甚至出现了一卡难求的情况,文娱产业很难获取到自己所需的高性价比AI算力。

除此之外,企业也分外看重数据安全与合规问题,不管是游戏行业客户还是音视频行业的客户,数据都会变成企业核心资产,企业要在确保数据安全的前提下,探索大模型的应用价值。在大模型落地到数字文娱产业的过程中,还有很多空白亟需填补,企业不止需要一个大模型,更需要围绕大模型的完整工具链和生态体系。

面向文娱产业的系统性创新

华为云是较早深入数字文娱产业的技术厂商,在文娱产业,2023年以来,新游Top100中90%与华为有不同程度的合作,75%的Top50文娱企业选择华为云,包括美图、网易游戏、中手游、三七互娱、乐元素、芒果幻视等知名企业。
以美图与华为云的合作为例。美图公司旗下美图设计室最新推出的创新功能——AI模特试衣,由华为云盘古大模型与美图视觉大模型MiracleVision共同研发。其中,该功能基于盘古多模态大模型的以文生图和精准局部控制等能力,直接构建模特试衣图片生成模型。同时,通过人像自动修复、精准局部控制等技术,在保留衣服细节的同时,又能适应人体不同的姿态,让AI生成的模特更真实更自然,还使得服装图片的制作时间由“天”级降至“秒”级,缩短上架周期,帮助服装电商行业降本提效。
在此前华为开发者大会(HDC.Cloud 2023)上的现场演示中,“AI模特试衣”效果让人非常惊喜:一件衣服可匹配多位不同体型、肤色的真实模特,用户只需替换模特,即可直观看到不同模特的上身效果。
与美图的合作只展示了华为云盘古大模型的版图一隅,具体来看,盘古大模型3.0才是大模型能力具现化的平台依托。
盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构,契合数字文娱行业应用大模型需求,使能文娱多领域AIGC创新。
华为云和其他大模型厂商的差别也在于此,从盘古大模型诞生之初就分外强调行业落地,L0、L1、L2三层递进,旨在针对不同客户需求提供不同颗粒度的模型服务,不同的组合又可以做到解耦和按需组合,形成一个稳定高效的行业大模型系统。
在L0层,盘古大模型就提供全新能力集,比如NLP大模型的知识问答,文案生成,代码生成,NL2SQL,插件调用等能力,以及多模态大模型的图像生成,图像理解等能力。
企业可以在L0层直接调用文生图、以图生图、图像编辑、可控生成等能力,通过华为云AI开发生产线ModelArts,直接构建模型并部署为AI应用。
在L0和L1大模型的基础上,华为云为客户提供大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型,如二次元动漫大模型等,如此便解决了企业客户大模型应用快速部署以及专属大模型开发的难题。
相较于海外大模型,盘古大模型原生支持中文,使用了亿级中文图文对训练数据,有更佳的中文理解能力,在精准语义理解方面,结合企业自有数据集,也能做到智能语境识别,贴近自然美感生成内容。
值得一提的是盘古大模型的根技术,对于算力短缺和自主创新的现实难题,盘古大模型最底层构建了以鲲鹏和昇腾为基础的AI算力云平台,还构建了昇腾的计算引擎CANN、AI的开发框架MindSpore,以及AI开发平台ModelArts,为大模型开发和运行,提供分布式并行加速、算子和编译优化、集群级通信优化等关键能力,在大模型训练场景下训练效能当前已经达到业界主流GPU的1.1倍。
大模型热潮起,文娱产业仿佛有了一把“无所不能”的锤子,游戏、音视频、社交娱乐、传媒等各行业,都在想象用这把锤子做些什么,而华为云便是帮助企业把想象力变为现实的那个角色。
从彼岸到此岸,从理想到现实,文娱产业应用大模型的空白,盘古大模型给了系统回答。

文章引用微信公众号"36氪",如有侵权,请联系管理员删除!

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。