互联网大厂高调参加WAIC,都说了些什么?
【文/观察者网周毅,编辑吕栋】
充满想象力的人类,从来都不缺乏脑洞。
(资料图片)
在一些文学和影视剧作品里,人们描绘了这样一种未来:通过克隆或者时空穿越等技术,一个人可以拥有无数个自己协助工作,实现"我和我并肩作战"的效果。这是很酷的一件事:试想一下,会有谁比"我自己"更适合协助"我"完成工作呢?
影视剧作品截图(局部)
在行业大模型加持下,这种设想在一定程度上成为了现实。
在日前召开的2023世界人工智能大会(WAIC)上,这样一种方案引起了关注:依托腾讯云数智人工厂,只需要3分钟真人口播视频、100句语音素材,就可以实时建模并生成高清人像,在24小时内制作出与真人近似的"数智人"。借助该平台,数字人制作仅需千元级别的成本和小时级的制作时长,可谓"触手可及"了。
会上,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声演讲指出,产业场景已经成为大模型的最佳练兵场,但企业在应用大模型时,又会面临计算资源少、数据质量差、投入成本高、专业经验少等现实问题的挑战。对此,腾讯云不久前公布了行业大模型技术解决方案。为客户提供MaaS一站式服务。
腾讯只是参加WAIC的互联网大厂之一,伴随着大模型爆火,百度、阿里等企业也都参展并高调发声。
例如,阿里云在会上提到,2022年该公司在国内首倡MaaS(模型即服务)理念,提出以AI模型为核心的开发范式,并搭建了一套以AI模型为核心的云计算技术和服务架构,这套能力将全部向大模型初创企业和开发者开放,提供包括模型训练、推理、部署、精调、测评、产品化落地等在内的全方位服务。
"阿里云将把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方位的服务,包括最强大的智能算力和开发工具,并在资金和商业化探索方面提供充分支持。"阿里云CTO周靖人说道。
阿里云CTO周靖人
百度首席技术官王海峰在会上指出,当前,以大语言模型为代表的人工智能技术在全球掀起科技和产业创新浪潮,加速产业升级和经济增长,各行各业都将发生巨大变化。IT技术栈发生根本性改变,从芯片、操作系统和应用三层架构,转变为芯片、框架、模型、应用四层架构。深度学习框架和大模型构成了产业智能化基座,将支撑各行各业的应用智能化重构,促进经济高质量发展。
他提到,百度自2019年3月文心大模型发布1.0版后,历经四年研发迭代,现已升级到文心大模型3.5,实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等。截至目前,百度自研的深度学习开源开放平台飞桨已凝聚750万名开发者。这也是百度2023年以来首次对外披露飞桨生态最新数据。
百度首席技术官王海峰
值得一提的是,这股AI浪潮并非只有通用大模型的"独唱",从基因上就更贴近应用场景的行业大模型也提供更多选择,它们共同带来了一场人工智能领域的协奏。行业大模型和通用大模型争鸣,成为今年世界人工智能大会的风景之一。
离产业更近一步的行业大模型,改变生产力的新变量
行业大模型,已经在改变很多行业的生产方式。
比如在短视频和直播领域,内容和产品是关键,但从业者的时间往往被其他环节占用:妆发整理、背景布置、调试灯光设备,动辄耗费数个小时;如果不小心口误或者卡壳,"重来一遍"又得耗费不少时间。这些"损耗"是否可以避免呢?
使用数智人分身,就提供了这样一种选择。它可以节约这些环节中浪费的时间。一项估算显示,如果按"妆发+调试+录制",每期平均2小时来计算,那么一年下来,数智人分身可为创作者节省800-900小时的时间。通过行业大模型的加持,它正在成为提高生产效率的一种方式。
图源腾讯云
在新技术的加持下,如今数智人的生产效率和表现力已经大大提升。例如,依托AI生成算法,腾讯数智人提升了3D形象复刻速度,结合行业大模型能力,它还可以让企业获得更"个性化、专业、自然逼真"的数智员工,让"面对面"专业服务成为可能。
在产品普及方面,行业大模型等支持力量的加入,正在不断降低其成本。借助该平台,数字人制作能实现千元级别的成本和小时级的制作时长,大幅降低数字人使用门槛。腾讯云智能以自动化的"AI+数智人工厂",通过"产、销、服"的一站式平台,为客户实现"自助式"购买、生产和应用数智人。
这只是行业大模型"垂直"应用的案例之一。在众多领域,行业大模型也能带来效率的显著提升。
例如同传。过去的同传技术,往往需要大量样本数据进行训练,尤其是涉及专业领域的翻译,还需要人工加持进行调优,才能保障翻译效果。但如今,基于行业大模型技术,不再需要百万级的训练数据,使用小样本训练便也可以获得不错的翻译结果。
行业大模型,能够为企业客户提供"量体裁衣、普惠适用"的解决方案,同时全面降低落地门槛。相比于通用大模型,行业大模型通常更接近垂直领域,应用和落地路径也更为清晰,受到不少企业的欢迎。正因如此,行业大模型也吸引了腾讯等玩家的青睐。
重塑产业,行业大模型和通用大模型"分庭抗礼"
行业大模型的火热,和大模型重塑产业的路径思考有关。
"自下往上式"的行业大模型,往往源于行业需求的复杂性和多样性。
7月7日,在接受观察者网采访时,腾讯云副总裁、腾讯云智能负责人、优图实验室负责人吴运声表示,"客服"等行业场景不是简单的问答聊天,大模型需要理解复杂的对话环境,进行多意图的识别。在交流过程中还可能涉及到意图的切换,难度是很大的。
吴运声表示,大模型虽好,但用起来还是有很高的门槛。尤其对一些传统领域企业而言,通用大模型无法精准适配、达到降本增效的预期。企业需要的,是在实际场景中真正解决某个问题,而不是在100个场景中解决了70%-80%的问题。相比之下,训练和部署专属行业大模型,让"通才"变"专才",对企业来说或许是一个可行路径,
不过,行业大模型普遍存在计算资源少、数据质量差、投入成本高、专业经验少等现实挑战。此外,安全合规也是企业需要考虑的关键因素。针对这些问题,腾讯云推出MaaS一站式行业大模型解决方案,基于腾讯云TI平台,联合金融、文旅、政务、传媒、教育等十多个行业头部客户,共同打造了超过50个行业大模型解决方案。
图源腾讯
而通用大模型"自上往下式"赋能各行各业,同样受到市场关注。
今年4月,阿里云宣布,阿里巴巴所有产品未来将接入"通义千问"大模型,进行全面改造;同月,阿里云启动"通义千问伙伴计划",推动"通义千问"大模型在油气、电力、交通、金融、酒旅、企服、通信7个不同行业的落地应用,共同打造产业生态。如今,继通义千问之后,阿里云通义大模型家族已经迎来新成员。
7月7日,在2023世界人工智能大会上,阿里云宣布AI绘画创作大模型通义万相开启定向邀测,该模型可辅助人类进行图片创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团CTO周靖人表示,这是阿里云大模型全面掌握多模态能力的关键一步,该能力将逐步向行业客户开放。
图源阿里云
作为大模型赛道的另一位头部玩家,百度选择为大模型添加插件,增强其能力边界。
今年3月,百度发布了大语言模型文心一言;在随后的文心大模型3.5版本中,百度新增了插件机制。6月17日,文心一言对外发布了官方插件百度搜索和ChatFile。借助它们,文心一言可以具备生成实时准确信息的能力,并且支持超长文本输入。
在2023世界人工智能大会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰表示,文心一言将发布更多优质的百度官方和第三方插件,让用户能够更好地应用文心大模型,同时也将逐步开放插件生态,帮助开发者基于文心大模型打造自己的应用。
"凡是要跟语言文字或程序代码打交道的应用场景,都可能有文心一言的用武之地。"
图源百度
行业大模型和通用大模型并行发展,对中国人工智能产业而言其实是一件好事。新华社评论曾指出,人工智能具有溢出带动性很强的"头雁"效应。眼下,其赋能百业的"头雁"效应正在加速显现。今年世界人工智能大会,有超过30多个大模型集体亮相,它们共同推动人工智能从感知走向认知、从识别走向生成、从专用走向通用。
工业和信息化部副部长徐晓兰表示,我国人工智能核心产业规模达到5000亿元,企业数量超过4300家,算力规模位居全球第二。同时已建成2500多个数字化车间和智能工厂,经过智能化改造,研发周期缩短约20.7%、生产效率提升约34.8%、不良品率降低约27.4%、碳排放减少约21.2%。