- AI商业进化论:“人工智能+”赋能新质生产力发展
- 田丰
- 1839字
- 2025-05-19 16:21:28
序言二
中国AI的“换道赛车”
在我国“AI+”的创新发展道路上,关键在于处理好三对发展关系,即大模型知识能力与推理能力的关系、基础大模型与行业大模型的关系、基础设施建设与下游应用生态的关系。
首先,事实性的知识仅能解决大模型对客观世界知识的通识认知,高质量的思维模式数据才能激活大模型的强理解、强推理能力。从2023年开始,原生多模态大模型就逐渐成为业内探讨的重要方向。然而由于数据和训练方法的局限,业内许多机构的尝试并不成功——多模态训练过程往往会导致纯语言任务,尤其是指令跟随和推理任务的性能严重下降。得益于在计算机视觉领域十年深耕及人工智能赋能场景的丰富经验,商汤在推动语言模型和多模态模型融合的过程中,发展出两项关键的创新技术:融合模态数据合成与融合任务增强训练,进而完成“日日新”融合大模型的训练,推向市场。
在预训练阶段,通过大量天然图文交错数据及逆渲染、混合语义图像生成等技术,商汤构建了海量高质量融合模态数据,建立起跨模态交互桥梁,为跨模态任务奠定扎实基础。在后训练阶段,商汤基于丰富的业务场景,设计了视频交互、多模态文档分析、城市场景理解、车载场景等任务,激发模型对多模态信息的深度理解与场景响应能力,形成应用落地反哺基础模型迭代的闭环。可以说,具有高可靠性、高精准性的高阶推理能力是大模型发展的“工业红线”拐点,而原生融合模态的实现将显著提升模型的深度推理能力与多模态信息处理能力,使AI广泛与各行各业新质生产力融合共治,对我国创新发展的价值巨大。
其次,行业大模型将成为基础大模型的“老师”,帮助其掌握高阶思维逻辑、专业知识,拥有更强的推理、执行能力。基础大模型的优势在于“背”海量知识,这些知识达到大众常识性认知的平均水平。然而,若提供甲骨文等小众内容,基础大模型就看不懂了。行业大模型,如商汤“日日新·大医”医学大模型,就在医学知识、生物知识等领域比基础大模型具有显著的专业优势。基础大模型的下一步发展,将依托众多行业大模型逐步提升其专业知识与能力,而行业大模型的专业性则来源于千行百业极为丰富的场景与数据资源。
从商业的视角思考,如今大模型开源已成为行业发展的一个重要前提,开源模型的性能增长线如今已经接近甚至追平闭源模型。为此,如果行业开源模型投入的平均水平较高,而企业在闭源模型上的投入相对有限,则企业必须走差异化路线——以行业应用的垂直领域为切入点,通过差异化模型为行业提供独特价值。
2018年,我曾推荐过一本书——Prediction Machines,书中提出一个有趣的观点:当生产要素的成本下降至原来的百分之一时,会迎来时代的转折点。例如,电力成本下降至原来的百分之一,开启了电气时代;通信成本下降至原来的百分之一,推动了移动互联网时代。那么,若算力成本下降至原来的百分之一,我们将进入怎样的时代?回顾历次时代变革,基础设施的发展始终为行业向前迈进提供了核心支撑。在AI 1.0时代,中国得以同步推动ImageNet时刻的行业落地,正是得益于早期基础设施建设的完善。例如,在视觉相关的工作中,中国拥有充足的摄像头数量,以及数字化储备与通信连接,这些因素为我国在数字化转型中带来了显著的先发优势。
这引出2.0时代的一个核心命题:当前AI的发展高度依赖计算基础设施的建设,那么2.0时代的基础设施应如何构建?如何确保其真正能够为大众所用?未来,中国的AI行业应用需要实现一个重要目标,即计算资源平权,即使用模型需要的计算资源必须具有高性价比,才能推动行业的百花齐放。
值得注意的是,AI算力的突破并非仅限于芯片。事实上,芯片的核心是支撑软件开发,算力的关键在于推动模型优化。新的混合专家(Mixture of Experts,MoE)架构模型在推理效率上展现了差异化能力。如何通过应用驱动模型,以模型带动算力的升级,并最终提升算力资源的使用效率,这种“三位一体”的模式正是商汤科技在算力、模型与应用层面的思考方向。面向AI 2.0时代,商汤致力于成为最懂算力的大模型服务商和最懂大模型的算力服务商。
AI基础设施的建设正以更高效、更普惠的方式推动社会进步。伴随着大众对AI的认知突飞猛进,AI应用的突破几乎只差“临门一脚”。同时,通过不断突破技术与认知的边界,AI将助力人类探索更多未知的可能性。
从长期来看,我国的优势在于领先于其他国家2~3个数量级的巨大产业场景。当今大模型的竞争中,中国与其依靠芯片优势逼近尺度定律下大模型效果的理论边界,不如依靠科学技术与场景叠加形成比较优势。国产大模型在“场景赛道”另辟蹊径,很有希望争得“AI+新质生产力”的国际领先生态位!
商汤科技董事长兼首席执行官
2025年3月