继Meta、谷歌、OpenAI、苹果、亚马逊接连发布人工智能进展或成果后,“AI大模型之战”迎来新的角逐者——尽管他们曾是大模型技术的“基石”,源源不断提供充沛的算力保障。但到了今天,半导体巨头们无法忽视人工智能(AI)、集成电路(IC)两大产业加速融合而带来的广阔前景与巨大收获,选择亲自下场。
在美国,以英伟达、AMD为首的主要玩家力图通过一系列举措,面向大模型“整军饬武”,备足子弹进入“AI时代”,包括但不限于——大力组建团队、扩大生态,加快人工智能技术开发步伐;对内推动人工智能技术在生产环节落地,提高生产效率及创新能力。
“无并购不AI”,美国半导体巨头早筹谋
调研机构TechInsights在今年4月公布2023年全球排名前25名的半导体供应商,台积电、英特尔、三星、英伟达、高通进入前五。这份25强的榜单中,13家供应商总部设在美国,英特尔(2)、英伟达(4)、高通(5)、博通(6)、AMD(8)进入“TOP10”。参考该榜单不难发现,不在少数的美国半导体企业早已围绕AI或者大模型布局。
当地时间1月4日,英特尔和投资公司DigitalBridge宣布成立一家名为Articul8 AI的生成式AI软件公司,旨在为企业客户提供全栈、垂直优化且安全的生成式人工智能(GenAI)软件平台。原英特尔数据中心和人工智能事业部副总裁兼总经理Arun Subramaniyan出任Articul8 AI首席执行官。此外,英特尔机器学习部门首席工程师Moty Fania曾撰文称:“英特尔IT部门拥有超200人规模的AI团队,包括数据科学家、机器学习 (ML) 工程师和AI产品专家。”
2月,英伟达成立通用具身智能体研究GEAR团队,推动大模型等AI技术由虚拟世界向现实世界发展,未来该团队研究工作将主要围绕“多模态基础模型、通用型机器人研究、虚拟世界中的基础智能体、模拟与合成数据技术”四个关键领域开展。
3月,新思科技宣布与英伟达合作,将其领先的AI驱动型电子设计自动化(EDA)全套技术栈部署于英伟达GH200 Grace Hopper超级芯片平台。这一合作将在集成电路设计、验证、仿真及制造各环节实现最高15倍的效能提升。
新思科技称,将致力于扩展其大语言模型(LLM)Synopsys.ai Copilot(业界首个生成式AI助手),支持英伟达AI和计算平台。除组建团队、加强合作外,并购AI公司也是美国半导体企业进军AI领域的关键动作,甚至称得上“无并购不AI”。
AMD被认为是英伟达在快速增长的AI硬件市场上最有可能的竞争对手,其对人工智能团队寄予厚望,正不断增强实力。当地时间7月10日,AMD同意以6.65亿美元现金收购人工智能模型开发商Silo AI。公开资料显示,Silo AI总部位于芬兰赫尔辛基,自称是欧洲最大的私营人工智能实验室,拥有300名AI科学家和工程师,专注于提供定制化AI模型和端到端的AI驱动解决方案。
收购后,Silo AI联合创始人兼首席执行官Peter Sarlin将继续领导团队,成为AMD人工智能集团的一部分,并向AMD高级副总裁Vamsi Boppana汇报。官网显示,Vamsi Boppana负责AMD人工智能事业部,领导AMD的AI战略,在客户端、边缘和云端推进AI路线图。同时,他还是赛灵思(Xilinx)并入AMD的执行发起人。
AI并购“阵营”中,博通不惜耗时18个月,在去年11月将VMware(威睿)揽入囊中,进一步强化AI能力;美光则在2019年10月收购人工智能硬件和软件初创公司FWDNXT,后者在与美光存储芯片结合使用时,将使美光具备探索数据分析所需的深度学习AI解决方案的能力。
AI大模型向内,大厂打造“淘金”利器
十九世纪中期,美国曾掀起过一场轰轰烈烈的“淘金热”,赚钱最多的却并非淘金人,而是那些工具提供者。今天,英伟达在内的美国半导体公司大举进军人工智能/大模型,绝非心血来潮,更像是在AI、IC加速融合背景下,打造半导体“淘金”利器。
人工智能率先进入半导体产业链的各个重要环节,在芯片布局、架构优化、能效管理、故障检测等方方面面发挥作用。
设计环节,英伟达研究团队开发了名为ChipNeMo的定制大模型,以内部数据为基础进行训练,用于生成和优化软件。英伟达首席科学家Bill Dally认为:“即使只将生产力提高5%,也是一个巨大的胜利。而ChipNeMo便是大模型在复杂的半导体设计领域,迈出了重要的第一步。”他们相信,随着时间推移,大型语言模型将全面帮助全部流程。
英特尔也在今年4月宣布,自研的AI工具将耗时数周的芯片设计周期缩短至几个小时。
制造环节,美光部署了57万个IoT感测器在全球工厂中,能存取超2.29亿个资料控制点(control points)。
这些年来,美光在全球工厂累积34 PB的资料,成为美光用来发展大数据分析与AI应用的关键数据,并以每天新增30TB的速度持续增长,美光正通过大数据、AI技术大幅提升生产效率和良率。
检测环节,半导体设备供应商应用材料(Applied Materials)将人工智能融入晶圆检测流程,从2016年开始就使用ExtractAI技术开发Enlight系统,在2020年推出新一代Enlight光学半导体晶圆检测机,引入大数据和AI技术,不到一个小时就可绘制出晶圆上数百万个潜在缺陷。
其次,整合技术优势、打造AI生态,也是部分半导体大厂扩充AI团队的出发点之一。
以收购Silo AI为例,AMD高级副总裁Vamsi Boppana认为:“Silo AI拥有值得信赖的人工智能专家团队,在开发领先的人工智能模型和解决方案(包括在AMD平台上构建的最先进的大语言模型)方面拥有成熟的经验,这将进一步加快我们的人工智能战略。”
有网友更加直接地指出,不知道AMD对这次收购有何打算,但可以看到拥有一个内部的大模型团队为客户创建模型、进行基准测试并改进产品可能带来很大的价值。
Silo AI只是AMD布局AI战略而进行的一系列收购和企业投资中的一个缩影。事实上,在过去的12个月里,AMD至少向十几家AI公司投资超1.25亿美元,相继收购AI软件公司Mipsology和Nod.ai——前者创建了名为Zebra的抽象层,可将为CPU和GPU编译的推理模型在FPGA上运行,后者创建了名为Shark的抽象层,可提高不同硬件上AI模型的推理性能。AMD种种举动,显然是要缩小同英伟达在AI技术方面的差距,以满足其日益增长的打造“AI帝国”的雄心。
“IC+AI”,加速融合双向奔赴
人工智能正对各行各业施加影响。高盛预测,生成式人工智能的突破有可能给全球经济带来翻天覆地的变化。随着使用自然语言处理的工具进入企业和社会,它们可以推动全球GDP增长7%(或近7万亿美元),并在10年内将生产率提高1.5个百分点。
云天励飞技术负责人指出,如果说去年是大模型的元年,那么今年就是大模型应用落地元年。未来半导体厂商一定会主动拥抱人工智能,这是一个双向奔赴过程。
在此背景下,也就不难理解美国半导体公司布局人工智能团队,尤其为组建大模型团队所做出的努力。当前,美国半导体公司AI举措大致分为三类:其一,以积极的投资计划,孵化、整合、并购AI初创企业,壮大实力;其二,与业内企业形成战略合作,推动AI战略;其三,在公司内部专门组建或设立AI团队/实验室。
业内人士陈明(化名)举例表示,英伟达、AMD芯片本身是大模型训练中必不可少的算力基础,它们组建/投资大模型团队,本身有拓展业务,实现产业链上下游延伸的考量。“但对于国内半导体企业而言,由于发展阶段和发展体量都还没有办法与国外巨头抗衡,尚处在‘生存期’,很难有多余的精力和资金去做更丰富的探索。”陈明说。
的确如此。目前活跃在人工智能/大模型一线的科技企业中,仍以手机大厂、互联网巨头、通信厂商、AI新贵为主。4月2日,国家互联网信息办公室发布《生成式人工智能服务已备案信息》,文心一言、智谱清言、Moonshot、云天天书大模型等117个大模型在列,备案单位包括百度、智谱华章、月之暗面、云天励飞、商汤、科大讯飞、字节跳动等,当中鲜见半导体公司。
有观点认为,大模型研发高昂、投入巨大,需要一定实力才能参与其中;另一方面,半导体公司研发大模型,组建人工智能团队,还存在到底要干什么,以及如何与自身业务相结合的问题。
我国某EDA企业负责人透露,从今年的DESIGNCON(美国圣克拉拉国际电子展)和DAC(美国自动化展)了解到,即使国际头部EDA企业在AI方面做的工作都还很有限,真正落地的应用几乎没有看到。
在全球半导体行业相对低迷阶段,结合我国半导体行业发展现状,有实力的半导体公司组建人工智能团队,甚至以收购、重组等方式吸收先进技术的动作值得鼓励,甚至可以从美国半导体企业举措中汲取经验和启示。但客观而言,中美两国半导体产业发展阶段不同,不能完全照搬,需要根据实际情况作相应调整。
“从大模型发展看,其属于算法层面的创新。无论是国内还是国外,大模型目前都还是由新兴的算法公司,或者是传统的人工智能软件巨头引领。未来,到了大模型应用落地阶段,大模型需要通过芯片赋能千行百业,两者结合是一个趋势。随着大模型应用越来越深入,未来可能也会有芯片厂商去研发大模型。 ”陈明判断。