微软的人工智能转型:从软件巨头到AI弄潮儿-市场参考-晟峰科技数据
人工智能领域有史以来最剧烈的人事"地震",继续以戏剧性的结局震惊科技界:微软(MSFT.O)CEO宣布,OpenAI创始人Sam Altman和Brockman将加入微软,领导新的人工智能团队。
此前焦点都集中在Altman能否重回OpenAI的CEO之位,很少有人预测到这样的结局。但是,仔细一想后,好像大家都会点点头,觉得"理所当然"、"早就知道"……毕竟微软早就在人工智能方面制定了长期策略,旨在引领人工智能革命,维持业内的主导地位。
在年度Ignite 2023大会上,微软公布了其端到端AI堆栈的全面愿景,展示了从云基础设施到AI驱动的应用程序和安全措施方面的创新。
对于微软及其生态系统来说,今年的Ignite大会特别不同寻常。以往,Ignite是一个通常专注于基础设施和运营的会议,而微软的旗舰活动Build通常面向开发人员受众。
然而,今年,针对开发人员和机器学习工程师的生成式AI的发布成为了Ignite 2023的焦点。它不仅限于开发人员或IT专业人员,成为了整个微软生态系统的分水岭时刻。
微软希望成为人工智能生态系统的主力军,微软首席执行官兼董事长萨蒂亚·纳德拉(Satya Nadella)在主题演讲中明确表达了这一点。从开发自己的人工智能加速器芯片到推出copilots助手,微软已经准备好了其长期战略。
那么,微软是如何利用人工智能来保持其行业领导地位的?
Azure是新的人工智能操作系统,Copilots是新的应用程序
微软在构建平台方面拥有极其成功的经验。最早的平台是在Windows上构建的,开发人员利用OLE和COM通过Visual Basic构建应用程序。Microsoft.NET和Visual Studio于2000年代初发布,促成了一个新平台的创建,重新点燃了开发人员创建Web服务的兴趣。近十年来,微软成功推出了另一个平台Azure。
当微软创建一个平台时,它会带来一个由独立软件供应商和解决方案提供商组成的新生态系统,帮助企业利用它。微软Windows、Office、Visual Studio和最近的Azure的成功就证明了这一点。
微软希望通过人工智能再次创造一个全新平台的魔力,从而形成一个由开发者、独立软件供应商、系统集成商、企业和消费者组成的蓬勃发展的生态系统。
本季度,Azure成为操作系统,,而应用程序则是微软称之copilots的人工智能助手。因此,Azure是新的Windows,copilots是新的应用程序。
GPT-4等基础模型构成了这个新操作系统的内核。与Visual Studio类似,微软也投资了一套AI Studio和Copilot Studio形式的开发者工具。该堆栈与Windows、.NET和Visual Studio非常相似,它们主导了开发者领域数十年。
微软的做法清楚地表明了一种紧迫感。考虑到当前的市场动态以及从围绕移动平台建立生态系统的失败尝试中吸取的教训,这一点是显而易见的。纳德拉非常致力于让生成式AI的功能更贴近客户,以确保微软成为人工智能的先驱公司。他不希望公司错过技术领域的下一个重大事件,就像他们在搜索和移动领域所经历的挫败。
在短短几个月内,该公司为其产品提供了多种copilots,从Bing搜索引擎到微软365再到Windows操作系统。它还为Edge浏览器添加了各种功能,增强了用户体验。近几个月来,微软拥抱生成式人工智能的速度令人震惊,使其成为领先的人工智能平台公司之一。
微软投资开发自己的CPU、GPU和DPU
几十年来,CPU为软件架构制定了规则并塑造了其发展。现在,人工智能软件正在塑造芯片的发展,催生专用处理器。微软已经正式宣布将开始制造自己的芯片和处理器,包括CPU、人工智能加速器和数据处理单元。
先从CPU开始说起,Azure Cobalt是微软自己的CPU,基于Arm架构,可实现最佳性能和瓦特效率,并为常见的Azure云工作负载提供支持。
该系列的第一代Cobalt 100是一款64位128核芯片,与当前几代Azure Arm芯片相比,性能提升高达40%,并为微软Teams和Azure SQL等服务提供支持。继从AmpereComputing购买的第一款基于Arm的CPU Neoverse N1之后,Cobalt 100成为Azure上提供的第二款基于Arm的处理器。
然后是Azure Maia,这是一系列定制AI加速器中的第一个,旨在为OpenAI模型、Bing、GitHub Copilot和ChatGPT等AI工作负载运行基于云的训练和推理。
Maia 100拥有1050亿个晶体管,是该系列的第一代产品,也是采用5nm工艺技术的最大芯片之一。它在芯片、软件、网络、机架和冷却领域具有众多创新。新的AI加速器通过优化Azure AI的端到端系统来运行GPT等最先进的基础模型,成为GPU的替代品。
最后,微软自己的DPU Azure Boost正式上市。微软今年早些时候收购了DPU公司Fungible,以提高Azure数据中心的效率。虚拟化、网络管理、存储管理和安全等软件功能通过Azure Boost卸载到专用硬件,从而使CPU将更多周期用于工作负载而不是系统管理。由于繁重的工作转移到了专用处理器上,因此这种负担卸载可以显着提高云基础设施的性能。
除了将自己的芯片引入其中之外,微软还与AMD、英特尔和英伟达合作,将最新的CPU和GPU引入Azure。到明年,它将配备最新的英伟达H200 Tensor Core GPU,以运行更大的基础模型并减少延迟。AMD的全新MI300加速器也将于明年初在Azure上提供。
通过自主开发减少对OpenAI的依赖
虽然Azure仍然是企业在基于OpenAI的模型上运行推理的首选平台,但微软正在投资训练自己的基础模型,以补充Azure OpenAI和Azure ML中可用的现有模型。
Phi-1-5和Phi-2是小型语言模型,它们是轻量级的,与传统的大型语言模型相比,需要更少的资源。Phi-1-5有13亿个参数,而Phi-2有27亿个参数,与Llama 2相比要小得多,后者从70亿个参数开始,一直到700亿个参数。
这些小型语言模型非常适合嵌入到Windows中,以提供本地copilots体验,而无需往返于云。微软将发布Visual Studio Code的扩展,允许开发人员在云中微调这些模型并将其部署在本地以进行离线推理。
微软Research还开发了Florence,这是一个为Azure认知服务带来多模式功能的基础模型。该模型允许用户分析和理解图像、视频和语言,为构建计算机视觉应用程序提供可定制的选项。此模型已在Azure中可用。
Azure ML(微软的ML PaaS)提供模型即服务,可以将基础模型作为API来使用,而无需配置GPU基础设施。这大大简化了人工智能与现代应用程序的集成。
Azure OpenAI和Azure模型目录的结合为客户提供了最全面、最广泛的基础模型,这成为Azure的关键差异化因素。
微软Graph和Fabric是数据平台的核心
人工智能需要大量数据进行预训练、微调和检索。微软Fabric和微软Graph是为微软的生成式AI工作做出重大贡献的两个关键产品。
微软Fabric是在微软Build 2023上发布的,是微软数据产品线的重要补充。Satya通过将其与SQL Server的发布进行比较来强调其重要性,这意味着微软数据管理和分析策略的根本性转变。
在Ignite 2023大会上,微软宣布全面推出Fabric。它包括一个名为OneLake的组件,一个变革性的数据Lakehouse平台。
OneLake集成到Azure机器学习和Azure AI Studio中,Azure机器学习数据管理功能大大增强。该平台旨在以统一、高效的方式处理大型且多样化的数据集,优化人工智能应用程序的数据存储和检索。
它与Azure AI平台的集成对于需要大量数据处理和复杂计算任务的场景尤其重要,这在高级AI和机器学习项目中很常见。OneLake的有趣之处在于快捷方式的概念,它将来自外部源(包括Amazon S3和Databricks)的数据引入Fabric中。
微软Graph是微软武器库中的强大工具,在AI copilots领域发挥着关键作用。它已成为开发AI copilots的关键,提供统一的API来访问微软365服务中的各种数据。
微软Graph使copilots能够通过聚合来自电子邮件、日历事件和团队交互的数据来提供个性化帮助。这种集成方法确保了对用户专业环境的上下文理解,这对于提出智能建议至关重要。微软Graph支持实时数据访问,这对于copilots的及时响应至关重要。它符合微软365的安全标准,可确保敏感数据的安全处理。
微软Fabric和微软Graph成为基于API提供的实时数据构建copilots的基础。
总体而言,微软在Ignite 2023上的战略明确表明,其重点是引领人工智能革命,利用其平台传统并在硬件和软件方面进行创新,以保持行业主导地位。