V基金会如何支持HPC和AI领域的公司?

文章正文
发布时间:2024-11-03 02:42

在北美RISC-V峰会上,RISC-V International的首席执行官Calista Redmond在演讲中表示,2024年,使用RISC-V内核的SoC数量将达到20亿,到2031年这个数字将增长到200亿。随后登台的NVIDIA多媒体架构副总裁Frans Sijstermans在演讲中表示,NVIDIA很可能在2024年出货超过10亿台使用RISC-V内核的设备。

RISC-V ISA(Instruction Set Architecture,指令集架构)的核心价值在于它提供的使用自由度,任何组织都可以利用ISA设计最适合其特定需求的核心,没有地区限制或许可成本。倪光南院士曾称RISC-V不受垄断制约,是中国最受欢迎CPU架构。

近日,海外科技媒体TechPowerUp对RISC-V International的技术VP Andrea Gallo进行专访,就RISC-V生态系统碎片化、高性能计算领域、移动行业、AI和RISC-V面临的难题等话题进行交流。

Andrea于今年6月份加入RISC-V International,负责RISC-V International的技术进步以及全球影响力的建立。在加入RISC-V International之前,Andrea曾供职于由ARM公司发起的开源组织Linaro以及STMicroelectronics,分别担任VP以及设计组组长,具备扎实的产业经验。

RISC-V基金会如何支持HPC和AI领域的公司?

来源:RISC-V International官网

以下为TechPowerUp与Andrea Gallo的对话内容:

提问:RISC-V基金会如何支持高性能计算领域的公司?

Andrea:在高性能计算领域,有两方面需要增强:性能和安

性能方面:我们已经批准了矢量扩展,并正在定义矩阵扩展,旨在提高性能。

在安全方面:我们最近批准了与控制流完整性有关的重要扩展。这些功能可确保在函数调用时,返回地址保持完好无损。我们还批准了指针掩码,这是向内存标记迈出的关键的第一步,在进程地址空间内屏蔽的地址位以后可以支持内存标记。此外,我们还在研究主管域访问保护(SMMTT)。

总之,这些努力将增强高性能计算和数据中心的性能和安全性。

提问: 我们看到移动设备计算能力正在大幅提升,RISC-V基金会希望如何融入其中?是推动更高性能的设计、更高效的设计,还是其他?

Andrea:在GitHub上有一个Android特别兴趣小组(SIG)和一个Android RISC-V 64项目,围绕RISC-V支持Android开展大量活动。现在市场上新的芯片都支持RVV 1.0向量扩展。我们也开始看到使用这些向量扩展的开发板,如Banana Pi和Deep Computing DC-Roma II笔记本电脑。从开发人员的角度来看,这一点非常有价值,因为在目标平台上进行原生开发至关重要。

还有与高性能计算领域类似的性能计划,重点关注矢量扩展并提供商业开发平台。此外,我们还有一个开发板计划,对采用最新芯片和扩展的新开发板进行审查,确保它们具有最佳性能和安全扩展。我们储备这些开发板,并将其提供给生态系统中主要的维护者和开发者,确保操作系统发行版得到移植和测试。

今年我们已经向关键维护者提供了 200 多块板卡。任何关键维护者需要板卡都可以通过 help@riscv.org 联系我们,以获得支持。

提问:当前的技术热潮实际上是人工智能,有一些加速器是专门为加速人工智能而开发的。这包括矩阵乘法、累加和所有这些特定的东西。有一些公司,比如Esperanto AI和Tenstorrent,正在做基于RISC-V的加速器。未来我们是否有可能看到人工智能特定指令的扩展?

Andrea:不仅仅是Esperanto和Tenstorrent,Axelera、NVIDIA和Meta都公开表示他们正在使用RISC-V。NVIDIA将RISC-V集成到他们的GPU中,Meta在他们的AI加速器中使用它。所以,RISC-V无处不在AI中。

说到定制指令,我们有一个AI/ML 特别兴趣小组。这个小组的工作是分析特定领域,找出差距,突出产品机会,并为新的开发工作提供合理依据。

当我们批准一个新的扩展时,我们知道市场需要这样的产品。例如,Linux中的开源开发。除非有明确的需求,否则子系统维护者或高级架构维护者不会接受新代码、子系统或贡献。每次增加扩展都会增加你的拥有成本,以及从一个版本到下一个版本的负担。同样的原则也适用于RISC-V ISA。特别兴趣小组分析差距,确定解决方案。就AI/ML而言,我们列出的所有公司都有能力提出具体的新指令。

扩展批准的规范过程非常严格。最近批准的BFloat16就反映了AI/ML对浮点格式的需求。而围绕矩阵扩展正在进行的工作实际上是由机器学习算法驱动。

提问:这些特别兴趣小组(SIG)批准ISA扩展规范的速度有多快?

Andrea:速度取决于提案的复杂程度。如果是重要程度较低的内容,可以走快速通道,可能需要几个月的时间。如果是重要的规范,则应通过所有流程,并有特定的审查窗口,这可能需要六个月或更长时间。所以,时间的长短主要取决于复杂程度。

对于RISC-V,有一个普遍的误解,那就是每个人添加新的自定义指令会造成巨大的碎片化。根据我的体验,我是六月底加入RISC-V International的。第一天参加的是欧洲峰会。审查过程的严谨性和彻底性给我留下了深刻印象。编写规范的工作组会对规范进行审核,之后有一个架构审查委员会,然后是一个月的公开审查。最后,是技术指导委员会进行审查,所有委员会主席和董事会都会进行审查。有一个严格的过程,避免不必要的分散。

提问:前面简短地谈到了每个人都在执行自己的定制指令。举例来说,如果我们想构建一个 RISC-V加速器,我们可以使用基础ISA,然后添加我们的特定应用指令集来加速人工智能程序。这些自定义扩展功能的存在对生态系统造成巨大的碎片化。RISC-V International如何解决这个问题?

Andrea:我前面提到了编写、修正和扩展新规范过程的严谨性。如果你想声称自己兼容RISC-V,那么就需要一个架构兼容性测试套件来验证你是否符合ISA。我们在黄金参考模型上运行相同的测试,并比较测试特征值,以确保与规范保持一致。

防止碎片化的下一步是在软件移植层面。在嵌入式系统中,供应商或设备制造商可能采用垂直集成的软件方法,以著名的 “意大利面条代码 ”(一种编程术语,指的是结构混乱、难以理解和维护的代码)工作方式控制整个垂直软件栈。然而,现代应用处理器需要运行二进制操作系统发行版,而无需进行更改。因此,如果一个操作系统供应商只针对跨产品的最小兼容性,那么它将是最基本的RV64I 或RV64G,这只是一个很小的子集。为了解决这个问题,我们正在开发配置文件。

我们有大量按配置文件分组的扩展。具体来说,我们有一个应用处理器配置文件,我们会升级这些配置文件规范,这是一组强制扩展和一些可选扩展。我们刚刚批准了RVA23配置文件,新批准的RVA23 Profile是RISC-V软件生态系统的一个重要版本,将有助于加快工具链和操作系统的广泛实施。

再下一步是平台。为了进一步改善和加速跨垂直领域或同一垂直领域内跨产品的软件重用,作为一个生态系统,我们正在商定一套硬件和软件接口,这些接口将是相同的,也是平台规范的一部分。有一个团队正在开发服务器 SOC和服务器平台。包括为定时器、时钟、IOMMU、RAS和相关错误报告机制提供相同的接口。我们应该为特定的外围设备使用相同的接口,例如服务器平台的一部分。

提问: 为什么需要另一个商业指令集?RISC-V International会比Arm和现在的x86等竞争者做得更好的是什么?

Andrea:我想从两个不同的角度来回答这个问题:创新和不受约束

RISC-V生态系统的创新速度、能量和步伐令人难以置信。任何人都可以从RISC-V网站上的培训课程开始,学习如何开发RISC-V内核和添加自定义扩展。从开发人员的角度来看,能够从零开始开发RISC-V内核具有巨大的价值。与此同时,作为RISC-V ISA的管理者,我们还能将其注入新的标准中。所有这些都是其他架构无法实现的。作为市场竞争对手的公司在RISC-V国际会议上为实现共同目标而合作,我们有超过4500名成员,这在其他地方是看不到的。

另一个非常重要的方面是不受约束。这不仅仅是授权模式或版税的问题,而是能否掌控自己的命运,而不依赖于可能突然停止支持你的另一个实体。如今,这可能是一个国家安全问题。现阶段,许多国家和政府都从数字主权的角度投资RISC-V。前面我们提到了人工智能,人工智能在我们的生活中正变得至关重要,各国都在为数字主权进行投资,以确保在能力、专业知识以及知识产权方面建立起开发本国人工智能解决方案的能力。

我们在全球都看到了这种势头。欧盟正在资助合作项目,开发基于RISC-V的软件定义汽车。中国有广为人知 “一生一芯 ”计划,由北京开源芯片研究院和中科院牵头。他们有数以千计的学生基于RISC-V设计芯片,其中有十多个已经成型并投入使用。几个月前,巴西加入了 RISC-V 国际组织,成为其成员,因为他们希望在巴西发展和加速基于RISC-V的项目。当然,加州大学伯克利分校也继续在学术研究方面发挥作用。世界各地的大学、政府和跨国公司正在掌握自己的命运,投资RISC-V以解决本地问题,同时在全球范围内参与RISC-V生态系统。

提问:你的意思是RISC-V成功的两条道路是:首先,向开发人员提供硬件,让他们学习 RISC-V,这将帮助他们成为熟练的工程师,最终可能在开发RISC-V软件和硬件的公司工作。第二条路径就是亲自推动这一进程,对吗?

Andrea: 是的,包括学生、学术界、初创企业、跨国公司和国家。

提问:您认为RISC-V在未来10年的发展前景如何?

Andrea:回顾过去,RISC-V从加州大学伯克利分校的一个学术项目发展到今天的规模,这是一段不可思议的历程。2023年生态系统的整体业务量比2022年增长了2.5倍。据SHD Group预测,到2030年,RISC-V将在消费、计算机、汽车到数据中心和工业等垂直行业占据市场约30%的市场份额,每年基于RISC-V的SoC出货量将超过 200 亿颗。我们不再计算内核,而是计算芯片,每个芯片包括很多很多内核。10年后,我希望看到 RISC-V 成为每个新产品设计的首选ISA。

本文由雷峰网(公众号:雷峰网)编译自:Interview with RISC-V International: High-Performance Chips, AI, Ecosystem Fragmentation, and The Future | TechPowerUp


雷峰网原创文章,未经授权禁止转载。详情见转载须知。