本篇文章3153字,读完约8分钟

在2016年初于北京亦庄举行的“高性能异构计算与网络安全研讨会”上,华夏核心(北京)通用处理器技术有限公司即将推出全球首款完全支持异构系统架构(hsa)的处理器。

让我们先看看媒体怎么说(因为篇幅长,为了阅读方便,笔者将摘录要点供参考)

据《中国电子报》报道,“处理器ip核和生态系统的解决方案将使中国的独立处理器行业在下一代异构计算时代实现更快的发展,赶上国际先进水平。”摘录如下:

1.华夏核心的突破标志着中国在新一代异构计算领域取得了巨大进步,有望打破原本相对空·怀特的处理器ip(知识产权)核授权领域的外国垄断,彻底改变中国处理器行业核心知识产权基本依赖外国许可的被动局面。

2.从软件的角度来看,应用程序开发将变得容易,任何程序都不需要考虑不同处理器内核之间的存储差异。这将彻底改变计算性能。

3.它是世界上第一个完全支持hsa标准的cpu+gpu+dsp的ip核心平台。从指令集、微体系结构到工具链,它拥有完全独立的知识产权。同时,华夏核心还可以提供定制的soc设计服务。这将有效改善国内ip核设计和许可的不足。

那么,什么是异构系统架构?《中国电子新闻》的报道中有多少真实的材料,有多少水?

异构计算主要指使用不同类型指令集(x86、arm、mips、power)的计算模式...)和架构的计算单元(cpu、gpu、dsp、asic、fpga...)来形成一个系统。

例如,amd的apu实际上属于异构计算。

[编者按:amd,即超微半导体公司。Amd专业设计和制造各种创新的微处理器(cpu、gpu、apu、主板芯片组、电视卡芯片等)。),用于计算机、通信和消费电子行业的闪存和低功耗处理器解决方案。AMD是业内唯一能提供三个组件的半导体公司:cpu、gpu和主板芯片组。】

异构计算的主要优势是:

首先,每个计算单元都可以执行其最佳任务。这个行业有其特殊性,每个计算单元如中央处理器、图形处理器、数字信号处理器和现场可编程门阵列都有自己的优势。通过引入特定的计算单元并将计算系统转变为混合结构,cpu、gpu、dsp和fpga可以执行它们的最佳任务,并且与同构计算相比可能具有某些性能优势或性能功率比优势。

中国芯威武!搞定全球首款异构运算处理器

其次,可以避免显式复制。最新的异构计算理论要求cpu、gpu、dsp和其他计算单元实现统一的内存寻址,这样cpu、gpu和其他计算单元就可以共享内存,而无需将一份数据拷贝到彼此的内存区域。

异构计算不是一个新概念。amd、arm等公司已经建立了hsa基金会。此外,异构计算已经在超级计算领域得到应用,并且有取代同构计算的趋势。

例如,美国泰坦(每个计算节点由一个amd皓龙6274处理器和一个nvidia tesla k20加速器组成)和中国天河二号(每个计算节点由两个e5和三个至强融核组成)。中国正在升级或建造的三台100p超级计算机也采用了异构计算。

与上面提到的Titan和天河二号相比,由于cpu和加速器不能共享内存,所以需要显式复制会造成性能损失。最新的异构系统架构的优势在于,它可以被开发成统一的内存编程——理论上,它可以为cpu、gpu、dsp和其他计算单元实现统一的内存寻址,因此当每个计算单元交换数据时,不再需要将自己的内存区域中的现有数据拷贝到另一个的内存区域,而是可以通过相同的地址直接访问它。

中国芯威武!搞定全球首款异构运算处理器

此外,在编程中,可以避免显式复制,使得程序员不必干预不同计算单元的内存管理,并且可以有效地降低编程的复杂度。

当然,理想是满的,而现实是非常狭窄的——不同内核与直接高速缓存级别的相互通信一直是hsa架构无法克服的困难——尽管amd的apu通过将cpu和gpu集成到一个芯片中来实现共享内存。然而,cpu和gpu的缓存还没有统一,不同的内核直接在缓存层进行通信,这是hsa架构(cpu、gpu和dsp的不同缓存模型)的最大技术难点。尽管amd和其他制造商已经为hsa绘制了一幅非常漂亮的蓝图,但在现阶段,hsa的优势并不大。

中国芯威武!搞定全球首款异构运算处理器

华夏核心的技术是什么?

华夏核心可能无法实现缓存级的互操作性。

在hsa方面,amd显然是最有影响力的厂商之一,但其apu只实现了cpu+gpu和内存共享,而cpu和gpu的缓存还没有统一,华夏Core则坚持:“该产品在架构层面上成功地集成了cpu、gpu和dsp,实现了异构多核的统一寻址,使不同的内核无缝连接在一起。”一个初出茅庐的公司的技术水平已经超过了像amd这样的成熟的集成电路设计公司,这真是令人难以置信。我想知道当他看到这一段时是什么感觉。

中国芯威武!搞定全球首款异构运算处理器

华夏核心所谓的“自主知识产权”有水分

据《中国电子报》报道,“华夏核心正在开发和即将推出的统一处理器平台,是世界上第一个完全支持hsa标准cpu+gpu+dsp的处理器ip核心平台。它拥有从指令集、微体系结构到工具链的完全独立的知识产权。”这篇文章所包含的信息实在令人难以置信。

虽然国内集成电路设计制造商已经推出了许多产品,但大多数都是购买国外的ip核心许可证或国外芯片。很少有单元能够独立设计cpu、gpu或dsp,更不用说同时具备这三者的设计能力了。

因此,我不相信一个以前从未听说过它,也没有积累技术的制造商会横空出世空,突然同时拥有cpu、gpu和dsp的设计能力。

虽然实现独立指令集并不困难,比如深圳中伟电就采用了独立指令集,但是由于不可能与现有的软件生态兼容,所以商业化基本上没有市场前景。在党政军市场已经被龙芯、神威、腾飞等独立芯片瓜分,武器装备、卫星、航天设备等特殊领域的嵌入式芯片已经“抢占”的情况下,采用独立指令集在党政军市场既没有商业市场前景,也没有一席之地。

中国芯威武!搞定全球首款异构运算处理器

再加上领导者非常喜欢“自主知识产权”,所谓的“从指令集、微体系结构到工具链的完全独立的知识产权”很可能有相当大的水分。

宣传被夸大了

目前,hsa的优势还不明显,还远远没有达到“计算性能的革命性提高”的地步。

此外,就软件而言,虽然apu统一寻址方便编程,使程序员不必干预繁琐的cpu-gpu内存管理,《中国电子报》在华夏核心上报道,“任何程序都不必费心考虑不同处理器内核之间的存储差异”——消除了cpu、gpu、dsp、asic、fpga等计算单元之间的存储差异,就连amd也只能说:“我做不到!”

异构计算在中国是如何实现的?

虽然异构计算是一个古老的概念,但目前它并没有太多的比较优势,因此它只在超级计算等少数领域取得了明显的成就,并有以同构计算取而代之的趋势。

与华夏核心等纸制品相比,上海高性能集成电路设计中心设计的国产众核芯片是一个成功的范例。该芯片有几个主内核和200多个从内核。主核主要负责逻辑运算,200多个从核可以使芯片具有很高的理论双精度浮点性能和良好的性能功耗比(根据xeon phi gossip为10-15g/w),其峰值双精度浮点运算速度超过每秒3万亿次(3次触发器)

根据“中国第一个拥有完全自主知识产权的异构计算处理器实验室破茧而出”的消息,华夏核心通用处理器技术有限公司还处于起步阶段,其官方网站也很简单。除了“成为中国嵌入式处理器领域拥有自主知识产权的一流设计企业”意味着华夏核心专注于嵌入式处理器之外,基本上没有什么有价值的信息,华夏核心可能还处于基层团队阶段。此外,“拥有从指令集、微体系结构到工具链的完全独立的知识产权”需要深厚的技术积累,这不是一蹴而就的。

中国芯威武!搞定全球首款异构运算处理器

笔者大胆推测,所谓“这是世界上第一次推出完全支持hsa标准的处理器ip核平台,从指令集、微体系结构到工具链都拥有完全独立的知识产权”,这种说法很有道理,即将推出的产品很可能是一个集成了cpu+gpu+dsp的soc。从目前华夏核心的公开信息和媒体报道来看,华夏核心很有利用政策的嫌疑。

标题:中国芯威武!搞定全球首款异构运算处理器

地址:http://www.j4f2.com/ydbxw/7775.html