计算机体系结构中的凸型典范是什么?
Convex是第一家将CC-NUMA机器商业化的公司,该机器被称为SPP1000。SPP代表可扩展并行处理器。SPP Exemplar系列的目标是制造一系列高性能计算机,其中多个处理器的数量可以从10个到1000个不等,峰值性能将达到TeraFLOPS。
SPP1000的节点是对称多处理器,称为超节点。每个超节点包括四个功能块和一个I/O子系统。每个功能块包括两个CPU(HP PA-RISC),每个CPU都有一个单独的CPU代理,以及一个内存单元,负责管理超节点私有内存数据、全局内存数据和网络缓存数据。一个五端口交叉开关互连四个功能块和I/O子系统。
超节点通过四个SCI(可扩展一致性接口)点对点单向环连接。SCI可以支持几种互连网络,单向环是其中一种。对全局内存的顺序内存引用在四个环之间交错。
这是通过使用与目标内存位于同一功能单元中的环来实现的,因为内存以64字节为基础交错。四个SCI环也以这种方式交错,64字节是网络缓存行大小。
SPP1000的全局共享内存分布在超节点之间。Convex Exemplar系列采用分层内存架构,包含四种类型的可分配内存,这些内存的区别在于数据分配和共享方式。
分配、共享或延迟方面存在四种不同的内存并不意味着必须有四种不同的物理内存。所有四种内存以及网络缓存都可以由每个超节点上的同一物理内存实现。
在Exemplar中,提供了以下类型的内存,按内存延迟递增的顺序排列:
CPU私有内存用于仅由单个CPU访问的数据。CPU私有内存并非物理实现。它是操作系统框架将超节点私有内存划分为每个CPU的CPU私有内存。
超节点私有内存用于仅由单个超节点内的CPU共享的数据。
近共享内存可从所有超节点普遍访问。此内存从全局内存分配,从主超节点访问近共享内存所需的延迟比从其他节点访问所需延迟少。
远共享内存可从所有超节点以相同的延迟普遍访问。它从多个超节点的全局内存分配。设计为远共享(由多个超节点共享并分布在多个超节点上)的相干内存通过操作系统软件对表条目的分配在超节点之间以每页(4 KB)为基础交错。