CP-PACSはMIMD(Multiple Instruction-streams Multiple Data-streams)方式
の分散メモリ型並列計算機である。演算処理を並列に行う2048台のPU
(Processing Unit)と,入出力を分散処理する128台のIOU(Input/Output Unit)
が,ハイパークロスバー(Hyper Crossbar)結合網により 8
×17×16 の3次元配列に結合されている。
CP-PACSは理論ピーク性能
614GFLOPSという高い演算性能を持つことに加え,単体PU性能・
結合網・入出力の全ての面でバランスのとれた超並列処理能力を備えている。
CP-PACSの各PUは,PA-RISC1.1アーキテクチャに基づく新規開発のスーパースカ ラRISCプロセッサを搭載している。RISCプロセッサによる大規模科学技術計算で は,データキャッシュの容量不足による演算性能低下が深刻な問題であるが, CP-PACSでは,これをPVP-SW(Pseudo Vector Processor based on Slide Window)機能の導入により,PA-RISCアーキテクチャとの 上位互換性を保ちつつ解決している。
PVP-SWでは,論理レジスタ・ウィンドウを連続的に切り替えるスラ イド・ウィンドウ機構により,多数の物理レジスタの利用を可能とす る。また,擬似的にパイプライン化された主記憶に対して連続発行可能な Preload/Poststore命令により,先行ウィンドウへのロード, 後続ウィンドウからのストアを行うことができる。これらのPVP-SW機能により, 主記憶のアクセス遅延が隠蔽され,スーパースカラ・プロセッサでありながら, 効率のよいベクトル処理が可能となっている。
CP-PACSの結合網は,多数のクロスバースイッチをx,y,z各方向に配列した3次元
ハイパークロスバーを採用している。PUとIOUは各方向のクロスバーを繋ぐ
Exchangerに接続され,最大三段のクロスバーを経由することにより,任意のパ
ターンのPU間データ転送が可能であり,極めて柔軟な結合網となっている。
データ転送はリモートDMA(Remote Direct Memory Access)
方式により行われる。この方式では,OSの介在を最小限に抑え,各PU上のユーザ・
メモリ領域間で直接データの送受信を行うことにより,転送立ち上げレイテンシ
の大幅削減と,高い転送スループット性能を実現している。
CP-PACSの
結合網は、x、y、z各方向の中間面を境に、ハードウェアによる等分割が可能である。
従って、CP-PACSは最大8の部分システムによる分割運転を行うことができる。
科学技術計算においては,しばしば膨大な入出力を行う必要に迫られる。これを
可能とするために,CP-PACSには,128台のIOUを通して,大容量のディスク装置
が分散接続されている。ディスクには,耐故障性に優れたRAID-5規格が採用され
ている。各IOUは,多数のPUから生じるファイル入出力要求に対し,ハイパーク
ロスバー結合網を用いてこれを高速に転送し,並列処理することが可能である。
CP-PACSと外部との入出力のためには,IOUの1台がHIPPIによりホスト計算機と接 続され,大量のファイル転送を高速に行うことができる。