IBM ロードランナー | 2008 ~ 2009
Roadrunnerは、アメリカ・ニューメキシコ州のロスアラモス国立研究所のためにIBMが作ったスーパーコンピュータである。1億ドルの予算で製造されたRoadrunnerは、最大性能1.7ペタフロップを目標として設計され、2008年5月25日に1.026ペタフロップを達成し、TOP500 LINPACKで世界初の1.0ペタフロップ持続性能を記録した。2008年11月には1.456ペタフロップに達し、TOP500リストで1位を維持した。また、Supermicro Green500リストで世界で4番目にエネルギー効率の高いスーパーコンピュータとして、消費電力当たり444.94メガフロップの性能を発揮した。Roadrunnerのハイブリッド設計はその後、いくつかのエネルギー効率の高いスーパーコンピュータに再利用された。Roadrunnerは2013年3月31日にロスアラモスで退役し、その代わりに2010年にCieloというスーパーコンピュータが設置された。
IBMはこのスーパーコンピュータをアメリカ合衆国エネルギー省の国家核安全保障局(NNSA)向けに製造した。Roadrunnerは、12,960個のIBM PowerXCell 8iプロセッサと6,480個のAMD Opteronデュアルコアプロセッサを特別設計されたブレードサーバーに搭載し、InfiniBandで接続されていた。システムはRed Hat Enterprise LinuxおよびFedoraをオペレーティングシステムとして使用し、xCAT分散コンピューティングソフトウェアで管理され、Open MPIメッセージパッシングインターフェースも使用された。
Roadrunnerは約296のサーバーラックを占め、560平方メートル(6,000平方フィート)のスペースを覆い、2008年に稼働を開始した。このスーパーコンピュータは、アメリカの老朽化した核兵器が安全で信頼できるかどうかを予測するために核物質の経年劣化をシミュレーションするために使用され、科学、金融、自動車、航空宇宙産業でも応用された。
Roadrunnerは、当時の他のスーパーコンピュータとは異なり、Seymour Crayが1964年にControl Data Corporation CDC 6600で導入したハイブリッド設計を継承していた。これにより、周辺プロセッサはオペレーティングシステムの機能にのみ使用され、すべてのアプリケーションは1つの中央処理装置で実行されることになった。これまでのスーパーコンピュータは通常、1つのプロセッサアーキテクチャしか使用していなかったが、Roadrunnerはそのハイブリッドアーキテクチャの能力を最大限に活かすために、すべてのソフトウェアが特別に書かれる必要があった。この設計は、AMDのデュアルコアOpteronプロセッサとIBM設計のPowerXCell 8iプロセッサを組み合わせたものであり、RoadrunnerはOpteronクラスターとCellアクセラレータを持つスーパーコンピュータとして、各ノードにOpteronコアがCellプロセッサに接続され、Opteron同士が接続されていた。
Roadrunnerの開発は2002年に始まり、2006年にオンラインで稼働を開始した。その複雑で革新的な設計により、3つの段階に分けて構築され、2008年に完全に稼働した。その前身となったのは、ロスアラモスで開発されたDark Horseというマシンであり、これはARMプロセッサをベースにした初期のハイブリッドアーキテクチャシステムで、後にCellプロセッサに移行した。
第1段階では、Opteronベースのクラスターを構築し、ハイブリッドバージョンの構築およびプログラミングの実現可能性を評価した。この第1段階のRoadrunnerは、2006年に71テラフロップを達成し、ロスアラモスで完全に稼働した。第2段階であるAAIS(Advanced Architecture Initial System)では、古いCellプロセッサを使用してハイブリッドシステムの小型バージョンを作成し、この段階でハイブリッドアーキテクチャ向けのアプリケーションのプロトタイプを作成した。この段階は2007年1月にオンラインで稼働した。第3段階では1ペタフロップ以上の持続性能を達成することが目標で、Opteronノードを追加し、PowerXCellプロセッサを強化した。この段階では、2008年5月25日に4回目の挑戦で1ペタフロップの壁を突破し、最終的にニューメキシコに完全に移設された。
Roadrunnerは2種類のプロセッサを使用していた。1つ目はAMD Opteron 2210で、1.8GHzで動作していた。Opteronは計算ノードとシステム運用および通信ノードの両方で使用された。Roadrunnerは合計6,912個のOpteronプロセッサを持ち、そのうち6,480個が計算用で、432個が運用用であった。各Opteronは2つのコアを持ち、合計13,824コアとなった。2つ目はIBM PowerXCell 8iで、3.2GHzで動作し、各プロセッサには1つの汎用コア(PPE)と8つの特別な性能コア(SPE)があり、浮動小数点演算に使用された。Roadrunnerは12,960個のPowerXCellプロセッサを持ち、116,640コア(12,960 PPEコアと103,680 SPEコア)を提供した。
TriBladeモジュールは、2つのデュアルコアOpteron、16GBのRAM、および4つのPowerXCell 8iプロセッサを16GBのCell RAMとともに持つ論理構造であった。物理的には、1つのLS21 Opteronブレード、1つの拡張ブレード、2つのQS22 Cellブレードで構成され、InfiniBandおよびHyperTransportで接続されていた。
システム全体は18個のConnected Units(CU)で構成され、各CUは180のTriBladesを持ち、288ポートのInfinibandスイッチで接続されていた。最終システムは、6,480のOpteronプロセッサ、12,960のCellプロセッサ、216のI/Oノード、26のInfinibandスイッチで構成され、合計296のラックを占めていた。
Roadrunnerは2013年3月31日に退役し、世界で最も高速なスーパーコンピュータの一つであり続けたが、そのエネルギー効率は比較的低かった。Roadrunnerは1ワットあたり444メガフロップを記録し、同様のスーパーコンピュータは1ワットあたり886メガフロップを記録していた。退役後、いくつかの部品は歴史的な保存のために残され、一部は廃棄された。
