IBM 로드런너 | 2008 ~ 2009


 Roadrunner는 IBM이 미국 뉴멕시코의 로스앨러모스 국립연구소를 위해 만든 슈퍼컴퓨터이다. 1억 달러의 예산으로 제작된 Roadrunner는 1.7 페타플롭의 최대 성능을 목표로 했으며, 2008년 5월 25일에는 1.026 페타플롭을 달성하여 세계 최초로 TOP500 LINPACK에서 1.0 페타플롭의 지속 성능을 기록한 시스템이 되었다. 2008년 11월에는 1.456 페타플롭을 달성하여 TOP500 리스트에서 1위를 유지했다. 또한, Supermicro Green500 리스트에서 세계에서 네 번째로 에너지 효율이 높은 슈퍼컴퓨터로, 사용한 전력당 444.94 메가플롭의 성능을 기록했다. Roadrunner의 하이브리드 설계는 이후 여러 에너지 효율적인 슈퍼컴퓨터에서 재사용되었다. Roadrunner는 2013년 3월 31일 로스앨러모스에서 퇴역되었고, 그 자리에 2010년에 Cielo라는 새로운 슈퍼컴퓨터가 설치되었다.

IBM은 이 슈퍼컴퓨터를 미국 에너지부의 국가핵안전행정국(NNSA)을 위해 제작했다. Roadrunner는 하이브리드 설계로, 12,960개의 IBM PowerXCell 8i와 6,480개의 AMD Opteron 듀얼 코어 프로세서를 사용한 특수 설계된 블레이드 서버에 의해 연결되었으며, InfiniBand로 연결되었다. Roadrunner는 Red Hat Enterprise Linux와 Fedora를 운영 체제로 사용하며, xCAT 분산 컴퓨팅 소프트웨어로 관리되었고, Open MPI 메시지 전달 인터페이스 구현도 사용되었다.

Roadrunner는 약 296개의 서버 랙을 차지했으며, 560제곱미터(6,000제곱피트)의 공간을 덮었고, 2008년에 운영을 시작했다. 이 슈퍼컴퓨터는 미국의 노후화된 핵무기들이 안전하고 신뢰할 수 있는지 예측하기 위해 핵 물질의 노화 과정을 시뮬레이션하는 데 사용되었으며, 다른 분야에서는 과학, 금융, 자동차 및 항공우주 산업에서도 활용되었다.

Roadrunner는 당시 다른 슈퍼컴퓨터들과 달리 Seymour Cray가 1964년 Control Data Corporation CDC 6600에서 도입한 하이브리드 설계를 이어갔다. 그러나 이 아키텍처에서는 주변 프로세서들이 운영 체제 기능에만 사용되고, 모든 응용 프로그램은 하나의 중앙 처리 장치에서 실행되었다. 대부분의 이전 슈퍼컴퓨터들은 하나의 프로세서 아키텍처만을 사용했으나, Roadrunner는 하이브리드 아키텍처에서의 잠재력을 최대한 발휘하기 위해 모든 소프트웨어가 특별히 작성되어야 했다. 하이브리드 설계는 AMD의 듀얼 코어 Opteron 서버 프로세서를 사용하며, 각 Opteron 코어에는 IBM이 설계하고 제작한 PowerXCell 8i 프로세서가 부착되어 있었다. Roadrunner는 Opteron 클러스터와 Cell 가속기를 결합한 슈퍼컴퓨터로, 각 노드는 Cell이 Opteron 코어에 부착되어 있으며, Opteron들이 서로 연결된 구조였다.

Roadrunner는 2002년부터 개발이 시작되었고 2006년에 온라인으로 연결되었으며, 그 복잡성과 혁신적인 설계로 인해 세 가지 단계로 나누어 건설되었으며, 2008년에 완전 가동을 시작했다. 그 이전에는 Dark Horse라는 기계가 로스앨러모스에서 개발되었으며, 이는 ARM을 기반으로 한 초기 하이브리드 아키텍처 시스템으로, 이후 Cell 프로세서를 사용하게 되었다.

첫 번째 단계에서는 Opteron 기반의 클러스터를 구축하며 하이브리드 버전을 설계하고 프로그래밍할 가능성을 평가했다. 이 첫 번째 단계의 Roadrunner는 2006년에 71 테라플롭의 성능을 기록하며 로스앨러모스에서 운영을 시작했다. 두 번째 단계인 AAIS(Advanced Architecture Initial System)에서는 오래된 Cell 프로세서를 사용하여 하이브리드 시스템의 작은 버전을 구축하고, 이를 통해 하이브리드 아키텍처에 맞춘 응용 프로그램을 개발하기 위한 프로토타입을 만들었다. 이 단계는 2007년 1월에 온라인으로 운영되었다. 세 번째 단계는 1 페타플롭 이상의 지속 성능을 달성하는 것이 목표였으며, 추가적인 Opteron 노드와 새로운 PowerXCell 프로세서가 설계에 추가되었다. 이 단계에서는 2008년 5월 25일 1 페타플롭 장벽을 돌파하며 완전 가동되었고, 2008년 여름에는 뉴멕시코로 이동하여 최종 설치가 완료되었다.

Roadrunner는 두 가지 종류의 프로세서를 사용했다. 첫 번째는 AMD Opteron 2210으로 1.8GHz에서 작동하며, Opteron은 데이터 처리와 시스템 운영 및 통신을 담당하는 노드에서 사용되었다. Roadrunner는 총 6,912개의 Opteron 프로세서를 가지고 있었으며, 그 중 6,480개는 계산을 담당하고 432개는 운영을 담당했다. 각 Opteron은 두 개의 코어를 가지고 있어 총 13,824개의 코어를 제공했다. 두 번째 프로세서는 IBM PowerXCell 8i로, 3.2GHz에서 작동하며, 각 프로세서에는 하나의 일반 프로세서(PPE)와 8개의 특수 성능 코어(SPE)가 포함되어 있었다. Roadrunner는 총 12,960개의 PowerXCell 프로세서를 가지고 있었으며, 각 PowerXCell은 1개의 PPE 코어와 8개의 SPE 코어로 총 116,640개의 코어를 제공했다.

TriBlade는 두 개의 듀얼 코어 Opteron과 16GB의 RAM을 갖춘 4개의 PowerXCell 8i 프로세서로 구성된 모듈로, 물리적으로는 LS21 Opteron 블레이드와 확장 블레이드, 두 개의 QS22 Cell 블레이드로 구성되어 있었다. 하나의 TriBlade는 세 개의 슬롯을 차지했으며, 세 개의 TriBlade는 BladeCenter H 섀시에서 하나의 시스템으로 사용되었다.

Roadrunner는 총 18개의 연결된 유닛(CU)으로 구성되었으며, 각 CU는 12개의 288포트 Infiniband ISR2012 스위치로 연결되었으며, 모든 CU는 96개의 업링크 연결을 통해 연결되었다. 최종 시스템은 6,480개의 Opteron 프로세서와 12,960개의 Cell 프로세서, 216개의 I/O 노드, 26개의 Infiniband 스위치로 구성되었으며, 총 296개의 랙을 차지했다.

Roadrunner는 2013년 3월 31일에 종료되었으며, 그 전력 효율성은 상대적으로 낮았음에도 불구하고 여전히 세계에서 가장 빠른 슈퍼컴퓨터 중 하나였다. 이 슈퍼컴퓨터는 전력을 사용할 때 444 메가플롭을 기록했으며, 비슷한 슈퍼컴퓨터는 886 메가플롭을 기록했다. 해체 작업은 로스앨러모스에서 진행되었으며, 그 과정에서 일부 부품은 역사적 보존을 위해 남겨졌다.

이 블로그의 인기 게시물

콜러서스 컴퓨터 [Colossus computer | December 1943]

NTDS [Naval Tactical Data System | 1961]

에니악 [ENIAC | December 10, 1945]