CRAY SUPERCOMPUTER By Group01
CRAY SUPERCOMPUTER ผลิตภัณฑ์ต่างๆ ของ Cray ที่ได้มีออกมานั้นมี มากมายหลายรุ่น อันได้แก่ Cray Research (1972–2000; part of SGI 1996–2000) SGI Cray-1Cray-1 Cray X-MPCray X-MP Cray-2Cray-2 Cray Y-MPCray Y-MP Cray T3DCray T3D Cray T3ECray T3E Cray C90Cray C90 Cray T90Cray T90 Cray J90Cray J90 MARQUISE
Cray Computer Corp. (1989–1995) Cray-3 Cray Inc. (2000–present; result of merger between Tera Computers and Cray Research) Cray SX-6 Cray MTA-2 Cray SV1 Cray Red Storm Cray X1 Cray X1E Cray XT3 Cray XD1 CRAY SUPERCOMPUTER
Cray Research Cray-1
Cray Research ModelX-MP/1X-MP/2X-MP/24X-MP/4X-MP/2X-MP/1 X- MP /14 se Cpus Memory size/type 1,2,4 Mos 2,4M Bipo lar 2M Bipo lar 4,8,16M Bipolar2,4,6,16M Mos4,8,16M Mos4M Mos SSD 64,128,256,10 24M 64,128,2 56M 32,64,128,256,5 12M N/AN/A IOS2,3,4 2,42,3,4 2 Buffer memory8,32,64 M 4,8 2,4,8
Cray X-MP Cray Research
ตัวเครื่องถูกเครื่องแบบมาในลักษณะคล้ายกับรูปทรง ของเกือกม้า โดยใช้หน่วย ประมวลผลที่มีความเร็วสัญญาณนาฬิกาอยู่ที่ 10 nanoseconds มีความเร็วในการประมวลผลอยู่ที่ 200 megaflops ต่อหนึ่งหน่วยประมวลผล และสามารถ มีความเร็วสูงสุดถึง 800 megaflops เมื่อใช้ หน่วย ประมวลผลจำนวน 4 ตัว Cray X-MP ถูกนำออกมาจัดจำหน่ายใน รูปแบบ 1, 2 และ 4 หน่วยประมวลผล พร้อมด้วย หน่วยความจำขนาด 1-16 megawords ( MB ) ทำงานที่ความเร็ว 942 megaflops Cray Research
Cray 2 Cray Research
Cray-2 เป็น vector supercomputer ซึ่งถูกนำเสนอโดย Cray Research ในปี 1985 โดยจัดว่าเป็นเครื่องที่มีความเร็วที่สุดในโลกในขณะนั้น แทนที่รุ่น X- MP Cray Research ModelBackground processorsMemory Mwords 264 SRAM MOS 2126 SRAM MOS 4128 SRAM MOS 4256 DRAM MOS 4512 DRAM MOS รุ่นต่างๆที่ทำการผลิตออกมา
Cray Research Cray Y-MP
Cray Research Cray Y-MP ใช้หน่วยประมวลผลแบบ Vector Processor ซึ่งสามารถใช้หน่วยประมวลผลได้สูงสุดถึง 16 ตัวในหนึ่งเครื่อง แต่ละหน่วยประมวลผลจะมี ความเร็ว สัญญาณนาฬิกาที่ 6.5 nanoseconds และมี ความเร็วในการประมวลผลที่ 2.7 Gigaflops ภาพจาก archive.ncsa.uiuc.edu/SCMS/DigLib/stills/ archive.ncsa.uiuc.edu/SCMS/DigLib/stills/
Cray Research Machine Type:Cray Y-MP EL (Entry Level) CPU Type:Cray Y-MP EL (Vector processor, CMOS technology) Number of processors:4 Main memory:128 MWords -> 1024 MByte Word length:64 bit Binary compatibility:up to the Cray-1 (1976) Local storage: 2x DD4 Hard Disks - 1 GB each One IBM 3740 (?) tape drive Network connectivity: 10 MBit Ethernet 125 MBit FDDI Specified performance: 133 MFlops per CPU peak 4-8 times a Cray-1 1/4 of a Cray-2 Measured peak performance: 460 MFlops (A 2.4 GHz P4/RDRAM is 770 MFlops on the same benchmark problem, huge matric multiply, with Linux gnu cc -O3) Operating system:Cray UNICOS (Unix-based) Commercial products installed: C Compiler, F77 Compiler Free software installed (/usr/local): Bash, GNU Make, Readline, GZip, less, vim, unzip, GNU tar, xaos, perl (in /opt)
Cray Research Cray T3D
Cray Research Cray T3D MC 256 เป็น Supercomputer ที่ประกอบกันขึ้นด้วย หน่วยประมวล ประมวลผลแบบ Alpha Processor ความเร็ว 150 MHz จำนวน 256 ตัว รูปภาพจาก
Cray Research Machine Type: Cray T3D Serial number: 6223 Year of introduction: 1993 CPU Type: DEC ALPHA (Microprocessor) Number of processors: 128 Main memory: 8 MWord -> 64 MByte per CPU 1 Gword -> 8 GByte total Word length: 64 bit Binary compatibility: none Local storage: none (C90 used as frontend) Network connectivity: none (C90 used as frontend) HISP (200 MByte/sec) channel to C90 LOSP ( 20 MByte/sec) channel to C90 Specified performance: 150 MFlops per CPU peak 19 GFlops total peak Measured peak performance: not yet measured Operating system: Cray UNICOS max (Unix-based) Commercial products installed: C Compiler, F77 Compiler ข้อมูลจากจาก
Cray Research Cray T3E
Cray Research Cray T3E เป็น Supercomputer แบบ massively parallel มีการจัด จำหน่ายโดย Cray research ตั้งแต่ปี 1995 มีการออกแบบให้ใช้หน่วยประมลผลจำนวน ตั้งแต่ 8 จนถึง 2178 หน่วย o MHz Alpha CPUs o 600 MFLOPS peak per CPU o 8 KB L1 data cache, direct-mapped, 4-word line o 96 KB L2 data cache, 3-way set associative, 8-word line o 32.5 GB of RAM ข้อมูลจาก manila.cats.rwth-aachen.de/mech525/crayt3e manila.cats.rwth-aachen.de/mech525/crayt3e
Cray Computer Corp Cray -3
Cray Computer Corp
Cray Inc Cray SX-6
Cray Inc Cray SX6 เป็น Supercomputer ที่ถูกสร้างขึ้นโดยบริษัท NEC และถูก นำมาจำหน่ายภายใต้ สิทธิบัตรของบริษัท Cray ในสหรัฐอเมริกา SX-6 หนึ่งโหนดสามารถมีหน่อย ประมวลผลแบบ Vector Processor ได้สูงสุดถึง 8 ตัวและมีหน่วยความจำหลักได้สูงสุดถึง 64 GB ใน รูปแบบ multi- node SX-6 จะถูกจัดการการเชื่อมต่อด้วย interconnection ผ่านระบบ high-speed IXS สามารถเชื่อมต่อแต่ละ node เข้าด้วยกันได้มากถึง 128 node หัวใจสำคัญในประสิทธิภาพของ SX-6 คือ Vector Processor ความเร็ว 8 GFLOPS ดังนั้นเครื่อง SX-6 หนึ่ง node สามารถมีประสิทธิภาพได้สูงสุดถึง 64 GFLOPS หากเป็นในแบบ multi-node หนึ่งระบบสามารถมีความเร็วและประสิทธิภาพในการทำงาน สูงสุดถึง 8 TFLPOS SX-6 จะใช้ระบบปฏิบัติการของ NEC’s SUPER-UX Unix-like OS
Cray Inc Cray X1
Cray Inc Cray X1 ถูกออกแบบมาในลักษณะการใช้หน่วยประมวลผลแบบ multi- piped vector Processors ที่มีประสิทธิภาพในการประมวลผล 12.8 Gflops ต่อหนึ่ง หน่วยประมวลผล โดยหน่วยประมวลผลใช้ Instruction Set Architecture แบบใหม่ Cray X1 ถูกออกแบบมาให้สามารถรองรับหน่วยประมวลผลได้ตั้งแต่ 4 ถึง 4000 หน่วย ซึ่งแต่ละหน่วยประมวลผล มีความเร็วในการคำนวณอยู่ที่ 12.8Gflops หน่วยประมวลผลประกอบขึ้นด้วย scalar/vector จำนวน 4 ชุด เพื่อที่จะสร้าง Muliti-Streaming Processor หน่วย ประมวลผลจะทำงาน อยู่ที่ความเร็ว 800 MHz สำหรับ Vector Unit และ 400Mhz สำหรับ Scalar unit ความจุในการส่งสัญญาณของหน่วยประมวลผล ไปยัง catch มีขนาด 76 GB/s และสำหรับที่ไปยัง หน่วยความจำหลักมีขนาด 51 GB/s
Cray Inc CRAY X1 HIGHLIGHTS The highlights of the new Cray X1 include: y Scaling from 4 to over 4,000 processors y Each processor is rated at 12.8 peak GFLOPS, the processors are constructed of four sets of scalar/vector units to create a MSP (Muliti-Streaming Processor). 2 # ©2002 IDC The processor chips run at both 800 MHz for the vectors units and 400 MHz for the scalar units. q Providing 3.2 scalar GOPS and 12.8 vector GFLOPS per MSP processor (25.6 GFLOPS in 32-bit node) High bandwidth, low latency memory system design: q Processor bandwidth to cache is 76 GB/s (50 GB/s for loads and 26 GB/s for stores) q Peak bandwidth to local main memory is 51 GB/s per processor (38 GB/s sustained). Global interconnect main memory bandwidth is 102 GB/s per four processor/memory node board. q I/O bandwidth is 4.8 GB/s per 4-processor node board and up to 75 GB/s per cabinet. Up to one I/O channel per processor. Each I/O channel is 1.2 GB/s full duplex, and is globally accessible by all processors in the machine. q The latency to global memory is in the microsecond range in the largest configurations. Typical latency across a 512 processor system (128 nodes) is around 1 ms (one microsecond)
Cray Inc Cray X1E
Cray Inc
Cray X1E System Highlights High Performance CPU The Cray X1E CPU uses vectorization and streaming to deliver peak performance of 18 GFLOPS per CPU. High memory bandwidth allows the processor to achieve a higher percentage of peak performance for applications than in most HPC systems. Scalable Interconnect and Memory The Cray X1E system is designed to scale beyond what any vector supercomputer has before. This scalability is made possible by extremely highperformance interconnect and memory subsystems. While the Cray X1E memory is physically distributed on individual modules,anyMSP can logically share any memory. Using standard load and store instructions, an MSP can use a remote memory address to read or write memory located on a separate module. The system supports very high concurrency to allow applications to tolerate global network latencies.
Cray Inc True Single System Image OS UNICOS/mp™, the Cray X1E operating system, is a true single system image operating system (OS). Regardless of system size, system administrators need only manage and configure a single OS — significantly reducing the time and effort needed for software upgrades and other tasks. High Performance Application Support The Cray X1E programming environments support multiple levels of parallel programming, with a wide choice of programming models. Optimizing Fortran, C, and C++ compilers perform automatic vectorization and streaming, and support OpenMP programming within a node, and Co-Array Fortran or UPC across the system. Optimized libraries are included for MPI and SHMEM, as well as for a large number of key scientific functions. To assist programmers in developing and optimizing applications, the TotalView® debugger and powerful performance analysis tools are availablefor the Cray X1E system.
Cray Inc Cray XT3
Cray Inc
Scalable Application Performance The Cray XT3 supercomputer’s high speed 3D torus interconnect, x86 64-bit AMD Opteron™ processors, high speed global I/O, and advanced MPP operating system ensure that applications scale steadily from 200 to 30,000 processors without performance losses from communications bottlenecks, asynchronous processing, or memory access delays. Scalable Reliability and Management Each Cray XT3 component, from industrial cooling fans, to disk drives, to the Cray Reliability, Availability and Serviceability (RAS) and Management System, is engineered to operate as part of a highly reliable system at immense scale, ensuring that large, complex jobs run to completion. Tightly integrated operating and management systems allow administrators to manage hundreds or thousands of processors as a single system, eliminating the administrative effort and problems associated with loosely coupled cluster systems. Cray XT3 System Highlights
Cray Inc Scalable Programmability The Cray XT3 supercomputer lets programmers focus on their applications instead of designing around processing inefficiencies such as asymmetric processor performance, memory access algorithms, and communication delays. Fully scalable performance analysis and debugging tools enable programmers to rapidly test and fine-tune their applications. Scalable I/O The Cray XT3 I/O system uses the highly scalable, open source Lustre™ parallel file system. Highly reliable Fibre Channel disks and controllers provide up to 100 GB/s global I/O performance, ensuring high efficiency for I/O intensive applications and providing the I/O capacity needed for rapid data dumps and user level checkpointing. Scalable System Upgrades Cray XT3 systems can be expanded by adding cabinets or by upgrading Opteron processors with faster or dual- core models, or upgrading the Cray SeaStar processor to increase interconnect speeds. This flexible expansion ensures a long system life, maximizing return on investment.
Cray Inc Cray XD1
Cray Inc
Cray XD1 System Highlights Compute Processors 12 AMD Opteron™ 64-bit single or dual core processors run Linux and are organized as six nodes of 2 or 4-way SMPs to deliver up to 106 GFLOPS* per chassis. Matching memory and I/O performance removes bottlenecks and maximizes processor performance. RapidArray™ Interconnect The industry’s fastest embedded switching fabric, the RapidArray interconnect uses 12 custom communications processors and a 96 GigaBytes (GB) per second nonblocking switching fabric per chassis to deliver 8 GB per second bandwidth between nodes with 1.7 microsecond MPI latency. Each chassis presents 24 RapidArray links externally with an aggregate 48 GB per second bandwidth between chassis.
Cray Inc Application Acceleration Six Xilinx Virtex-4 Field Programmable Gate Arrays (FPGAs) per chassis attach to the RapidArray fabric for massively parallel execution of critical algorithm components, promising orders of magnitude performance improvement for target applications. Active Management A management processor in each chassis, a realtime operating system, distributed software and an independent supervisory network operate together to monitor, control and manage every aspect of the computer. The Cray XD1 system enables single system command and control and provides extensive high availability features.
อ้างอิง Document Faq PDF File