본문 바로가기
출처 :  

Threadripper패키지

단일 다이에서 제품을 파생시키는 AMD

AMD는 16코어/32스레드의 데스크 톱 CPU"Ryzen Threadripper"의 아키텍처 개요를 밝혔다.Threadripper는 AMD에게 3계통째의 Zen아키텍처 구성이 된다.

아래 블록 그림과 같이 2개의 다이(반도체 본체)를 패키지 내에서 접속한 구성으로 되어 있다. 각각의 다이는 Ryzen 7와 마찬가지로 8코어.그래서 Threadripper는 Ryzen 7의 8코어/16스레드의 2배의 16코어/32스레드로 구성되어 있다.

Threadripper의 전체 구성

Threadripper의 소켓은 새로운 "sTR4"에서 대응 칩셋은 "AMD X399". DRAM인터페이스는 Ryzen의 2배의 4채널.PCI Express에 이르면 gen3이 60레인, gen2이 8레인이라는 방대하고 있다.

이는 다이가 2개인 데다 Ryzen 7에서는 무효화되고 있다. 일부 PCI Express레인이 Threadripper에서는 활성화되고 있기 때문이다.본래 Ryzen 7의 다이에는 PCI Express가 64레인 탑재되고 있다.

Threadripper와 Ryzen의 대비

Threadripper시스템 구성도

2개의 다이를 새로운 인터 커넥트 Infinity Fabric으로 접속한 Threadripper

Threadripper의 다이(반도체 본체)자체는 "Zeppelin(젯페링)"라 불리는 Ryzen 7(Summit Ridge:정상 회의 리지)의 다이옥신과 같다.AMD는 반도체 마스크 비용을 낮추기 위해서, 다이 변화를 억제하고 다이(매스 밤 비전은 다른 경우가 있다)에서 복수의 제품을 파생시키는 전략을 채택하고 있다.

현재의 Ryzen 7/5/3은 이 다이며, EPYC패밀리도 이 다이이다. 구조의 차이는 다이 수와 다이상에서 유효하게 되어 있는 코어 수와 캐시 양이 된다.다이 간 인터 커넥트는 Threadripper와 EPYC에서 구조가 다르다.

AMD의 Ryzen, Threadripper, EPYC의 차이

Summit Ridge의 다이 Zeppelin

기존 AMD CPU보다 52%나 클락인당 명령 실행 수가 늘어난 Zen

Intel CPU코어와 비교해서 CPU코어의 크기가 줄어드는 Zen

상위 5%의 높은 퍼포먼스 다이를 선별

Threadripper와 Ryzen 7의 차이는 다이의 개수만 아니다.우선 다이의 선별이 다르다.

반도체 칩은 같은 웨이퍼에서 나온 다이(반도체 본체)에서도 성능에 차이가 있다. 저 전압에서도 고 클럭으로 동작하는 다이도 있고, 고전압을 걸어도 동작 클럭이 낮은 다이도 있다. 칩 벤더는 차이가 있는 다이를 선별해서 제품 SKU에 할당하다.같은 밭에서 나온 야채를 수 있는 물건과 나쁜 물건을 선별해서 출하하는 것과 같다.

이번에 AMD는 Threadripper의 제품화에 있어서, Ryzen의 다이 중 최상위 5%를 Threadripper용으로 선별했다고 한다. 이 퍼센티지는 설명자마다 다르며 2%라는 설명도 있었지만 실제 Threadripper의 출하 수를 따지면 2%도 있을지도 모른다. 고성능인 다이는 전력에 대한 성능 효율이 높아진다.성능이 높은 다이옥신을 선별하고 Threadripper에

양품 다이를 선별한 Threadripper

Threadripper의 공식의 작동 주파수는 16코어/32스레드의 Ryzen Threadripper 1950X로 16코어가 베이스 3.4GHz, 부스터 클록은 4GHz.12코어/24스레드의 Ryzen Threadripper 1920X에서는 베이스 3.5GHz, 부스트 4GHz.8코어/16스레드의 Ryzen Threadripper 1900X에서 베이스가 3.8GHz, 부스트 4GHz.선별 다이라는 하지만 이 정도의 CPU코어 개수에서 동작 주파수를 높게 유지할 수 있는 점이 Zen마이크로 아키텍처의 이점이다.

Zen마이크로 아키텍처
PDF판은이쪽

AMD의 Zeppelin다이는 1,300이상의 크리티컬 패스 모니터(핵심 경로의 레플리카 회로), 48의 파워 서플라이 모니터, 20의 서멀 다이오드, 9개 도루ー프디텍타을 탑재한다.2개의 Zeppelin염색을 사용 Threadripper에서는 센서 수는 2 배이다.

Threadripper에서는 이러한 센서를 사용하고 꼼꼼히 CPU코어의 동작 주파수를 조작한다.

16코어/32스레드의 Ryzen Threadripper 1950X의 경우 베이스 3.4GHz에서 동작. 4코어만 작동하면 최고 4GHz까지 부스터 수 있다. Ryzen에서는 2액티브 코아에서 부스터 클럭이었다. Threadripper에서는 각 다이에 2코어씩의 부스터 코어에서 합계 4코어를 부스터 수 있다.동작 주파수는 Ryzen역시 25MHz씩으로 제어된다.

Threadripper의 센서와 클럭 제어

2개의 다이로 분산된 DRAM인터페이스

Threadripper의 DRAM인터페이스는 DDR4이 4채널.공식 지원 DRAM의 전송 속도는 DRAM등급과 DIMM매수에 의해서 지원이 바뀐다.

듀얼 등급 DIMM을 각 채널에 2장씩 합계 8 DIMM을 꽂은 경우는 전송 속도는 1,866Mtps에 억제된다. 싱글 순위 DIMM 8장에서 2,133Mtps, 듀얼 등급 DIMM 4장에서 2,400Mtps싱글 순위 DIMM 4장에서 2,667Mtps이다.2,667Mtps시 대역은 85.3GB/s이다.

Threadripper의 공식 지원 DRAM속도

Threadripper에서는 DRAM채널은 4채널이지만 2채널씩 2개의 다이(반도체 본체)에 분산되고 있다.그래서 채널에 의해서 메모리 액세스 레이튼 시가 다르다.

메모리 액세스 트랜잭션을 벌이는 CPU코어가 타고 있는 다이의 메모리 콘트롤러에 접속된 DRAM메모리"니어 메모리(near memory)"에 대해서는 78ns의 레이턴시에서 메모리 액세스가 가능하다.반면 CPU코어 다이라는 다른 다이에 접속된 DRAM메모리"파 메모리(far memory)"에 대해서는 133ns의 메모리 액세스 레이튼 시가 걸린다.

Threadripper의 DRAM인터페이스와 레이턴시

무엇보다, Threadripper의 파 메모리 액세스 레이튼 시는 다이 간 통신이 있다 하고는 짧다.이는 다이 투 다이 온 패키지의 인터 커넥트를 낮은 레이턴시에 설계하고 있기 때문이다.

저 레이턴시고 광대역의 다이 간 Infinity Fabric

AMD의 현재 CPU와 GPU는 모두 인터 커넥트 직물에 "Infinity Fabric"를 채용하고 있다. Infinity Fabric에서는 데이터 조직에 대해서는 상위의 프로토콜 층에 AMD의 오랜"Coherent HyperTransport"를 확장한 프로토콜을 사용하고 있다.그러나 하위의 물리 실장은 각층에 맞춘 것이다.

우선 다이 내부에서는 CPU클러스터와 메모리 컨트롤러, I/O컨트롤러의 접속을 Infinity Fabric에서 하고 있다.온 다이에서는 256-bit폭이 넓은 인터페이스를 쓰고 있다.

Threadripper의 다이 간 Infinity Fabric

한편 다이 투 다이 접속은 1고리가 한쪽 방향 32-bit로 전송 속도를 높인 병렬 인터페이스를 쓰고 있다. 심플한 싱글엔 없어진 신호등에서 클락 포워딩 인터 커넥트이다.패키지에서 배선 거리가 짧은 기판의 제어가 되어 배선 간 간섭이나 크롯크스 큐를 막기 위해서라고 한다.

시리얼 전송 방식을 취하지 않기로 인코딩의 레이턴시를 줄인. 소비 에너지도 2pj/bit로 매우 낮다.참고로, Ryzen에도 이 인터페이스는 탑재되는데, 사용되지 않는다.

AMD의 Infinity Fabric

AMD는 고속 인터페이스 간 FIFO버퍼를 최대한 줄이는 데도 레이턴시를 단축하고 있다. 원래 Ryzen은 CPU코어 외의 유닛을 메모리 클럭에 동기화하는 설계가 되고 있어 온 다이의 Infinity Fabric나 메모리 컨트롤러도 메모리 클럭 동작한다. 함께 EPYC에서는 다이 간 Infinity Fabric도 메모리 클럭과 동기화 하고 2배의 전송 속도에서 동작하는 사양이다.Threadripper도 마찬가지라고 본다.

Threadripper의 온 패키지의 다이 간 Infinity Fabric의 대역은 쌍방향으로 최고 102.22GB/s이다. EPYC에서는 다이 간 Infinity Fabric으로 각 다이가 한쪽 방향 32-bit링크를 3짝을 갖추고 있다. 3짝의 링크에서 4개의 다이를 상호 접속하고 있다. Threadripper에서는 다이의 수는 2개로 적어 2짝을 쓰고 2다이 간을 연결하고 있다고 추정된다.2페어에서는 단 방향 64-bit의 인터 커넥트가 된다.

EPYC의 구성

EPYC에서는 다이 간 Infinity Fabric의 전송 속도는 최대 5.33Gtps에서 DDR4-2666과 동기화 하고 있었다. 1링크의 메모리 대역은 양방향 모두 42.6GB/s. 반면 Threadripper의 다이 간 Infinity Fabric의 대역은 최대 102.2GB/s. 인터페이스 폭이 64-bit 한다고 계산상의 전송 속도는 최대 6.38Gtps.이는 DDR4-3200의 데이터 전송 속도와 동기화한다.

Threadripper의 다이 간 접속의 추측도

Threadripper의 2개의 메모리 액세스 모드

Threadripper는 2개의 메모리 액세스 모드를 갖는다. 1개는 "UMA(Uniform Memory Access)"또는"Distributed Mode(디스토리뷰ー텟도 모드)"와 AMD가 부르는 모드. 이제 1개는 "NUMA(Non-uniform Memory Access)"또는"Local Mode(로컬 모드)"와 AMD가 부르는 모드이다.차이는 4개의 DRAM메모리 채널로의 액세스 제어가 된다.

UMA/Distributed모드에서는 메모리 액세스 트랜잭션이 Threadripper의 4개의 DRAM채널에 분산된다. 4채널은 리니어로 동등하게 취급되고 인터 리ー빙그에서 4채널에 동시에 분산 접속한다.그래서, 애플리케이션이 4메모리 채널의 메모리 대역을 최대한 살릴 수 있다.

무엇보다, 현실에는 접속된 다이로 메모리 액세스의 레이턴시가 다르기 때문에 평균 메모리 레이튼 시는 약간 늘어난다. 레이턴시보다 메모리 대역이 중요한 어플리케이션 전용이다.3D CG도구"Maya"처럼 워킹 세트의 큰 애플리케이션에서 효과를 발휘한다고 한다.

Threadripper의 UMA/Distributed모드

반면 NUMA/Local모드에서는 메모리 액세스는 그 어플리케이션이 달리고 있는 CPU코어의 다이(반도체 본체)에 연결되어 있는 2개의 DRAM메모리 채널이 우선된다. 기본적으로 메모리 액세스 트랜잭션은 다이에 직결된 2개의 DRAM채널만으로 이뤄진다.메모리로 칼리 티를 이용하고 메모리 액세스의 레이턴시가 단축된다.

NUMA/Local모드에서는 기본 메모리 액세스는 2채널이 되기 때문에 애플리케이션인당 메모리 대역은 반감한다. 메모리 대역보다 메모리 레이튼 시가 중요한 어플리케이션 전용이다.AMD에 따르면"Battlefield"시리즈 같은 게임은 NUMA/Local모드에서 성능이 올라간다는.

Threadripper의 NUMA/Local모드

UMA/Distributed모드와 NUMA/Local모드 사이의 전환은 동적으로 행할 수 없다. 부팅 시에 선택한다.평균 메모리 접근 레이튼 시는 벤치 마크에서는 DDR4-3200시에 UMA/Distributed모드 시에 86.9ns, NUMA/Local모드 시에 66.2ns과 UMA/Distributed모드가 3할 정도 늦어지고 있다.

UMA/Distributed모드와 NUMA/Local모드의 평균 메모리 접근 레이튼 시

x86계열 CPU의 멀티 소켓으로 구성의 메모리 액세스는 원래 UMA형이었다. 메모리 컨트롤러를 내장하는 1개의 노스 브리지 칩에 여러 디스크 리트 CPU가 접속되어 있었다.각 CPU는 노스 브리지에 접속된 DRAM메모리를 공유하는 UMA였다.

거기에 AMD가 CPU측에 DRAM컨트롤러를 통합한 Opteron을 투입, 그 때 CPU에 접속된 니어 메모리와 또 다른 CPU에 접속된 모피 메모리의 구별이 있는 NUMA형의 메모리 아키텍처를 들여온 바 있다.2개의 다이를 낮은 레이턴시에 접속한 Threadripper에서는, 어느 쪽의 메모리 액세스 모드도 선택을 할 수 있다.

Opteron의 멀티 소켓 구성

메모리 액세스 모드의 전환과 유산 호환 모드

Threadripper에서는 AMD의 CPU세팅 콘솔 소프트웨어"Ryzen Master"의 Threadripper버전으로 미세한 세팅을 치를 수 있다.

Threadripper용 세팅으로 2가지 모드 단추가 준비되어 있다.일부 기존 게임 소프트를 위한 "Legacy Compatibility Mode(유산 호환 모드)" 온/오프와 "Memory Access Mode(메모리 액세스 모드)"의 전환이다.

레거시 호환 모드(Legacy Compatibility Mode)를 켜면 Threadripper스레드 수가 절반이 된다.레거시 호환 모드는 고 스레드 수를 통제할 수 없는 레가시게ー무용 모드에서 CPU하드웨어 쓰레드 중 절반이 무효로 한다.

즉, Threadripper의 32스레드 중 16스레드만 이용하지 못하도록 제어된다. 기본적으로는 CPU코어가 무효화된다.다만 이 모드에서도 4개의 DRAM인터페이스와 64레인의 PCI Express는 모두 이용할 수 있다.

Threadripper에서 세팅

Ryzen Master for Threadripper아래 쪽에 유산 호환 모드와 메모리 액세스 모드 전환 스위치가 있는

메모리 액세스 모드(Memory Access Mode)세팅은 메모리 액세스를 UMA/Distributed모드와 NUMA/Local모드 중 하나에 전환할 수 있다.기본적으로 UMA/Distributed이다.

Ryzen Master의 Threadripper용 설정 프로파일로서 "Game Mode(게임 모드)"과 "Creator Mode(제작자 모드)"이 제공되고 있다.게임 모드(Game Mode)에서는 CPU의 동작 모드는 유산 호환 모드, 메모리 액세스는 NUMA/Local이다.

크리에이터 모드(Creator Mode)은 게임 모드의 대극인 프로파일이다. 제작자 모드에서는 레거시 호환 모드는 오프로 메모리 액세스는 UMA/Distributed가 된다. CPU쓰레드 수와 메모리 대역이 풀이다.쓰레드 수와 메모리 대역이 중요한 어플리케이션 전용의 프로파일이다.

게임 모드와 제작자 모드의 프로파일

Threadripper와 3색 Radeon Vega의 조합

Threadripper는 합계 64레인의 PCI Express gen3을 갖추고 최대 8개의 PCI Express기기를 접속할 수 있다. 실제로는 X399 I/O칩도 x4 PCI Express로 접속되고 있어 유효한 PCI Express는 60레인, 7장치이다. PCI Express에서는 4-way의 CrossFire/SLI접속 구성이 가능하다.Threadripper의 강도의 1개는 이 강력한 I/O에 있다.

64레인의 PCI Express gen3을 갖춘 Threadripper

가령 AMD가 렌더 팜용으로 제안하는 것은 2개 x16그래픽 카드 2개 x8그래픽, 3개의 x4스토리지와 같은 구성. 그래픽은 푸른 Radeon의 "Radeon Pro Vega"을 권장하고 있다.3D CG콘텐츠 밤 에이팅용 구성이다.

렌 다 팜용 AMD가 부르고 있다 Threadripper의 구성

코어 게이머용 AMD가 위치하는 구성은 2개 x16그래픽 카드, 1개의 x4스토리지의 구성. GPU는 당연히 붉은 라 데온의 "Radeon RX Vega"이다.다른 세션에서는 이에 더욱이 x8의 캡처 카드와 x4의 10G Ethernet을 거쳤다.

코어 게이머용 Threadripper+Radeon Vega의 구성 예

데이터 과학자용은 6개의 x8 GPU콤퓨ー토카ー도, 1개의 x4스토리지의 구성. GPU카드는 노란 Radeon의 "Radeon Instinct MI25".즉, 적색, 청색, 황색의 Radeon 3색이라고 조합으로 각각 특화된 파워풀한 플랫폼이 된다는 설명이다.

이 밖에 4K이상의 비디오 편집을 위한 콘텐츠 크리에이터용 구성도 AMD는 소개했다.

데이터 과학자용으로도 Threadripper+Radeon Instinct의 구성 예

비디오 콘텐츠 크리에이터용의 구성 예

스트리머용의 구성 예

cap:각사의 Threadripper대응 머더 보드

AMD는 Threadripper을 오로지 고성능을 요구하는 익스트림 PC유저 뿐만이 아니라 3D콘텐츠 제작자와 4K이상의 비디오 제작자 등 창조적 분야의 유저도 목표로 한다.

또 단체 PC에 다수의 GPU을 싣고 돌리고 싶고 GPU콤퓨ー토 이용자도 추구한다. 이러한 시장에서의 CPU와 GPU성능 요구는 천정부지이다.그리고 AMD는 그 시장에서는 Intel의 Core i9에 대해서 Threadripper이 우위를 갖는다고 보고 있다.

Threadripper 같은 고성능 CPU에 대한 요구가 있다고 주장하는 AMD

첨부
엮인글 :
List of Articles
제목 글쓴이 날짜 조회 수
공지 PC/모바일을 제조/유통하는 업체 관계자분을 모십니다 file 가브리엘조 2015-12-15 2217
CPU/MB/RAM 비휘발성 메모리를 DIMM슬롯에 장착하는 표준 규격"NVDIMM" file 김말이님 2017-08-13 19
쿼드코어 CPU와 NVDIMM 지원하는 Windows 10 Pro for Workstations 올해 가을에 배포 file 김말이님 2017-08-13 13
"Windows 10 Creators Update"이 전 사용자에게 개방!추석은 경신에 도전 file 김말이님 2017-08-13 12
CPU/MB/RAM 인텔, 제8세대 커피레이크 프로세서를 8월 21일 발표 file 김말이님 2017-08-13 18
아수스 ASUS, WAN를 2포트 탑재한 사무실용 Wi-Fi 무선공유기 file 김말이님 2017-08-11 42
"USB Type-C" 케이블을 잘 고르는 방법 및 기초 지식 file 김말이님 2017-08-11 19
CPU/MB/RAM AMD 라이젠 쓰레드리퍼의 아키텍처에 대해 알아보자 file 김말이님 2017-08-11 33
CPU/MB/RAM AMD 라이젠 쓰레드리퍼 1950X 스펙 및 자세한 리뷰정보 file 김말이님 2017-08-11 29
CPU/MB/RAM 플렉스터 NVMe SSD"M8Se" 스스디에 히트 싱크 탑재 모델 나옴 file 김말이님 2017-08-11 7
윈도10 속 리눅스, 베타 딱지 뗀다 [2] 김말이님 2017-08-11 12
윈도10 인사이더 프리뷰 레드스톤3 16237.1001 file 김말이님 2017-08-11 9
통신사들, 와이파이 넘보는 LTE 기술 상용화..문제 없을까 김말이님 2017-08-11 19
네트워크 [펌웨어] ipTIME 유무선 공유기 6종 펌웨어 10.00.4 배포 김말이님 2017-08-11 15
CPU/MB/RAM AMD가 숨겨둔 카드, 12코어 라이젠 쓰레드리퍼 1920 file 김말이님 2017-08-11 6
CPU/MB/RAM 인텔, i9 사양 공개 file 김말이님 2017-08-11 13
CPU/MB/RAM 칩 하나에 영화 70편…삼성, 꿈의 테라시대 열다 가브리엘조 2017-08-11 4
캘리포니아 대 100억분의 1W에서 가동하는 온도 센서 file 김말이님 2017-08-09 8
CPU/MB/RAM 델의 8K 해상도 모니터가 드디어 오늘 발매 file 김말이님 2017-08-09 12
CPU/MB/RAM AMD, 16코어/32스레드"Ryzen Threadripper"패키지를 공개 file 김말이님 2017-08-09 7
ASUS 10.1형 Android태블릿"ZenPad 10(Z301MFL)"을 발표 file 김말이님 2017-08-09 8
CPU/MB/RAM AMD 차세대 그래픽카드 GPU"Radeon RX Vega64" 공식발표 file 김말이님 2017-08-09 19
NAS업체의 고성능 무선 LAN라우터 Synology"RT2600ac" file 김말이님 2017-08-09 69
ASUS새 스마트 폰"ZenFone 4"를 8월 17일 발표 예정 file 김말이님 2017-08-09 8
CPU/MB/RAM 인텔 데이터 센터 전용의 SSD"Intel SSD DC S4600/S4500"의 2제품을 발표 file 김말이님 2017-08-09 13
기타/주변기기 NTT, 세형 멀티 코어 광파이버로 세계 최대 118.5Tbps의 데이터 전송을 실현 file 김말이님 2017-08-09 18
서버에 요청 중입니다. 잠시만 기다려 주십시오...