본문 바로가기
출처링크 :  

 

GeForce GTX 1080의 특징

 NVIDIA는 5 월 6 일 (현지 시간), Pascal 아키텍처를 채용 한 하이 엔드 GPU "GeForce GTX 1080 '을 발표했다. 그리고 17 일에 미디어에 의한 벤치마킹을 해금하고, 새로운 정보를 공개했다.

 이번 미디어 용으로 배포 된 자료는 방대 백서는 55 페이지 검토 와즈 가이드는 61 페이지에 이른다. 이 프로그램은 Pascal에서 혁신적인 기술이 다수 투입된 것을 시사하고 있지만, 그 중에서 6 일 발표 시점에서 공개되지 않은 정보 등을 요약 해 소개하기로하자.

GeForce GTX 780의 3 배의 전력 성능비

 우선 GeForce GTX 1080 개요에서 복습 해 두자. GTX 1080는 소비자 용 GPU로는 처음으로 16nm FinFET 공정을 채용. 이 때문에 추측에, 제조는 TSMC가 담당 할 것으로 보인다. 트랜지스터 수는 이전 세대의 GeForce GTX 980의 52 억에서 72 억으로 증가했지만, 다이 크기는 398 평방 mm에서 314 평방 mm로 축소하고있다.

 CUDA 코어 수는 2,048 개에서 2,560 개로 25 % 증가,베이스 클럭은 1,607MHz, Boost 클럭은 1,733MHz와 GPU로서는 전례없는 영역에 달성했다. CUDA 코어 수와 클럭의 두 증가로 최대 연산 성능은 8,873GFLOPS에 달해도 GTX 980 4,981GFLOPS에서 78 % 향상하고있다.

 CUDA 코어 수의 증가에 따라 텍스처 유닛도 GTX 980의 128 개에서 160 개로 늘었다. 메모리는 10Gbps 구동 GDDR5X 동일한 256bit의 버스 폭을 유지하면서 대역폭은 224GB / sec에서 320GB / sec로 42 % 증가했다. 한편 L2 캐시의 크기는 2MB로 지연되고, TDP는 165W에서 180W의 미증에 그쳤다.

 결과적으로 GTX 1080은 전력 효율이 매우 높은 GPU가되었다. GTX 980에 비해 전력 효율은 1.5 배가되고 있지만, GTX 780과 비교하면 3 배의 전력 성능비를 실현했다고한다. Kepler 아키텍처는 등장 당초 Fermi에 비해 전력 효율을 실현할 수 있었다고 화제가 일세를 풍미했지만 아직 GTX 780 세대의 GPU를 사용하고 있다면, 이제 GTX 1080에 대한 교체를 고려해야 할 것이다.

src="http://pc.watch.impress.co.jp/img/pcw/docs/757/832/2_s.jpg" />

 

GeForce GTX 1080의 블록 다이어그램

새로운 GDDR5X 메모리와 메모리 압축 기술

 기보대로, GTX 1080에서는 "GDDR5X"라는 새로운 메모리를 채택한다. 기본적으로 GDDR5 기술을 기반으로하고 있지만, 10Gbps라는 데이터 속도를 제공하려고하면 지금까지의 GDDR5 대응 회로이라고 전달이 늦어 데이터 전송을 마치기 전에 다음의 데이터가 전송되는 것을 된다.

 그래서 NVIDIA는 높은 클럭을위한 새로운 I / O 회로를 설계하고 GDDR5X의 탑재를 실현했다. 1.35V보다 낮은 전압과 새로운 프로세스 기술을 채용함으로써 종래와 동등한 소비 전력을 유지하면서 43 % 높은 클럭을 달성했다. 또한 GPU 다이 및 메모리 다이 사이의 채널을 최적화하고 신호의 혼선과 손실을 억제한다. 그 결과, 신호의 '눈'을 충분히 확보 할 수있어 데이터의 캡처에 여유를 갖게 할 수 있었다고한다.

 

GDDR5X의 채용

 이만큼 빠른 메모리를 사용하고 있지만, Pascal에서는 메모리 대역폭을 효율적으로 사용하기 위해 새로운 무손실 데이터 압축 기술을 채용했다.

 Maxwell 세대까지 블록이있는 화소에 인접 화소가 그 색에 가까운 색이면 GPU가 계산을 수행 차분으로 기록하여 용량을 2 분의 1로 "2 : 1 압축 "을 갖추고 있었지만, Pascall 세대는 또한 동일한 블록에서 차이가 더 작아 몇 비트로 표현할 수있는 경우 원래의 4 분의 1까지 압축하는 '4 : 1 델타 컬러 압축"고 2 × 2 픽셀 블록의 4 : 1 한결 컬러 압축과 2 : 1 압축을 결합하여 데이터 크기를 8 분의 1로 억제 "8 : 1 델타 컬러 압축 '을 탑재했다.

 이 결과 Pascal에서는 Maxwell과 비교하여 메모리 대역폭의 이용 효율이 20 % 향상, 메모리 클럭의 향상 분과 따라 GTX 980과 비교하여 메모리 효율이 1.7 배 증가했다고한다.

 

4 : 1 델타 컬러 압축과 8 : 1 델타 컬러 압축

 

압축 비교. 이미지는 Project CARS 런타임 테스트, 마젠타는 데이터 압축을 얻은 부분을 나타낸다. 중앙은 Maxwell 세대에서 바로 Pascal 세대. 보시는 바와 같이 대부분의 데이터를 압축 할 수있다

 

압축을 통해 메모리 대역폭의 이용 효율이 20 % 높아졌다

SLI 인터페이스를 쇄신

 Pascal 세대에서는 SLI 인터페이스가 일신되었다. GTX 1080에서는 SLI 커넥터를 2 개 갖추고있다. 이 점 이전 세대 하이 엔드와 동일한 것이지만, 지금까지 2-way SLI를 구축하는 경우 중 하나 만 연결하여도 좋다 것으로되어 있었다. 그러나 GTX 1080는 2 개의 커넥터를 동시에 사용 "Dual-link SLI」모드가 표준으로 클럭이 400MHz에서 650MHz로 향상 기존에 비해 2 배 이상의 대역폭을 제공 할 수 있다고한다.

 오래된 표준적인 SLI 브릿지를 이용하여 하나만 연결해도 좋지만,이 경우 다소 속도가 향상되지만 성능은 제한된다. 기존의 LED가있는 SLI 브릿지를 사용하면 최대 650MHz로 동작하지만, Single-link하기 때문에 역시 성능이 제한된다. Dual-link SLI를 사용하기 위해서는 새로 개발 된 "SLI HB"라는 브릿지를 이용할 필요가있다.

 

새로운 SLI HB

 

SLI HB 장착 이미지

 더 구체적으로 말하면, 스탠다드 브릿지를 사용했을 경우, 2,560 × 1,440 도트 @ 60Hz의 해상도 밖에 권장되지 않지만 LED가 들어가 타입의 브릿지는 이것이 4K 해상도까지 향상된다. 한편, SLI HB 브리지를 이용하면 5K와 3 대의 디스플레이에 의??한 서라운드 환경으로 권장이 펼쳐진다.

 백서에도 신구 브리지 이용시 성능 비교가 공개되어 있는데, 이에 따르면 새 브리지에서보다 안정적인 프레임 속도를 실현할 수있어 셔터 링 현상을 억제한다.

 

SLI 브릿지의 차이에 따른 권장 해상도의 차이

 

새로운 브리지는 SLI 프레임 레이트가 더 안정 될 것이라는

 또한이 사양 변경으로 3way 또는 4way SLI는 비추천되었다. 비추천보다는 기본적으로 비 대응으로, Pascal 이후에도 기본적으로 3way와 4way는 지원되지 않는다. 그래도 3way와 4way을 사용하고 싶은 매니아는 NVIDIA의 사이트에서 신청 "Enthusiast Key"라는 키를 발급 받아야 키를 설치하고 처음 3way와 4way 구성이 활성화된다는 .

새로운 멀티 GPU 모드

 위의 2way SLI 모드의 제한은 사실 DirectX 12의 멀티 GPU 처리 변경에 의한 것이 크다. DirectX 12에서는 여러 개의 GPU가있는 경우 3 가지 모드를 이용할 수있게 되었기 때문이다.

 첫 번째는 Multi Display Adapter (MDA) 모드이다. 이것은 거의 읽어 글자처럼 비디오 카드 각각을 개별적으로 인식시키는 모드에서 각각의 비디오 메모리는 분리되어 상호 GPU가 서로의 메모리에 직접 액세스 할 수 없습니다. MDA 모드에서는 개발자가 신중하게 각각의 GPU의 메모리를 관리 할 필요가 있지만, GPU 개수의 제한은 없다.

 한편, 2 개의 GPU가 메모리를 상호에 액세스 할 수 Linked Display Adapter 모드도 준비되어 있는데, Implicit LDA라는 SLI 같은 구조에 가세 해 새롭게 Explicit LDA라는 구조가 준비되었다.

 Explicit LDA 모드는 Implicit LDA 모드와는 달리, 게임 개발자가보다 자유롭게 GPU를 제어 할 수있게된다. 예를 들어, 제조사가 다른 디스크리트 GPU와 CPU 내장 GPU조차 쌍으로 짤 수있게 각각의 비디오 메모리를 하나의 메모리 풀로 취급이 가능하다. 이 Explicit LDA 모드에서도 GPU 수에 제한이 없다. 앞으로이 Explicit LDA 모드 및 MDA 모드가 주류가 될 것으로 전망되기 때문에 SLI를 2way로 제한하기로 한 것으로 보인다.

 물론, 2-way SLI를 다하고도 지금 그대로 PhysX GPU를 별도로 추가한다고 것은 계속 가능하다.

 

DirectX 12에 탑재 된 새로운 멀티 GPU 모드

수직 동기화가 켜져 있는데 입력에서 반응 할 때까지의 대기 시간을 줄일 「FAST SYNC "

 지금까지 그래픽 렌더링은 일련의 "흐름"이 있었다. 게임 엔진의 렌더링 요구는 먼저 드라이버를지나 GPU로 렌더링 된 프레임 버퍼에 모은 후 디스플레이에 출력된다. 이들은 분리 할 수??없는 "흐름"이었다. 그러나 Pascal 세대에서는 렌더링 파이프 라인의 프론트 엔드 및 디스플레이 출력에 관련된 백엔드를 분리시켰다.

 이를 통해 실현 한 것이 "게임의 설정은 수직 동기화를 해제하지만 실제로 출력되는 이미지는 수직 동기화 On"라는 "FAST SYNC"라는 특이한 기능이다.

 FAST SYNC는 구체적으로 어떤 장점이 있는가. 아시다시피, 수직 동기화가 해제라고 게임 엔진은 디스플레이 동기화를 기다리지 않고 다음에서 다음으로 렌더링을한다. 따라서 키보드와 마우스의 입력에서 디스플레이 출력까지의 지연을 최소화 할 수있다. 그러나 디스플레이의 재생률 이상의 프레임 속도가 출력되는 이미지의 위아래가 어긋나 "스티어링 '현상이 발생한다.

 스티어링을 피하기 위해 수직 동기화를 선택하면 좋지만이 경우 지금까지의 "흐름"는 게임 엔진 전체가 디스플레이 출력을 기다릴 필요가 있었다. 따라서 키보드와 마우스의 입력도 디스플레이 새로 고침이 걸릴 타이밍까지 기다려야 지연이 발생하는 원인이되고 있었다.

 FAST SYNC를 활성화하면 전술 한 바와 같이, 프론트 엔드와 백엔드가 분리되기 때문에 게임 엔진을 포함한 프런트 엔드 파이프 라인은 수직 동기화가 꺼져있을 때와 마찬가지로 빠르게 작동 할 수있는 분 동작한다. 따라서 입력 지연의 최소화와 스티어링의 해소를 양립 할 수 있다는 것이 NVIDIA의 말이다.

 그러나 지금까지의 렌더링 흐름에 그대로 FAST SYNC의 구조를 도입해도 효과가 없다. 아시다시피, 3D 이미지 디스플레이에 출력하기 전에 일단 버퍼에 저장된다. 버퍼는 전체 이미지로 출력 할 수있는 상태에있는 「프런트 버퍼」(FB)과 현재 렌더링 중의 「??백 버퍼」(BB)의 2 종류가 있지만, FB가 디스플레이에 출력되지 않는 한 BB에 새로운 렌더링을주는 것은 없다. 즉, 결국은 재생 빈도로 제한되며, 게임 엔진은 "실속"해 버린다.

 그래서 NVIDIA는 새로운 '라스트 렌더링되지 않은 버퍼 "(LRB)라는 버퍼를 마련했다. 게임 엔진은이 버퍼는 직접 보이지 않는 것이지만, BB의 렌더링이 끝나면 자동으로 LRB되고, FB가 될 때까지 기다렸다가 지금까지 LRB였던 것이 BB되고 다음의 렌더링을 받는다. LRB가 FB 때까지 (즉 FB가 디스플레이에 출력되는)이 사이클은 반복 게임 엔진은 항상 빈 BB가 있다고 판단된다. 이는 게임 엔진의 실속을 방지하는 것이다.

 

FAST SYNC의 구조. 우선 프런트 엔드 및 백 엔드를 분리시켜 버퍼에 새롭게 LRB를 마련했다

 

NVIDIA 제어판에서 FAST SYNC를 선택하면

 이 FAST SYNC의 장점은 특히 부하가 가벼운 DirectX 9 게임에서 눈에 띄는 수직 동기 오프시와 비교하여 입력에서 지연 + 8ms 이내로 억제하면서, 스티어링이나 불안감을 해소 할 수있다. 이것은 수직 동기화가 켜져있을 때의 지연과 비교하여 약 2 분의 1에서 4 분의 1 짧은한다.

 

입력에서 출력까지의 지연 비교. 수직 동기화가 꺼진 상태에 가까운 낮은 지연을 얻을 수있다

VR위한 새로운 구조 나 GPGPU의 개선, 4K 비디오, HDR에의 대응 등

 이처럼 GTX 1080에서는 3D 렌더링에 대해 상당히 많은 개선이되어있는 것을 알 수있다. 과연 초대 Maxwell (GeForce GTX 750 Ti)의 등장에서 2 년 이상은되었을 수도 있고, Pascal 세대의 3D 게임을위한 진화는 눈 부시다.

 그러나 이에 그치지 않고 보드의 최적화, GPU Boost 3.0이라는 새로운 오버 클럭의 구조, VR을위한 최적화, GPGPU의 개선, 그리고 비디오 디코더의 개선, HDR 게임에 대한 대응 등 다양한 요소가 포함 있다. 이들은 내일 (18 일) 또 원고를 재차 소개하고 싶다.

 여담이지만, 백서 및 레뷰 즈 가이드를 보면 라이벌 GPU에 대한 언급은 일절없고, Pascal에 강한 자신감을 가지고있는 것이 엿 보인다.

List of Articles
번호 제목 글쓴이 날짜 추천 수 조회 수
478 정보 라즈베리파이3 OS 설치에서 환경 구축까지 (1편) file 잭팟 2016-06-22   2471
477 잡담 한성에서 새로운 팬티엄 G4400 노트북이 나왔네요 file [1] intel(s) 2016-06-19   2184
476 정보 AMD와 인텔, 신형 프로세서 출시연기?? 재고문제 file 잭팟 2016-06-12   1089
475 정보 직장인 태블릿PC 활용 꿀팁 with LG전자 G패드2 10.1 file 댄디보이 2016-06-11   1570
474 정보 Pentium G3220 vs Celeron J1900 벤치마크 성능표 file 릴레이 2016-06-09   1871
473 잡담 NAS에 SSD를 사용해보신분 혹시 계신가요?? [1] the.100 2016-06-09   1657
472 정보 Realtek 리얼텍도 마침내 SSD 컨트롤러 진출함 file the.100 2016-06-07   1270
471 정보 i7-6950X 스펙 및 벤치마크 점수 file the.100 2016-06-07   2665
470 잡담 스타일러스2 생각보다 성능이 상당히 좋습니다 댄디보이 2016-06-05 2 1365
469 MSI에서도 수냉이랑 공랭 지포스 GeForce GTX 1080 을 출시했네요 file 잭팟 2016-05-30   2489
468 일반 지포스 GTX1080 Founders Edition 가격 떴습니다 [2] 댄디보이 2016-05-27   1219
467 TP-LINK의 Wi-Fi 라우터 Archer C7 11ac에서 최대 1300Mbps file 토사랑 2016-05-24   997
466 GeForce GTX 1080M은 데스크탑 용 TITAN X 3DMark 11 Performance 점수공개 file 토사랑 2016-05-24   1896
» 지포스 GeForce GTX 1080 그래픽카드 특징 및 정보 file 잭팟 2016-05-17   2357
464 정보 지난 10년간 인텔 vs AMD 세계시장 점유율 file 잭팟 2016-05-17   2363
463 2016년 기준 그래픽카드 성능표입니다 잭팟 2016-05-17   7330
462 2016년 기준 하드엔드급 SSD / HDD 벤치마크 자료입니다. 잭팟 2016-05-17   39592
461 정보 스카이레이크 막내 코어 i3 6100이 무서운 이유 file 김말이님 2016-05-14   2699
460 잡담 sk ㅅㄱ 은하수7호 모서리 32 김말이님 2016-05-14 1 1317
459 정보 2016년 5월 기준 휴대폰 판매량 순위 file 평가단 2016-05-14   2958
458 2016년 CPU 벤치마크 자료 잭팟 2016-04-29   3239
457 2015~2016 HDD 하드디스크 신뢰성 및 안정성 순위 file 잭팟 2016-04-24 1 6445
456 정보 에즈락 오버클럭용 Intel Z170 microATX-ITX 메인보드 시리즈 정보 file 잭팟 2016-04-22   1597
455 정보 윈도우즈10 정품 21달러에 판매중 [1] intel(s) 2016-04-21   1413
454 NVIDIA가 차세대 GPU "Pascal"의 HBM2 아키텍처 정보 file 잭팟 2016-04-14   1718
서버에 요청 중입니다. 잠시만 기다려 주십시오...