본문 바로가기
출처링크 :  
2년주기의 CPU 코어 개발을 ARM IP로 채우기 탁구 전략


 NVIDIA는 모바일 / 임베디드의 Tegra 계열에서는 CPU 코어를 SoC (System on a Chip)에 통합하고있다. NVIDIA는 작년 (2014 년) 독자적인 마이크로 아키텍처의 새로운 ARMv8 CPU "Denver (덴버)"을 28nm 공정의 Tegra K1에 싣고 제공했다. 그러나 올해 투입 한 20nm 프로세스의 Tegra X1에 탑재 한 것은 ARM 설계의 Cortex-A57 코어이었다. 왜 Denver 대신 Cortex-A57를 선택했는지. Denver 아키텍처는 계속 하는가?

 이 의문에 대해 NVIDIA를 이끄는 Jen-Hsun Huang (젠슨 황) 씨 (Co-founder, President and CEO)는 COMPUTEX시에 다음과 같이 대답했다.

5_s.png


"사실, 우리의 CPU 전략은"탁구 전략 '을 취하고있다. 우리는 매년 새로운 Tegra 칩을 제공 할 수있다. 그러나 우리는 새로운 CPU 아키텍처를 만드는 데 2​​ 년이 소요된다. 따라서 전략 탁구된다. (Tegra 제품에서) 새로운 CPU 아키텍처, 새로운 공정 기술, 새로운 CPU 아키텍처, 새로운 공정 기술이 같이 모두 2 년 리듬된다. 2 년마다 새로운 CPU 2 년마다 새로운 프로세스 기술이다. 물론, GPU도 2 년 리듬이되고있다 .Maxwell의 등장까지 2 년 걸려 Pascal의 등장까지 2 년이 걸린다. "

 이 설명에서 2014 년에 등장한 Denver CPU 코어 계열의 후계 코어는 2016 년이되는 것을 알 수있다. 제품 코드 네임에서 다음 "Parker (파커)"가 다시 NVIDIA Denver 계 코어 SoC가 될 전망이다. 또한 Tegra 계열은 2016 년 GPU 코어는 Maxwell 아키텍쳐가 계속 될 수도 시사되고있다.

 전체의 흐름을 보면, 자사에서 마이크로 아키텍처를 개발 Denver는 2 년주기 개발이므로, 1 년주기의 Tegra 제품화에 맞추기 위해 ARM의 Cortex-A57 IP를 사용한 것이다. 프로세스 세대로 말하면 28nm 자체 Denver에서 20nm로 이행 한 올해 (2015 년)는 구매 IP의 Cortex-A57가된다. Cortex-A57은 ARM 마이크로 아키텍처를 개발하여 소프트웨어 매크로로 라이센스하기 위해 SoC에 구현이 신속하게 가능하다. 성숙한 프로세스는 개발에 시간이 걸릴 독자적인 CPU 코어가 올라 프로세스가 바뀌면 구현이 간단한 라이센스 CPU 코어가 실리 패턴이있다.

1_s.png


2_s.png


20nm 프로세스는 ARM의 IP 단기간에 개발


 Huang 씨의 설명대로라면 공정 기술도 2 년주기 때문에 다음 Denver 탑재 제품은 20nm로 유지된다. 그러나 내년 (2016 년)은 모바일 SoC는 16 / 14nm FinFET 프로세스로 이행이 진행되기 때문에 Parker도 16 / 14nm FinFET 공정 일 가능성이 매우 높다. 무엇보다, 공정 기술의 백엔드를 보면, 20nm 및 16 / 14nm 프로세스는 매우 가까이 트랜지스터 층만의 차이라고 생각한다면, 20nm 및 16 / 14nm는 동 세대 프로세스가된다.


 그러나 20nm 프로세스 및 16 / 14nm 공정의 물리적 설계는 트랜지스터 구조가 전혀 다르기 때문에 바뀐다. 코어 설계의 기본 부품 인 표준 셀 자체를 봐도 16 / 14nm의 FinFET 공정에서 전혀 디자인이 다르다. 따라서 물리적 디자인으로 20nm 평면형 트랜지스터 공정과 호환성이 낮다. 그리고 프로세스 세대 적으로는 20nm는 1 년으로 교체하는 단명 과정에서 16 / 14nm FinFET은 2 년 이상 남아 표준 프로세스가 될 전망이다.


 그렇게 생각하면, NVIDIA의 이번 CPU 아키텍처 선택 이유도 더 보인다. 코어 개발이 2 년주기 때문에 탁구로 교체하는 요소 외에도 하루살이 20nm에 따라 실제 설계는 구입 한 IP에서 행한 것이 빠르고 합리적이라고 판단 것으로 보인다. 16 / 14nm FinFET에서의 설계라면 다음에 개량을 추가해도 더 합리적으로 설계를 유용 할 수있다.


 덧붙여서, CPU 코어는 NVIDIA의 Denver는 명령 병렬 스케줄링 소프트웨어에서 행하는 특수한 사정이있다. 따라서 Denver는 GPU와 마찬가지로 런타임 소프트웨어를 업데이트함으로써 같은 하드에서도 성능이 달라진다. 반대로 말하면 런타임의 성숙에 시간이 걸릴 아키텍쳐가되고있다. 따라서 GPU 코어와 마찬가지로 동일한 계열의 아키텍처를 계속하여 런타임을 성숙시키는 것이 바람직하다.


스마트 폰 시장에서 뺀 NVIDIA


 Tegra 계열 SoC를 계속 확장하는 NVIDIA하지만 Tegra의 대상은 당초 스마트 폰 시장에서 떨어져 버렸다. Huang 씨는 NVIDIA에게 모바일은 자동차이라고 설명한다. 모바일 (mobile)라는 말의 본래 의미는 기동성에서 자동차 (automobile)는 모바일을 단어 자체에 포함한다. 는 스마트 폰과 슈퍼 폰 시장은 이제 NVIDIA는 표적이 아닌가.


 "우리는 전화 (스마트 폰 등)은 더 이상하지 않는다고 결정했다. 그 이유는 내가 전화는 이미 거의 끝난 것으로 생각하고 있기 때문이다. 전화는 이미 일 용품이되어 버리고있다 물론 나도 전화를 매일 사용한다. 그러나 그 시장에 기여 하자는 강한 욕망은 느끼지 않는다. 왜냐하면 이미이 시장에 강력한 경쟁자가 다수 있기 때문이다.


 따라서 우리의 지금 전화 전략은 우리가 만들어 낸 세계 최고의 GPU 기술을 누구나 바라고있는 업체에 라이선스하는 것이다. 하지만 우리 자신이 전화를 만들어야 할 이유가 없다. 또한 그것이 우리가 무선 모뎀 기술 개발을 중지 결정한 이유 중 하나이기도. "


 Huang 씨의 설명에서는 NVIDIA의 전략 포인트를 잘 안다. NVIDIA는 자사의 강점을 활용할 수 경쟁이 약한 장소에서 싸우려하는 경향이 강하다. 기업 으로서는 당연하지만, 스마트 폰용 SoC처럼 경쟁이 치열한 곳은 이익을내는 것이 어렵다. 특히 모뎀이 관련되면 매우 불쾌 모뎀 기술을 개발뿐만 아니라 각국의 인증을 통과해야하고 시간이 매우 걸린다.


 NVIDIA는 일시적는 자사에서 모뎀을 가지면 스마트 폰 시장에 食い込める 생각 소프트 모뎀 벤처 "Icera (아이세라) '를 인수했다. 그리고 Icera 모뎀을 통합 한 Tegra 4i 스마트 폰 시장을 노렸다. 그러나 현재는 그 노선은 수정 된 모뎀베이스 밴드 프로세서를 갖고 스마트 폰 시장에서 싸운다는 고생이 많은 길은 선택하지 않는다. NVIDIA에게는 회사의 자원을보다 경쟁이 적은 자동차 등의 시장을 향한 것이 유리하다고 판단한 것으로 보인다. 전신이 스피디 한 것은 NVIDIA의 특징이다.


1.png


프로세스 노드의 쇄신은 적극적으로 계속


 현재 NVIDIA는 모바일 제품은 20nm 프로세스 개별 GPU 제품은 28nm 프로세스를 채용하고있다. 이것은 업계의 표준 프로세스 선택이다.


 그러나 NVIDIA 등 칩 업체는 공정 기술면에서 큰 기술 장벽이 가로막고있다. 그것은 공정 기술의 합병증과 그에 따른 새로운 프로세스의 비용 상승이다. 특히 20nm 공정에서 노광 기술에 더블 패터닝이 도입 된 것도 있고, 배선층의 비용이 급상승하고있다. 이것은 배선층의 구성이 특수하고 가장 피치 폭이 좁은 배선을 다 계층으로 사용되는 GPU에있어서 매우 중요한 문제이다. GPU의 제조 비용이 급상승하는 것을 의미하고 있기 때문이다.


 그리고 GPU는 내년 (2016 년)에서 FinFET 3D 트랜지스터 공정으로 전환하기위한 부가적인 과정은 복잡해진다. 칩의 제조 비용 증가는 불가피한 상황이다. 이는 향후 프로세스의 미세화 = 트랜지스터 당 비용 감소에 의한 제조 비용 저감이되지 않는 것을 의미하고있다. 따라서 제품은 28nm 공정에 장기간 머무는 분야가 나올 것으로 예상되고있다.


 그러나 Huang 씨는이 회사의 제품은 제조 비용이 상승해도 성능 향상을 얻을 수 있다면, 새로운 프로세스로 전환하는 의미가 충분히 있다고 말한다.


 "많은 기업에서는 특정 기능을 갖춘 칩을 설계하고 그 칩의 비용을 매년 (프로세스의 미세화 등으로) 내려 간다. 그러나 NVIDIA의 경우는 조금 다르다. 왜냐하면 우리의 칩은 결코 기능이 충분하다고하기 때문이다. 매년 더 높은 성능이 반드시 필요한 비용을 낮출뿐만 아니라 성능이 중요하다. 따라서 차세대 프로세스 노드와 그 다음 노드에서도 우리는 여전히 성능을 향상시킬 아이디어를 계속 추구하고있을 것이다. "


 현재 하이 엔드 GPU는 고객 측의 요청이 비용보다 성과로이고 항상 성능 향상이 요구된다. 따라서 제조 비용의 상승이 있어도 성능을 올릴 수 있다면 충분히 부합하면 NVIDIA는보고 있다는 것을 알 수있다.


4.jpg



공정 기술에만 의존하지 않고 성능을 향상시키기


 이 자세는 AMD도 거의 마찬가지다. AMD도 FinFET 세대의 프로세스에서는 제조 비용이 상승하지만, 성능과 전력면에서 장점이 있기 때문에 적극적으로 프로세스 이행을 진행한다고 설명하고있다. NVIDIA 등의 GPU 벤더는 적어도 플래그쉽 제품은 가능한 빨리 프로세스 이행을 목표로하고있다. 그러나 시장 세그먼트에 의해 프로세스 마이그레이션 전략은 다르게 갈 것이다.


 그러나 GPU의 성능 요소는 프로세스 기술만으로도 않으면 Huang 씨는 강조도한다.


 "그러나 새로운 프로세스에만 의존하지는 않는다. 우리는 2 년 플래그쉽 GPU의 성능을 약 3 배로 끌어 올렸다. 이는 무어의 법칙 (최근 2 년에서 트랜지스터 수가 2 배)보다 빠른 속도 다. 그것이 의미하는 것은 성능 향상은 프로세스 기술만으로 인한 것이 아니라 우수한 아키텍처와 현명한 설계에서도 실현되는 것이다. 우리는 새로운 프로세스 노드에 대해 매우 에 적극적이다. 그러나 그렇지 않은 경우 (프로세스 노드의 발전이 지체되는)하지만 필요로하는 성능을 달성 할 수있다. "


 사실, 28nm 프로세스의 전환 3 년이 걸렸 최근 무어의 법칙보다 속도는 둔화하고있다. 향후 프로세스 노드되면 그 경향은 더욱 강해 진다고 볼 수있다. Huang 씨의 말은 프로세스 이행이 둔화되고있는 상황에 대해 의견이다.


 그러나 아키텍처에 의한 성능 향상은 실제로는 제한된다. 현재 성숙한 GPU는 전체 성능을 아키텍처만으로 단숨에 끌어 올리는 것은 어렵다. 따라서 NVIDIA는, 예를 들어 16-bit 반 정밀도 부동 소수점 연산 성능 강화 등 특정 기능 향상으로 성능 향상을 지속하고있다. GPU의 진화는 전체의 성능 인상과 동시에 인상 쉬운 부분의 강화의 조합으로 계속 될 것이다.



List of Articles
번호 제목 글쓴이 날짜 추천 수 조회 수
360 중저가형 데스크탑 조립 시 [구매 가이드] file 라이너스~ 2014-07-03   1269
359 삼성 850 Pro Series SSD 3D V-NAND 기술 그리고 리뷰 file 카라멜♥ 2014-07-03   1258
358 윈도우 8.1 UP2 출시 임박, 윈도우9 프리뷰 공개 임박!! file 평가단 2014-07-02   1139
357 잘만테크㈜, 그래픽카드 30만대 판매 기념 고객감사 이벤트 file 평가단 2014-07-02   864
356 다나와 2014 히트브랜드가 나왔네요 [3] 라이진 2014-07-01   797
355 2015년 2분기 스카이레이크, 브로드웰 동시 발매 예정... file 지앤지 2014-06-30   1266
354 엔비디아 노트북 그래픽카드 지포스 840M 정뷰 및 리뷰 file [1] 평가단 2014-05-26   6759
353 p54m-ga745 원랜디시즌2 2.3fix5 플레이 [3] 강백호 2014-05-26   2605
352 p54m-ga745 롤 플레이 [1] 강백호 2014-05-21   2162
351 p54m-ga745 구입 후기 강백호 2014-05-19   3117
350 스카이 레이크 메인보드를 비공개로 제조사들이 대거 출시했네요 file 김말이님 2015-07-22   1416
349 초보 조립PC 가이드] ① PC의 핵심, CPU·메인보드 선택법 file 라이너스~ 2015-07-20   1328
348 그래픽에 사용되는 메모리 얼마나 되는지 모르겠습니다. file [1] 김현철 2015-07-20   801
347 스카이레이크 출시일 8월 확정 file 김말이님 2015-07-19   955
346 4k(3840x2160)해상도 설정시 마우스가 느린현상 평가단 2015-07-15   914
345 샌디스크 SSD 최적화 툴 알파원 2015-07-12   1531
344 Core i7 완전 무소음 pc도 가능하군요 file 평가단 2015-07-10   1961
343 혹시 파워도 특성같은거 타나요? [1] 잭팟 2015-07-10   1020
342 고장 원인은 결국 보드 문제였습니다 [1] 잭팟 2015-07-10   645
341 듀얼 모니터 중 하나를 세워서 세로로 쓰고 싶은데요. [1] meic 2015-07-09   679
340 Serial ATA 3.0 연결 SSD에 비해 2 ~ 4 배 빠른 NVMe SSD (읽기 2300MB/s) file 김말이님 2015-07-08   1080
339 AMD A8-7600 내장그래픽 성능, 가성비의 제왕이네요 ㅋㅋ the.100 2015-07-07   2137
» CPU 코어와 공정 기술 전환을 추진 NVIDIA의 전략 file 김말이님 2015-07-07 1 702
337 예산과 용도에맞게 고르는 CPU 선택방법 file 김말이님 2015-07-07   1935
336 전원버튼의 비밀 file 라이너스~ 2015-07-06 7 747
서버에 요청 중입니다. 잠시만 기다려 주십시오...