본문 바로가기

하드웨어(기기)에 관해 조금 더 심도 있는 이야기를 나누는 포럼 게시판입니다 (얼리어답터 성향이 강한 토론주제)

링크 : https://www.anandtech.com/show/7457/the-...-review/18 

계산

순수 컴퓨팅 성능으로 뛰어 들면 290X에 280X에 비해 몇 가지 새로운 요소가 영향을 미칩니다. 프론트 엔드 290X / 하와이는 280X / Tahiti의 2 ACE에 비해 8 ACE를 가지고 있기 때문에 290X가 더 많은 작업을 대기열에 올려 놓을 수 있으며 결과적으로 더 나은 결과를 유지할 수 있습니다. 실제로는 대부분의 작업 부하가 추가 ACE를 현시점에서 잘 사용할 수있을 것으로 기대하지는 않습니다. 한편 백엔드 290X는 11 %의 메모리 대역폭 향상과 L2 캐시에서 33 %의 증가를 보였습니다. L2 캐시의 계산 작업량은 전산 작업에 주로 사용될 수 있습니다. 반면에 290X는 280X에 비해 배정도 부동 소수점 (FP64) 속도에 큰 타격을 입습니다. 따라서 배정도 시나리오에서는 확실히 큰 핸디캡으로 진입 할 것입니다.

언제나 그렇듯이 DirectCompute 게임 예제 인 Civilization V는 DirectCompute를 사용하여 즉시 텍스처를 압축 해제합니다. Civ V는 게임의 리더 장면 중 하나에 필요한 텍스처를 반복적으로 압축 해제함으로써 텍스처 압축 해제 알고리즘의 속도를 독점적으로 테스트하는 하위 벤치 마크를 포함합니다. DirectCompute는 많은 게임에서 사용되지만 DirectCompute의 사용과 그 결과 성능을 격리 할 수있는 벤치 마크가있는 유일한 게임 중 하나입니다.

불행히도 Civ V는 우리가 CPU 병목 현상을 겪고 있다는 사실로 인해 많은 가치를 알 수 없습니다. 이 게임이 출시 된 이래로 3 년 동안 최고급 CPU는 코어 당 약 20 % 더 빠르지 만 GPU는 150 % 더 빠릅니다 (그 이상이 아니라면). 이와 같이 텍스처 디코딩의 GPU 부분은 분명히 CPU 부분을 앞 지르기 시작한 것으로 보입니다.하지만 이것은 여전히 ​​하이 엔드 비디오 카드보다 낮은 기준에 대한 벤치마킹입니다.

가치가있는 것을 위해, 290X는 GTX Titan에 떨어질 때까지 GTX 780을 여기에서 제외시킬 수 있습니다. 그러나 이러한 CPU 제한된 시나리오에서는 맨 위의 동작이 점점 일관성을 잃을 수 있습니다.

다음 벤치 마크는 SmallLuxGPU 2.0의 공식 벤치 마크 인 LuxMark2.0입니다. SmallLuxGPU는 대형 LuxRender 제품군의 일부인 OpenCL 가속 레이 트레이서입니다. 레이 트레이싱은 GPU 파이프 라인에 잘 맵핑되어있어 예술가가 CPU를 사용하는 것보다 훨씬 빠르게 장면을 렌더링 할 수 있기 때문에 최근 레이 트레이싱은 GPU의 거점이되었습니다.

비교에 의한 LuxMark는 매우 간단하고 매우 확장 성이 있습니다. 290X는 계산 자원이 크게 늘어 났으므로 290X는 280X가 다시 시작되어 AMD 차트를 한 번 더 상위로 끌어 올립니다. 대륙간 탄도탄은 간신히 여기에서 빠르다. 그리고 GTX 780은 심지어 더 한층 뒤로 물러 난다. 280X에서 290X 로의 확장이 CU 증가의 절반보다 적은 16 %에 불과하다는 사실이 처음에는 놀랍습니다. 벤치 마크의 상대적으로 단순한 특성에도 불구하고 과거에 메모리 대역폭을 갈망하는 신호를 보였으 나 분명히 그 당시의 것으로 보인다. CU에 새로운 광선을 공급하는 것은 290X의 320GB / sec 메모리 버스가 제공 할 수있는 모든 것을 취하여 280X 대 성능 향상을 제한 할 수 있습니다.

우리의 3 번째 컴퓨팅 벤치 마크는 OpenGL 및 OpenCL 비디오 편집 및 제작 패키지 인 Sony Vegas Pro 12입니다. Vegas는 GPU를 몇 가지 방법으로 사용할 수 있습니다. 주로 비디오 효과 및 합성 프로세스 자체를 가속화하고 비디오 인코딩 단계에서 사용합니다. 요즘 전용 비디오 신호가 전용 DSP로 전달되면서 편집 및 합성 프로세스에 중점을두고 낮은 CPU 오버 헤드 형식 (XDCAM EX)으로 렌더링됩니다. 이 특정 테스트는 Sony에서 제공되며 비디오를 렌더링하는 데 걸리는 시간을 측정합니다.

Vegas는 GPU 성능 향상이 CPU 성능 향상을 능가하는 또 다른 타이틀이며 이전 GPU 오프로드 작업이 한계에 도달하여 프로그램이 다시 CPU 제한을 받도록 유도했습니다. 라스베가스에서 훨씬 더 많은 정보를 얻으려면 다음에 큰 CPU 병목 현상을 없애야하므로 GPU는 역사적으로 비디오 인코딩과 달리 비디오 렌더링에 비해 미미한 수치입니다.

번째 벤치 마크 세트는 CLBenchmark 1.1에서 제공됩니다. CLBenchmark에는 여러 개의 하위 테스트가 있습니다. 우리는 그들 중 가장 실용적인 것, 컴퓨터 비전 테스트 및 유체 시뮬레이션 테스트에 초점을 맞추고 있습니다. 전자는 이미지를 파싱하고 피처 (예 : 사람)를 식별해야하는 컴퓨터 이미징 작업에 유용한 프록시이며 유체 시뮬레이션은 전문 그래픽 작업 및 게임에서 일반적입니다.

흥미롭게도 280X 이상의 290X 성능 이점은 특정 하위 테스트에 따라 다르다. 유체 시뮬레이션은 추가 CU로 충분하게 조정되지만 컴퓨터 비전 벤치 마크는 280X에 비해 진흙 속에 머물러 있습니다. 유체 시뮬레이션은 분명히 병렬 벤치 마크 워크로드 GPU의 탁월한 유형에 대한 비전 벤치 마크보다 훨씬 가깝지만 컴퓨터 비전의 스케일링 부족을 완전히 설명하지는 못합니다. 전문적인 컴퓨팅 작업 부하가 일반적으로 특정 대상 하드웨어에 대해 프로파일 링되고 최적화되는 이유를 상기시켜주는 것은 아무 것도 아닙니다. 복잡하고 상호 연결된 작업 부하에서 이러한 종류의 결과를 감소시키기 때문입니다.

계속해서, 우리의 5 번째계산 벤치 마크는 공식 Folding @ Home 벤치 마크 인 FAHBench입니다. Folding @ Home은 인터넷을 통해 수백만 명의 자원 봉사자 컴퓨터에 배포되는 인기있는 스탠포드 지원 연구 및 분산 컴퓨팅 이니셔티브입니다. 각 프로그램은 단백질 폴딩 시뮬레이션의 작은 조각을 담당합니다. FAHBench는 단 정밀도가 낮은 정밀도 성능으로 인해 대부분의 소비자 카드에 가장 유용한 지표가되는 단 정밀도 및 배정도 부동 소수점 성능을 모두 테스트 할 수 있습니다. 각 정밀도에는 명시 적 및 암시 적이라는 두 가지 모드가 있으며, 그 차이는 물 원자가 시뮬레이션에 포함되어 있는지 여부이며 이는 상당한 작업과 오버 헤드를 추가합니다. 이것은 Folding @ Home이 FAHCore 17로 올해 OpenCL로 독점적으로 옮겨 가면서 또 다른 OpenCL 테스트입니다.

FAHBench를 사용하면 280X / Tahiti와 반대로 290X / 하와이를 가장 잘 처리 할 수 ​​있다는 것을 충분히 확신 할 수 없습니다. 단 정밀도의 배율은 매우 뛰어나지 만 물이없는 (일반적으로 GPU가 제한된) 암시 적 시뮬레이션의 성능 회귀는 예상치 못한 결과입니다. 결론적으로 FAHCore 17에 대한 결과는 정확하지만, 290X가 발표 된 지금은 AMD 및 / 또는 FAH 프로젝트가 효과가 있다고 기대됩니다.

한편 배정도 성능은 회귀합니다.하지만 여기에는 왜 좋은 아이디어가 있습니다. 290X의 DP 성능이 280x의 ¼과 반대로 1/8 FP32 인 경우 벤치 마크 290X는 이길 수 없습니다. 우리가 두 가지 비디오 카드 사이에서 기대해야하는 이론상의 성능 차이를 고려해 볼 때, 290X는 280X의 FP 64 성능의 약 70 %를 차지합니다. 290X는 AMD의 최신 GPU에 비해 ​​82 %가 좋습니다. 그러나 GTX 780이 훨씬 가혹하게 다루어 지더라도 290X가 GTX 780을 잃는다는 사실을 알기가 어렵습니다. OpenCL 컴퓨팅 성능에서 AMD의 전통적인 강점이 보았을 때 그렇습니다.

마지막으로 계산 된 벤치 마크는 이안 커트 (Ian Cutress) 박사가 개발 한 사내 프로젝트입니다. SystemCompute은 C ++ 프로그램에서 GPU 컴퓨팅을 쉽게 사용할 수 있도록 Microsoft의 단순한 C ++ 확장을 활용 한 최초의 C ++ AMP 벤치 마크입니다. SystemCompute은이 이전 기사에서 설명한 바와 같이 여러 가지 기본 계산 알고리즘에 대한 벤치 마크 모음이며 최종 점수는 점으로 표시됩니다. DirectCompute는 Windows 용 C ++ AMP의 계산 백엔드이므로 다른 DirectCompute 테스트를 구성합니다.

SystemCompute와 기본 C ++ AMP 환경은 290X에서 제공되는 추가 CU와 비교적 잘 맞습니다. 290X는 GTX Titan 및 GTX 780을 쉽게 앞질렀을뿐만 아니라 280x를 18 % 앞선 반면 그렇습니다. 또는 AMD의 오래된 GPU를 비교의 기준으로 삼아 5870보다 3.4 배 향상된 CU 밀도 향상과 AMD가 GCN을 사용한 GPU 컴퓨팅 측면에서 실제로 어떻게 변화했는지에 대한 또 다른 알림 .

List of Articles
번호 제목 글쓴이 추천 수 최근 수정일 조회 수
인기글↑ 팁[Tip] pc 온도체크 하니 x로 뜨는데요.. file [1] 회원_31610855   2019-05-06 01:47 41
인기글↑ 정보/뉴스 인텔 공식 뉴스레터 _ 평행 우주 이슈 36 / No code changes necessary: Learn how to accelerate CPU training and inference execution file [2] 회원_28556359   2019-05-29 15:28 55
인기글↑ 정보/뉴스 SeaGate 공식 뉴스레터_ 귀하의 사업체는 IT4.0에 대비하고 있습니까? 2019-06-14 (금) 20:46 newfile [1] 회원_73685881   2019-06-16 16:37 10
845 정보/뉴스 코어 i9-9900XE. 14코어 5.1GHz file 회원_39211930   2019-04-15 01:35 32
844 정보/뉴스 유럽 그래픽카드 가성비, RX 570이 최고, 2080 Ti가 최저 file 회원_55024706   2019-04-04 00:20 59
843 정보/뉴스 인텔 Wi-Fi 6 AX200. 사이클론 피크 WLAN NIC file 회원_06866473   2019-04-04 00:20 52
842 정보/뉴스 SSD 컨트롤러 종류에 대해 알아보자 file 회원_89610480   2019-03-25 04:57 62
841 정보/뉴스 인텔 코멧 레이크, 10코어 데스크탑 프로세서 회원_38942687   2019-03-17 03:32 34
840 정보/뉴스 Tachyum의 64비트 프로세서, x86보다 강하고 ARM보다 작다 file 회원_97852622   2019-03-17 03:31 26
839 잡담/일반 글로벌 파운드리, 매각설 부인 [1] 회원_29385181   2019-05-18 19:15 27
838 정보/뉴스 아마존에서 가짜 코어 i5-9600K가 판매중 file 회원_74707278   2019-03-17 03:30 40
837 정보/뉴스 다음주 GTC에서 NVIDIA 7nm GPU에 HBM3 조합이 공개 회원_69817695   2019-03-17 03:30 22
836 팁[Tip] 중국에서 판매중인 이엠텍 GTX 1050 Ti file 회원_45835651   2019-03-17 03:30 30
835 정보/뉴스 미리보는 젠2 file 회원_54998648   2019-03-17 03:30 32
834 정보/뉴스 16TB 3D QLC 지원 SSD 컨트롤러, 실리콘 모션 SM2271 file 회원_82745667   2019-03-17 03:29 18
833 정보/뉴스 인텔의 4웨이 112코어 고밀도 컴퓨팅 시스템 최적화 file 회원_91945346   2019-03-17 03:29 16
832 정보/뉴스 구형 APU를 쓴 팬리스 미니 PC file 회원_11401127   2019-03-17 03:28 29
831 정보/뉴스 arm 맥을 위한 10/12코어 프로세서? file 회원_73806535   2019-03-17 03:29 17
830 정보/뉴스 인텔 메인보드 H110 칩셋용 사용가능한 CPU 리스트 회원_63464715   2019-03-15 00:25 20
829 정보/뉴스 배틀그라운드 끊김없는 PC 컴퓨터 옵션사양을 알아보자 회원_44572192 1 2019-03-15 00:22 104
828 정보/뉴스 그래픽카드 GTX 1060 6G 의 대안 RX 580 8G 에 대한 고찰 file 회원_18457693   2019-03-14 22:36 93
827 정보/뉴스 사타-ide 전원 변환 케이블을 오래 쓰면 안되는 이유 file 회원_43582183   2019-03-13 16:12 34
» 정보/뉴스 AMD Radeon R9 290X 리뷰 file 회원_39796279   2019-03-13 16:09 31
825 잡담/일반 AMD에선 인텔랜을 보기 쉽지 않네요. [1] 회원_45728879   2019-03-10 23:39 60
824 정보/뉴스 2019.03.06 21:45 삼성, 고속 비휘발성 메모리 eMRAM 양산 시작 file 회원_35052590   2019-03-07 00:26 27
823 정보/뉴스 인텔의 CPU에만 영향을 주는 새로운 보안 취약점 스포일러(Spoiler)가 발견됐습니다 file 회원_75922467   2019-03-07 00:22 53
822 정보/뉴스 ASUS WS C246M PRO/SE 메인보드 file 회원_18735360   2019-03-07 00:21 17
821 잡담/일반 9세대 제온 e3 es 정보 file 회원_16257415   2019-03-07 00:21 35
서버에 요청 중입니다. 잠시만 기다려 주십시오...