ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 가성비 최고의 딥러닝용 지포스 GPU RTX 2080 Ti AI
    하드웨어/GPU 2020. 3. 12. 19:03

    딥러닝을 처음 배울 때 보통 MNIST 예제를 합니다. 조금 더 하면 CIFAR10 정도 해보죠.
    이런 데이터셋을 가지고 딥러닝 트레이닝을 실행할 때는 그다지 고성능 컴퓨터가 없어도 할 만합니다.
    MNIST 같은 경우 CPU에서 돌려도 몇 분 안걸리고 인식 정확도도 쉽게 98%이상 나옵니다.
    여기까지 해보면 꽃 길만 있을 것 같은 생각이 듭니다.
    그러나 막상 내가 원하는 데이터를 가지고 본격적으로 딥러닝 트레이닝을 할려고 하면 상황이 많이 달라집니다.
    MINST 데이터셋은 이미지 사이즈가 28x28인 흑백 이미지로 데이터와 연산량이 미미한 수준입니다.

    이미지 사이즈가 몇백 x 몇백 만 되어도 웬만한 트레이닝은 몇 시간씩 혹은 몇 일씩 걸립니다.
    게다가 GPU 달기만 한다고 알아서 텐서플로가 잘 돌지도 않습니다.
    GPU를 달고 프레임워크를 설정하고 에러 잡고 하면서 대부분의 시간을 보냅니다.
    고난 시작이죠!
    모든 문제를 미리 예방하거나 쉽게 해결할 수는 없겠지만 하나씩 지식을 쌓아가고 필요한 정보를 정리해 봅시다.
    우선 GPU하나를 소개하려고 합니다.
    좋은 자료는 이미 https://deepcell.co.kr/104 에 올렸으니 참고하시면 좋을 것 같습니다.
    여기서는 하나의 GPU를 소개하려고 합니다.
    정리해서 말하면 가성비 좋은 딥러닝 용 GPU라고 할 수 있습니다.
    정확히 말하면 게임용 그래픽 카드입니다.
    딥러닝 전용으로 나온 엔비디아의 GPU는 대표적으로 테슬라와 타이탄입니다.
    이 제품들이 좋은 것은 알겠는데 문제는 가격입니다.
    고성능 테슬라 GPU카드는 한장의 가격이 거의 천만원 가까이 가고 있읍니다. 그나마 서버용이라서 일반 PC나 워크스테이션에서는 사용할 수도 없습니다.
    그나마 타이탄이 좋기는 한데 그 것도 가격이 3백만원을 훌적 넘어 갑니다.
    그보다 낮은 가격의 후보들을 찾을려면 지포스 밖에는 없습니다. 지포스는 엔비디아의 제품 군에서 게임용입니다. 
    하지만 성능은 딥러닝을 하는데 꽤나 좋습니다. 메모리가 적은 것이 타이탄이나 테슬라와의 큰 차이점이고 연산 코어의 수나 클럭 속도는 크게 차이 나지는 않습니다.
    아마 안정성과 발열 면에서는 차이가 날 것 같습니다.
    결국 가성비를 찾다보면 지포스가 유일한 대안 같은데 게임용 지포스 카드를 딥러닝에 사용하는 것에 대해 약간의 찜찜함이 생김니다.
    안정성과 발열에 대한 걱정입니다. 디러닝용 시스템은 안정적으로 오래동안 작동해야 하고 신뢰도가 높하야 합니다.
    이러한 찜찜함을 조금은 덜어 줄만한 제품이 있습니다.

    Leadtek사에서 나온 RTX 2080 Ti AI 모델입니다.
    Leadtek사는 대만 회사로, 엔비디아의 전문 GPU제품을 OEM 공급하는 GPU 카드 제조의 명가입니다.
    실제 전문가용 테슬라, 타이탄, 쿼드로를 제조하는 그 회사입니다.

    이 Leadtek에서 AI 딥러닝 용으로 패키징하여 나온 최고 성능의 지포스 제품이 RTX 2080 Ti AI입니다.

    사양을 요약해보면

    GPU 칩 : 튜링 아키텍처
    연산 코어 : 4352 CUDA core
    메모리 : 11GB GDDR6 Memory
    속도 : Base clock 1350 MHz

    기본은 게임용 RTX 2080 Ti 유사하지만 Leadtek에서 딥러닝 용으로 패키징한 것으로 대부분의 워크 스테이션과 서버에 장착하여 사용할 수 있습니다.

    구입 문의 : (주)스타셀 전화 02-540-7853, sales@starcell.co.kr

    문의 사항 환영 합니다.

    <상세 사양>

    GPU NVIDIA GeForce® RTX 2080 Ti
    Graphics Bus PCI Express 3.0
    Memory size 11G GDDR6
    Core clock Base clock: 1350 MHz
    Boost clock: 1545 MHz
    Memory clock 14 Gbps
    Output 1x HDMI, 3 x DisplayPort, 1xUSB TYPE-C
    Maximum Digital Resolution 7680x4320(4k 12-bit HDR at 144Hz or 8k 12-bit HDR at 60Hz over one DisplayPort 1.4 connector (with DSC).)
    Memory Interface 352-bit
    Memory Bandwidth (GB/sec)  616
    CUDA Cores 4352
    HDCP support Yes
    Full Microsoft® DirectX®12.0 API
    NVIDIA® 3D Vision™ Ready, 3D Vision Surround, Ray Tracing
    Built for Windows 7 64-bit,Windows 10 64-bit and Linux 64-bit
    HDMI2.0,DisPlay 1.4 Support
    NVIDIA RTX NVLink Support
    OpenGL® 4.5 Support

    댓글 0

Starcell Inc. all right reserved