GPU
-
가성비 최고의 딥러닝용 지포스 GPU RTX 2080 Ti AI하드웨어/GPU 2020. 3. 12. 19:03
딥러닝을 처음 배울 때 보통 MNIST 예제를 합니다. 조금 더 하면 CIFAR10 정도 해보죠. 이런 데이터셋을 가지고 딥러닝 트레이닝을 실행할 때는 그다지 고성능 컴퓨터가 없어도 할 만합니다. MNIST 같은 경우 CPU에서 돌려도 몇 분 안걸리고 인식 정확도도 쉽게 98%이상 나옵니다. 여기까지 해보면 꽃 길만 있을 것 같은 생각이 듭니다. 그러나 막상 내가 원하는 데이터를 가지고 본격적으로 딥러닝 트레이닝을 할려고 하면 상황이 많이 달라집니다. MINST 데이터셋은 이미지 사이즈가 28x28인 흑백 이미지로 데이터와 연산량이 미미한 수준입니다. 이미지 사이즈가 몇백 x 몇백 만 되어도 웬만한 트레이닝은 몇 시간씩 혹은 몇 일씩 걸립니다. 게다가 GPU 달기만 한다고 알아서 텐서플로가 잘 돌지도 않..
-
2020년 딥러닝에 가장 좋은 GPU를 골라 봅시다.하드웨어/GPU 2020. 3. 11. 18:59
딥러닝을 본격적으로 하게 되면 GPU 때문에 많은 고민과 고생을 하게 됩니다. 그 중 가장 먼저 하게 되는 고민이 어떤 GPU를 선택할 것이냐입니다. 어떤 GPU를 선택하는 것이 좋을 지 고민할 때 필요한 좋은 비교 자료가 아래에 있습니다.(2020년 2월 자료를 정리) Choosing the Best GPU for Deep Learning in 2020 Choosing the Best GPU for Deep Learning in 2020 This blog summarizes our GPU benchmark for training State of the Art (SOTA) deep learning models. We measure each GPU's performance by batch capacity ..
-
TensorFlow GPU Memory error - 절대적으로 GPU 메모리가 부족할 때 나는 에러인공지능(AI)/TensorFlow 2020. 3. 9. 18:02
이미지 사이즈가 큰 데이터로 딥러닝 트레이닝을 하려고 했는데 에러가 나고 안됐다. 절대적으로 GPU 메모리가 부족하다고 결론을 내렸다. 배치 사이즈가 1이므로 배치 크기를 더 줄일 수도 없었다. 이미지 크기를 잘게 잘라서 했더니 실행이 되었다. 아래와 같은 에러 메시지가 나왔었다. 에러 로그 메시지 일부------------------------------------------------------------- 아래처럼 별 에러 없이 메모리를 계속 할당하다가 결국 메모리가 부족해서 에러가 난다고 말하는 것 같은 메시지가 보였다. 2020-02-19 00:42:50.537629: I tensorflow/core/common_runtime/bfc_allocator.cc:674] 2 Chunks of size..
-
TensorFlow GPU Memory error인공지능(AI)/TensorFlow 2020. 3. 9. 17:55
텐서플로우를 이용하여 GPU에서 트레이닝이나 추론을 할 때 메모리 에러를 만났다. 매 번 어려움을 겪어서 조금 정리해 본다. 에러 환경 : TensorFlow, GPU, CNN 을 조합으로 사용할 때 매 번 에러를 만났던 것 같다. 원인은 대부분 Out Of Memory 문제 였던 것 같은 데, 아래 링크에 비교적 잘 정리가 되어 있으니 참고. https://datamasters.co.kr/33 https://goodtogreate.tistory.com/entry/TensorFlow%EB%A5%BC-%EA%B3%B5%EC%9A%A9-GPU%EC%97%90%EC%84%9C-%EC%82%AC%EC%9A%A9-%ED%95%A0-%EB%95%8C-%EB%A9%94%EB%AA%A8%EB%A6%AC-%EC%A0%8..
-
TensorFlow Error 2020/02/20인공지능(AI)/TensorFlow 2020. 2. 20. 18:07
TensorFlow를 GPU에서 사용할 때 그리고 CNN을 사용할 때 에러가 많이 납니다. 오늘도 하나 에러가 나서 고생 좀 했습니다. 2020-02-20 17:11:38.802615: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcublas.so.10.0 2020-02-20 17:11:38.945746: I tensorflow/stream_executor/platform/default/dso_loader.cc:42] Successfully opened dynamic library libcudnn.so.7 2020-02-20 17:11:39.211419: E tens..
-
TensorFlow Error 2020/02/19인공지능(AI)/TensorFlow 2020. 2. 19. 18:21
TensorFlow를 사용하다 보면 이래저래 에러를 만나게 된다. 내가 만난 에러들을 생각나는 대로 정리해 본다. 1) 가장 많은 것이 GPU 관련 에러인 것 같다. cnn을 사용하는 경우 CPU 버전에서는 잘 돌던 코드가 GPU 버전에서는 안돈다. -> version이 1.x 인 경우 아래를 추가 한다. config = tf.ConfigProto() config.gpu_options.allow_growth = True 2) GPU 메모리가 부족할 때 다음과 같은 에러가 발생한다.(실제 로그는 매우 길다. 관련 있는 것으로 짐작되는 라인이 아래와 같다.) Resource exhausted: OOM when allocating tensor wi th shape[64,67,67,1024] and type f..
-
환영합니다!스타셀(starcell)/공지 2019. 6. 17. 14:02
스타셀의 새로운 블로그를 이용해 주세요. starcell.github.io 새롭고 유익한 자료들을 제공하겠습니다. (주)스타셀에서 운영하는 인공지능(AI) 블로그입니다. 인공지능(AI), 딥러닝(Deep Learning)을 위한 전문시스템(GPU, PC, Server등) 문의는 전화 : 02-540-0880, 이메일 : sales@starcell.co.kr으로 연락 바랍니다. 인공지능(AI), 기계학습(Machine Learning), 심층학습(Deep Learning), Big Data, Data Science 등등의 기술에 대한 이야기와 이들을 운영하기 위한 서버 인프라 관련된 기술들, 그리고 Docker Container, Kubernetes와 관련된 가상화 관련 기술에 대한 이야기를 담은 블로그입..