1.3.1 하드웨어
시중에 판매되는 CPU는 1990년과 2010년 사이에 거의 5,000배가 빨라졌습니다. 그 덕에 요즘에는 노트북에서도 작은 딥러닝 모델을 실행시킬 수 있습니다. 25년 전이라면 현실적으로 불가능했던 일입니다.
하지만 컴퓨터 비전이나 음성 인식에서 사용되는 일반적인 딥러닝 모델들은 노트북보다 10배의 계산 능력이 필요합니다. 2000년대에 NVIDIA와 AMD 같은 회사들이 실사와 같은 비디오 게임의 그래픽 성능을 높이기 위해 대용량 고속 병렬 칩(그래픽 처리 장치(GPU))을 개발하는 데 수십억 달러를 투자해 왔습니다. 이런 칩은 복잡한 3D 장면을 실시간으로 화면에 그리려는 목적으로만 설계된 저렴한 슈퍼컴퓨터와 같습니다. 2007년 NVIDIA가 자사의 GPU 제품을 위한 프로그래밍 인터페이스인 CUDA(https://developer.nvidia.com/about-cuda)를 출시하면서 과학 커뮤니티가 이런 투자의 혜택을 보게 되었습니다. 물리 모델링을 시작으로 다양한 병렬 애플리케이션의 대형 CPU 클러스터가 소량의 GPU로 대체되기 시작했습니다. 대부분 많은 수의 간단한 행렬 곱셈으로 구성된 심층 신경망도 높은 수준으로 병렬화가 가능합니다. 2011년 즈음에 댄 크리슨18과 알렉스 크리체브스키19 등 일부 연구자들이 CUDA를 사용한 신경망 구현을 만들기 시작했습니다.
게임 시장이 차세대 인공 지능 애플리케이션을 위한 슈퍼컴퓨팅에 투자를 한 셈입니다. 이처럼 이따금 엄청난 일들이 게임에서 시작되곤 합니다. 2019년 말 시세로 2,500달러짜리 게임용 GPU인 NVIDIA TITAN RTX는 16테라플롭스(teraFLOPS)의 단정도 연산 성능을 제공합니다(초당 16조 개의 float32 연산). 이는 1990년 가장 빠른 슈퍼컴퓨터인 인텔(Intel)의 터치스톤 델타(Touchstone Delta)보다 500배 높은 컴퓨터 성능입니다. TITAN RTX를 사용하면 2012년이나 2013년경에 ILSVRC 대회에서 우승했던 ImageNet 모델을 몇 시간 만에 훈련시킬 수 있습니다. 한편 큰 회사들은 GPU 수백 개로 구성된 클러스터에서 딥러닝 모델을 훈련시킵니다.