더북(TheBook)

7.4.5 TFRecord

TFRecord는 텐서플로에서 지원하는 데이터셋 형태 중 하나로 이진(Binary) 데이터 형태로 저장된다는 특징이 있습니다. 간단히 설명하면, 컴퓨터상에 있는 모든 데이터는 본디 0, 1로 이루어진 이진 데이터로 구성되어 있습니다. 이진 표현식은 보통 사람이 읽기가 어려우므로 우리가 일반적으로 보는 데이터는 이해하기 쉬운 형태인 정수(Int), 부동소수(Float), 텍스트(String), 이미지(Image) 등의 형태로 표현되어 나타납니다. 다만 컴퓨터 입장에서는 0, 1로 표시된 형태가 더 친숙하기 때문에 계산 효율을 위해 이진 데이터 형태로 저장해두기 위한 목적으로 TFRecord 형태를 사용한다고 이해하면 됩니다.

텐서플로는 TPU에 넣을 데이터 포맷을 이 TFRecord 형태로 사용할 것을 권장하고 있습니다.9 아무래도 TPU 같이 빠른 속도의 연산 장치는 그에 걸맞은 빠른 데이터 프로세싱이 필요하기 때문이 아닐까 생각합니다. 계산기의 성능이 아무리 빨라도, 숫자를 누르는 손이 느리면 계산이 느려질 수밖에 없는 것처럼요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.