더북(TheBook)

2.2.11 이미지 데이터

이미지는 전형적으로 높이, 너비, 컬러 채널의 3차원으로 이루어집니다. (MNIST 숫자처럼) 흑백 이미지는 하나의 컬러 채널만 가지고 있어 랭크-2 텐서로 저장될 수 있지만 관례상 이미지 텐서는 항상 랭크-3 텐서로 저장됩니다. 흑백 이미지의 경우 컬러 채널의 차원 크기는 1입니다. 256×256 크기의 흑백 이미지에 대한 128개의 배치는 (128, 256, 256, 1) 크기의 텐서에 저장될 수 있습니다. 컬러 이미지에 대한 128개의 배치라면 (128, 256, 256, 3) 크기의 텐서에 저장될 수 있습니다(그림 2-4).

▲ 그림 2-4 랭크-4 이미지 데이터 텐서(채널 우선 표기)13

이미지 텐서의 크기를 지정하는 방식은 두 가지입니다. (텐서플로에서 사용하는) 채널 마지막(channel-last) 방식과 많이 사용하지 않는14 채널 우선(channel-first) 방식입니다.

채널 마지막 방식은 (samples, height, width, color_depth)처럼 컬러 채널의 깊이를 끝에 놓습니다. 반면 채널 우선 방식은 (samples, color_depth, height, width)처럼 컬러 채널의 깊이를 배치 축 바로 뒤에 놓습니다. 채널 우선 방식을 사용하면 앞선 예는 (128, 1, 256, 256)(128, 3, 256, 256)이 됩니다. 케라스 API는 두 형식을 모두 지원합니다.15

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.