더북(TheBook)

넓은 도달률 때문에 모델이 기대하는 데이터 종류가 웹 브라우저에서 사용할 수 있는 한 웹 브라우저는 딥러닝 모델을 배포하기 위한 합리적인 선택입니다. 어떤 종류의 데이터를 웹 브라우저에서 사용할 수 있을까요? 이에 대한 대답은 “많다”입니다. 딥러닝에서 가장 인기 있는 애플리케이션인 이미지와 비디오에서 물체를 분류하거나 감지하기, 음성을 텍스트로 바꾸기, 언어 번역, 텍스트 콘텐츠 분석을 예로 들어 보죠. 웹 브라우저는 텍스트, 이미지, 오디오, 비디오 데이터를 표시하기 위한 (그리고 사용자 허락이 있다면 캡처를 위한) 가장 광범위한 기술과 API를 가지고 있습니다. 결과적으로 TensorFlow.js와 간단한 변환 과정을 거쳐 강력한 머신 러닝 모델을 브라우저에서 바로 사용할 수 있습니다. 책의 이후 장에서 브라우저에 딥러닝 모델을 배포하는 구체적인 예를 다루겠습니다. 예를 들어 웹캠에서 이미지를 캡처한 다음 TensorFlow.js를 사용해 MobileNet을 실행함으로써 물체에 레이블을 부여하고, YOLO2를 실행하여 감지된 물체 주변에 바운딩 박스(bounding box)를 그리고, Lipnet을 실행하여 입 모양을 읽거나 또는 CNN-LSTM 신경망을 실행하여 이미지에 캡션을 달 수 있습니다.

브라우저의 WebAudio API를 사용해 마이크에서 오디오를 캡처하면 TensorFlow.js 모델을 실행하여 실시간 음성 인식을 수행할 수 있습니다. 영화 리뷰처럼 사용자가 입력한 텍스트에 감성 점수를 매기는 것과 같이 텍스트 데이터를 사용하는 흥미로운 애플리케이션도 있습니다(9장). 이런 데이터 형태 외에도 최신 웹 브라우저는 모바일 디바이스의 다양한 센서를 활용할 수 있습니다. 예를 들어 HTML5는 지리 위치(위도 및 경도), 모션(디바이스 방향과 가속도), 주변광을 위한 API를 제공합니다(http://mobilehtml5.org 참조). 딥러닝과 다양한 데이터 유형을 결합해 생각해 보면 이런 센서에서 얻은 데이터는 흥미롭고 새로운 많은 애플리케이션을 가능하게 만듭니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.