더북(TheBook)

10장

 

1 이 데이터셋은 제임스 매슈 배리(James Matthew Barrie)의 <피터팬> 무료 이북 텍스트입니다(https://www.gutenberg.org/files/16/16-h/16-h.htm).

 

2 내려받은 wiki.co.vec 파일(약 2GByte)은 chap10의 data 폴더 아래에 넣어 주세요. bin+txt 형태의 압축 파일(약 4GByte)을 내려받았다면 압축을 해제한 후 wiki.co.vec 파일만 data 폴더 안에 넣어 주면 됩니다.

 

3 단어 표현을 위한 글로벌 벡터입니다. https://nlp.stanford.edu/projects/glove/에서 제공하는 데이터셋으로, 해당 URL에서 glove.6B.zip을 내려받아 압축을 해제해서 사용합니다. 또는 길벗출판사의 깃허브(https://github.com/gilbutITbook/080289) 첫 페이지의 URL을 클릭해도 내려받을 수 있습니다. 준비된 파일은 data 폴더에 넣어 주세요.

 

4 튜닝은 하이퍼파라미터 값을 미세하게 조정하는 과정으로 미세 조정이라고도 합니다. 또한, 튜닝하는 학습 과정을 전이 학습(transfer learning)이라고도 합니다.

 

5 설치 후 주피터 노트북에서 오류 발생 시 커널을 재시작한 후 다시 실행해 주세요.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.