딥러닝 텐서플로 교과서: 10.2.2 버트

① (input_word_ids, input_mask, input_segment_ids)를 입력으로 사용하는 버트 계층을 생성합니다. outputs=[pooled_output, outputs=output])

ⓐ 토큰 ID: 버트 토크나이저의 토큰 ID입니다.

ⓑ 마스크 ID: 패딩 토큰 구분을 위한 ID입니다. 즉, 시퀀스마다 동일한 길이를 갖도록 패딩(0)을 붙여 줍니다.

- 두 문장을 입력하는 경우

[CLS] The man went to the store. [SEP] He bought a gallon of milk. [SEP]

- 한 문장을 입력하는 경우

[CLS] The man went to the store. [SEP]

신간 소식 구독하기

뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.