① (input_word_ids, input_mask, input_segment_ids)를 입력으로 사용하는 버트 계층을 생성합니다. outputs=[pooled_output, outputs=output])
ⓐ 토큰 ID: 버트 토크나이저의 토큰 ID입니다.
ⓑ 마스크 ID: 패딩 토큰 구분을 위한 ID입니다. 즉, 시퀀스마다 동일한 길이를 갖도록 패딩(0)을 붙여 줍니다.
ⓒ 세그먼트 ID: 문장을 구분하는 ID입니다. 한 문장의 시퀀스라면 0, 시퀀스에 문장이 두 개 있으면서 두 번째 문장이라면 1을 표현합니다.
- 두 문장을 입력하는 경우
[CLS] The man went to the store. [SEP] He bought a gallon of milk. [SEP]
- 한 문장을 입력하는 경우
[CLS] The man went to the store. [SEP]