더북(TheBook)

① (input_word_ids, input_mask, input_segment_ids)를 입력으로 사용하는 버트 계층을 생성합니다. outputs=[pooled_output, outputs=output])

ⓐ 토큰 ID: 버트 토크나이저의 토큰 ID입니다.

ⓑ 마스크 ID: 패딩 토큰 구분을 위한 ID입니다. 즉, 시퀀스마다 동일한 길이를 갖도록 패딩(0)을 붙여 줍니다.

ⓒ 세그먼트 ID: 문장을 구분하는 ID입니다. 한 문장의 시퀀스라면 0, 시퀀스에 문장이 두 개 있으면서 두 번째 문장이라면 1을 표현합니다.

- 두 문장을 입력하는 경우

[CLS] The man went to the store. [SEP] He bought a gallon of milk. [SEP]

- 한 문장을 입력하는 경우

[CLS] The man went to the store. [SEP]

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.