위의 코드는 간략하게 한 줄로 사용할 수 있다.
X_train, X_test, y_train, y_test = X[ :split ], X[ split: ], y[ :split ], y[ split: ]
=을 중심으로 오른쪽의 값을 순서에 맞게 왼쪽 변수로 할당하는 파이썬의 문법이다.
X[ :split ], X[ split: ], Y[ :split ],Y[ split: ] 코드는 리스트, 튜플, 문자열 같은 데이터 객체에서 범위를 지정하고 일부 데이터를 선택해 가져오는 방법 또는 표기법이다. 이를 슬라이싱(slicing) 또는 슬라이스(slice)라고 한다.
가령 D라는 객체가 있다면 다음과 같은 형식으로 사용할 수 있다.
D[ start : end : step ]
- start: 슬라이싱 시작 위치
- end: 슬라이싱 종료 위치. end 직전까지 슬라이싱한다.
- step: 몇 개씩 끊어서 가져올 것인지를 지정한다.
- start, end, step 모두 양수와 음수를 가질 수 있다. 여기서 양수는 데이터의 정방향을 의미하고, 음수는 반대 방향을 의미한다.
▲ 그림 7-16 양수 인덱스와 음수 인덱스
따라서 split 값이 10이라면 슬라이싱의 결과는 다음과 같다.
- X[ :split ]은 X의 0~9번 인덱스까지의 데이터
- X[ split: ]은 X의 9번부터 마지막 인덱스까지의 데이터
- Y[ :split ]은 Y의 0~9번 인덱스까지의 데이터
- Y[ split: ]은 Y의 9번부터 마지막 인덱스까지의 데이터