더북(TheBook)

데이터 로드 및 기본 정보 체크

본격적인 데이터 탐험을 위해 캐글 노트북 위에서 데이터를 로드하고 데이터셋의 행이 몇 개인지, 피처가 몇 개인지 등 기본 구조를 체크해봅시다. 컴페티션 페이지에서 노트북을 생성하면 대회 데이터셋은 자동으로 연결됩니다.

import numpy as np
import pandas as pd
import os
import seaborn as sns
import matplotlib.pyplot as plt
import warnings

warnings.filterwarnings(action="ignore")

DATA_PATH = "/kaggle/input/jigsaw-unintended-bias-in-toxicity-classification/"

>>> print(f"DATA_PATH 디렉터리 내 파일: ")
>>> print("\n".join(f_name for f_name in os.listdir(DATA_PATH)))
DATA_PATH 디렉터리 내 파일:  
sample_submission.csv
test.csv
train.csv
...
신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.