더북(TheBook)

연습문제 14-3

MP3 파일을 많이 모았다면 같은 곡이 두 개 이상 있을 수도 있고, 다른 디렉터리에 저장되어 있거나 다른 파일 이름으로 저장되어 있을 수도 있다. 이 연습 문제의 목적은 중복 파일을 검색하는 것이다.

1. 디렉터리와 모든 하위 디렉터리를 재귀적으로 검색해서 지정된 접미어(예 .mp3)를 갖는 모든 파일에 대한 전체 경로를 리스트로 반환하는 프로그램을 작성하라. 힌트: os.path에는 파일과 경로 이름을 조작하는 유용한 함수들이 제공된다.

2. 중복을 알아내기 위해 각 파일의 체크섬 계산에 md5sum을 사용할 수 있다. 두 파일의 체크섬이 같다면 두 파일의 내용이 같을 가능성이 있다.

3. 이중 검사를 위해 유닉스 명령어인 diff를 사용할 수 있다.

해법: http://thinkpython2.com/code/find_duplicates.py

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.