더북(TheBook)

문학 작품 및 도서: 문학 작품이나 도서도 중요한 데이터 소스가 될 수 있습니다. 이들은 문체와 어휘가 풍부해 모델의 언어 생성 능력을 향상시킬 수 있습니다. 문학 작품 및 도서 데이터는 저작권이 만료되어 퍼블릭 도메인에 속하는 작품들이 대표적입니다. 예를 들어 고전 문학 작품(셰익스피어, 마크 트웨인, 톨스토이 등의 작품)은 저작권이 만료되어 자유롭게 사용할 수 있습니다. 구텐베르크 프로젝트(Project Gutenberg)와 같은 사이트에서 다양한 언어와 장르의 퍼블릭 도메인 작품을 무료로 제공합니다.

출판사나 디지털 도서 플랫폼( Google Books, Amazon Kindle)과 협력해 라이선스를 구매하거나 허가받아 사용할 수도 있습니다. 다만, 이 경우에는 비용을 지불해야 하거나 법적 계약에 따른 제한 사항이 있을 수 있습니다.

문학 작품과 도서 데이터는 저작권 문제가 특히 중요하므로 퍼블릭 도메인이나 오픈 액세스 자료를 활용하고, 저작권이 있는 작품은 반드시 라이선스를 취득한 후 사용해야 합니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.