24.11 정규식
모든 프로그래밍 언어는 정규식(regular expression)을 지원합니다. 정규식은 간단히 말해 문자열에서 특정 패턴을 찾아 주는 기능입니다. 정규식은 따로 설명하지 않고 예제를 2개 정도 작성한 후 실행하는 형태로 넘어가겠습니다.
정규식으로 공백 여러 개를 하나로 변경하기
정규식을 사용하여 공백 여러 개를 하나로 치환하는 내용은 다음 소스 코드처럼 Regex 클래스의 힘을 빌려 손쉽게 구현 가능합니다. 다음 내용을 입력한 후 실행해 보세요.
공백 여러 개를 하나로 변경: RegexReplace.cs
using System; using System.Text.RegularExpressions; class RegexReplace { static void Main() { string s = "안녕하세요. 반갑습니다. 또 만나요."; var regex = new Regex("\\s+"); //하나 이상의 공백 패턴 검사 string r = regex.Replace(s, " "); //하나 이상의 공백을 공백 하나로 변환 Console.WriteLine(s); Console.WriteLine(r); } }
실행 결과
안녕하세요. 반갑습니다. 또 만나요. 안녕하세요. 반갑습니다. 또 만나요.
Regex 클래스의 생성자에 전달된 \s 기호는 공백 문자를 의미합니다. 즉, 하나 이상의 공백 문자를 검사해서 공백 하나로 변환하는 코드입니다.