더북(TheBook)

24.11 정규식

모든 프로그래밍 언어는 정규식(regular expression)을 지원합니다. 정규식은 간단히 말해 문자열에서 특정 패턴을 찾아 주는 기능입니다. 정규식은 따로 설명하지 않고 예제를 2개 정도 작성한 후 실행하는 형태로 넘어가겠습니다.

 

정규식으로 공백 여러 개를 하나로 변경하기

정규식을 사용하여 공백 여러 개를 하나로 치환하는 내용은 다음 소스 코드처럼 Regex 클래스의 힘을 빌려 손쉽게 구현 가능합니다. 다음 내용을 입력한 후 실행해 보세요.

공백 여러 개를 하나로 변경: RegexReplace.cs

using System;
using System.Text.RegularExpressions;

class RegexReplace
{
    static void Main()
    {
        string s = "안녕하세요. 반갑습니다. 또 만나요.";
        var regex = new Regex("\\s+");  //하나 이상의 공백 패턴 검사
        string r = regex.Replace(s, " "); //하나 이상의 공백을 공백 하나로 변환
        Console.WriteLine(s);
        Console.WriteLine(r);
    }
}

실행 결과

안녕하세요. 반갑습니다. 또 만나요.
안녕하세요. 반갑습니다. 또 만나요.

Regex 클래스의 생성자에 전달된 \s 기호는 공백 문자를 의미합니다. 즉, 하나 이상의 공백 문자를 검사해서 공백 하나로 변환하는 코드입니다.

신간 소식 구독하기
뉴스레터에 가입하시고 이메일로 신간 소식을 받아 보세요.