유틸리티 소개

정규표현식 그룹 캡처와 역참조 활용하기

괄호로 그룹을 만들면 매칭된 부분을 따로 추출하거나, 뒤에서 다시 참조할 수 있다. 강력한 기능이다.

그룹 캡처

([a-z]+)@([a-z]+).com 이 패턴에서 괄호 안이 그룹이다. 정규표현식 테스터에서 [email protected]을 매칭하면 그룹1은 test, 그룹2는 example이 된다.

역참조

([a-z]+)1 이 패턴은 같은 문자열이 두 번 반복되는 걸 찾는다. abcabc는 매칭되지만 abcdef는 안 된다. 1이 첫 번째 그룹을 참조한다.

치환에서 활용

이름 성 형식을 성 이름으로 바꾸고 싶다면? ([a-z]+) ([a-z]+)로 매칭하고 $2 $1로 치환하면 된다. 테스터의 치환 기능으로 해보자.

복잡한 패턴은 단계별로

긴 정규표현식을 한 번에 작성하려고 하면 실수하기 쉽다. 작은 부분부터 테스트하면서 점점 확장해나가는 게 좋다. 정규표현식 테스터에서 부분 패턴을 먼저 검증하고 합치자.

문서화의 중요성

복잡한 정규표현식은 나중에 보면 이해가 안 된다. 주석을 달거나 패턴이 무엇을 하는지 설명을 남겨두자. 특히 팀 프로젝트에서는 다른 사람도 이해할 수 있게 해야 한다.

성능 고려하기

정규표현식이 느릴 수 있다. 특히 백트래킹이 많은 패턴은 주의해야 한다. 가능한 구체적인 패턴을 쓰고, 너무 복잡해지면 다른 방법을 고려하자. 테스터로 다양한 입력에 대해 테스트해보자.

정규표현식 테스터에서 실시간으로 패턴을 테스트하고 결과를 확인하면서 학습하면 정규표현식 실력이 빠르게 늘어난다.