주민등록번호는 민감 정보라 가능하면 수집하지 않는 게 좋다. 꼭 필요하다면 형식 검증 정도만 하자.
기본 형식
^[0-9]{6}-[0-9]{7}$ 이건 6자리-7자리 형식만 본다. 정규표현식 테스터에서 형식 확인.
앞자리 범위
^([0-9]{2})(0[1-9]|1[0-2])(0[1-9]|[12][0-9]|3[01])-[1-4][0-9]{6}$ 이러면 생년월일 형식과 성별 코드도 어느 정도 검증한다.
주의사항
정규표현식은 형식만 본다. 실제 유효한 주민번호인지는 검증 알고리즘이 따로 있다. 그리고 주민번호 수집은 법적으로 제한되니 꼭 필요한 경우만 사용하자. 테스터로 형식만 확인하고, 실제 저장은 신중하게.
복잡한 패턴은 단계별로
긴 정규표현식을 한 번에 작성하려고 하면 실수하기 쉽다. 작은 부분부터 테스트하면서 점점 확장해나가는 게 좋다. 정규표현식 테스터에서 부분 패턴을 먼저 검증하고 합치자.
문서화의 중요성
복잡한 정규표현식은 나중에 보면 이해가 안 된다. 주석을 달거나 패턴이 무엇을 하는지 설명을 남겨두자. 특히 팀 프로젝트에서는 다른 사람도 이해할 수 있게 해야 한다.
성능 고려하기
정규표현식이 느릴 수 있다. 특히 백트래킹이 많은 패턴은 주의해야 한다. 가능한 구체적인 패턴을 쓰고, 너무 복잡해지면 다른 방법을 고려하자. 테스터로 다양한 입력에 대해 테스트해보자.
정규표현식 테스터를 적극 활용해서 다양한 패턴을 실험해보자. 실전 경험이 쌓일수록 정규표현식 작성이 수월해진다.