정규 표현식(Regex)이란?
정규 표현식(Regular Expression, RegExp)은 특정 문자열의 규칙을 정의하는 언어입니다. 텍스트에서 패턴을 검색하거나 치환할 때 주로 사용되며, 검색(Search)과 검증(Validation), 치환(Replace) 작업에서 매우 강력한 도구로 작동합니다.
대표적인 정규 표현식 패턴
\d
: 숫자 (0~9)\w
: 알파벳/숫자/언더스코어[a-z]
: 소문자 a부터 z^abc
: abc로 시작하는 문자열abc$
: abc로 끝나는 문자열.
: 임의의 문자 1개*
: 0개 이상의 반복+
: 1개 이상의 반복?
: 0개 또는 1개(...)
: 그룹
예:
-
-
-
\d3-\d4
는 123-4567처럼 3자리 숫자-4자리 숫자 패턴을 의미합니다.-
[A-Z]2\d+
는 AB123처럼 대문자 2개 + 숫자 패턴을 찾습니다.실제 활용 패턴
활용 예시
- 프로그래밍 - 이메일/비밀번호 검증, 로그 파싱, 코드 리팩토링
- 웹 개발 - 폼 유효성 검사, 스팸 필터링
- 데이터 분석 - 로그 데이터 전처리, 텍스트 마이닝
- 오피스 자동화 - 엑셀의
REGEXMATCH
,REGEXREPLACE
함수 - 마케팅/CRM - 이메일 도메인 필터링, 이름 정규화