표현식

표현식

 설명 

 ^

 문자열의 시작

 문자열의 종료

.

 임의의 한 문자 (문자의 종류 가리지 않음)

 , \ 는 넣을 수 없음

 *

 앞 문자가 없을 수도 무한정 많을 수도 있음

 앞 문자가 하나 이상

 앞 문자가 없거나 하나있음

 [ ]

 문자의 집합이나 범위를 나타내며 두 문자 사이는 - 기호로 범위를 나타낸다. []내에서 ^가 선행하여 존재하면 not 을 나타낸다.

 { }

 횟수 또는 범위를 나타낸다.

 ( )

 소괄호 안의 문자를 하나의 문자로 인식 

 |

 패턴 안에서 or 연산을 수행할 때 사용

 \s

 공백 문자

 \S

 공백 문자가 아닌 나머지 문자

 \w

 알파벳이나 숫자

\W 

 알파벳이나 숫자를 제외한 문자

\d 

 숫자 [0-9]와 동일

\D 

 숫자를 제외한 모든 문자

 정규표현식 역슬래시(\)는 확장 문자
 역슬래시 다음에 일반 문자가 오면 특수문자로 취급하고 역슬래시 다음에 특수문자가 오면 그 문자 자체를 의미

(?i) 

 앞 부분에 (?i) 라는 옵션을 넣어주면 대소문자를 구분하지 않음

 

1) 숫자만 : ^[0-9]*$

2) 영문자만 : ^[a-zA-Z]*$

3) 한글만 : ^[-]*$

4) 영어 & 숫자만 : ^[a-zA-Z0-9]*$

5) E-Mail : ^[a-zA-Z0-9]+@[a-zA-Z0-9]+$

6) 휴대폰 : ^01(?:0|1|[6-9]) - (?:\d{3}|\d{4}) - \d{4}$

7) 일반전화 : ^\d{2.3} - \d{3,4} - \d{4}$

8) 주민등록번호 : \d{6} \- [1-4]\d{6}

9) IP 주소 : ([0-9]{1,3}) \. ([0-9]{1,3}) \. ([0-9]{1,3}) \. ([0-9]{1,3})

 

특수 문자 자체를 검색하기 및 사용하기



\^

^

\.

.

\[

[

\$

$

\(

(

\)

)

\|

|

\*

*

\+

+

\?

?

\{

{

\\

\

\n

줄넘김 문자

\r

리턴 문자

\w

알파벳과 _ (언더바)

\W

알파벳과 _ 가 아닌 것

\s

빈 공간(space)

\S

빈 공간이 아닌 것

\d

숫자

\D

숫자가 아닌 것

\b

단어와 단어 사이의 경계

\B

단어 사이의 경계가 아닌 것

\t

Tab 문자

\xnn

16진수 nn에 해당하는 문자


※ [ ] 안에서는 특수 문자가 모두 효력을 잃게 됩니다.

 

참조 :

http://highcode.tistory.com/6

http://lng1982.tistory.com/141

http://iamnotokay.tistory.com/85 [I am not Okay]



'Programming > 정규표현식' 카테고리의 다른 글

정규 표현식이란?  (0) 2017.05.07

정규 표현식

특정한 규칙을 가진 문자열의 집합을 표현하는 데 사용하는 형식 언어이다. 정규 표현식은 많은 텍스트 편집기와 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있다.

컴퓨터 과학의 정규언어로부터 유래하였으나 구현체에 따라서 정규 언어보다 더 넓은 언어를 표현할 수 있는 경우도 있으며, 심지어 정규 표현식 자체의 문법도 여러 가지 존재하고 있다. 수많은 프로그래밍 언어가 정규 표현식 기능을 제공하고 있으며, 일부는 펄, 자바스크립트, 루비, Tcl처럼 기본 내장되어 있는 반면 닷넷 언어, 자바, 파이썬, POSIX C, C++ (C++11 이후)에서는 표준 라이브러리를 이용하여 구현한다. 그 밖의 대부분의 언어들은 라이브러리를 통해 정규식을 제공한다.


기본 개념

주로 패턴(pattern)으로 부르는 정규 표현식은 특정 목적을 위해 필요한 문자열 집합을 지정하기 위해 쓰이는 식이다.

"또는"

수직선은 여러 항목 중 선택을 하기 위해 구분한다. 이를테면 gray|grey"gray" 또는 "grey"와 일치한다.

그룹 묶기

괄호를사용하면 연산자의 범위와 우선권을 정의할 수 있다. 이를테면 gray|greygr(a|e)y"gray""grey" 집합을 둘 다 기술하는 동일 패턴이다.

양의 지정

?

물음표는 0번 또는 1차례까지의 발생을 의미한다. 이를테면 colou?r"color""colour"를 둘 다 일치시킨다.

*

별표는 0번 이상의 발생을 의미한다. 이를테면 ab*c"ac", "abc", "abbc", "abbbc" 등을 일치시킨다.

+

덧셈 기호는 1번 이상의 발생을 의미한다. 이를테면 ab+c"abc", "abbc", "abbbc" 등을 일치시키지만 "ac"는 일치시키지 않는다.

{n}

정확히 n 번만큼 일치시킨다.

{min,}

"min"번 이상만큼 일치시킨다.

{min,max}

적어도 "min"번만큼 일치시키지만 "max"번을 초과하여 일치시키지는 않는다.



출처 : https://ko.wikipedia.org/wiki/%EC%A0%95%EA%B7%9C_%ED%91%9C%ED%98%84%EC%8B%9D#.EA.B8.B0.EB.B3.B8_.EA.B0.9C.EB.85.90



참고사이트

https://regexone.com/

'Programming > 정규표현식' 카테고리의 다른 글

정규표현식 사용하기  (0) 2017.05.08

+ Recent posts