Objective-C / Swift :: NSRegularExpression

NSRegularExpression

Foundation은 유니코드 문자열에 대해서 정규식을 적용할 수 있는 NSRegularExpression 클래스를 제공한다. 이 클래스의 인스턴스는 컴파일된 정규식 패턴을 나타낸다. 여기서 사용되는 정규식 표현 패턴은 ICU의 안을 따르고 있다. (파이썬 정규식과 거의 유사하다.)

http://userguide.icu-project.org/strings/regexp

기본적으로 정규식 객체는 자신의 패턴을 문자열에 적용해서 매치 결과들에 대해서 실행되는 블럭 이터레이터를 제공한다. 그 외에도 매치 결과를 배열로 리턴하거나, 매치의 수를 찾거나, 첫 매치를 찾는 등의 편의 메소드도 제공한다.
각각의 매치 결과는 NSTextCheckingResult 객체인데, 이는 전체 매치의 범위(NSRange) 및 개별 캡쳐 그룹의 범위값을 가지고 있다.

객체 생성

기본적인 정규식 객체 생성 방법은 다음과 같다.

NSError *error = nil;
NSRegularExpression *regex = [NSRegularExpression
            regularExpressionWithPattern:@"\\b(a|b)(c|d)\\b"
            options:NSRegularExpressionCaseInsensitive
            error:&error];

NSRegularExpressionCaseInsensitive는 대소문자 구분없는 매칭을 위한 옵션이다. swift에서는 .CaseInsensitive로 간소화되었다.(NSRegularExpressionOptions)

매치개수 세기

매치되는 부분의 개수는 numberOfMatchesinString:options:range:로 셀 수 있다. 여기서 옵션은 NSMatchingOptions의 값으로, 거의 nil을 쓴다고 보면 된다.

NSUInteger numberOfMatches = [regex numberOfMatchesInString:str
                                    options:0
                                    range:NSMakeRange(0, [str length])];

첫번째 매치 결과에 관심이 있다면 rangeOfFirstMatchInString:options:range:를 쓰면 된다.

NSRange rangeOfFirstMatch = [regex rangeOfFirstMatchInString:str options:0 range:NSMakeRange(0, [str length])];
if(!NSEqualRanges(rangeOfFirstMatch, NSMakeRange(NSNotFound, 0))) {
    NSString *substringForFirstMatch = [str substringWithRange:rangeOfFirstMatch];
}

모든 매치 결과는 matchesInString:options:range:로 구한다.

NSArray<NSTextCheckingResult> *matches = [regex matchesInString:str
                                options:0 range:NSMakeRange(0, [str length])];
for (NSTextCheckingResult *match in matches) {
    NSRange matchRange = [match range];
    NSRange firstHalfRange = [match rangeAtIndex:0];
    NSRange secondHalfRange = [match rangeAtIndex:1];
}

매치 결과의 범위 값은 NSTextCheckingResult-range로 구하는데, 만약 캡쳐링 그룹이 있다면 -rangeAtIndex:로 구한다. 그룹번호를 넣으면 되고, 그룹번호가 0인 경우에는 매치 전체의 범위가 된다.
편의상 첫번째 매치를 구하는 함수도 제공한다. -firstMatchInString:options:range:이고 사용법은 동일하다.

블럭이터레이터

-enumerateMatchesInString:options:range:usingBlock:은 각각의 매치에 대해서 블럭을 실행시킬 수 있는 메소드이다.

__block NSUInteger count = 0;
[regex enumerateMatchesInString:str options:0 range:NSMakeRange(0, [str length] usingBlock:^(NSTextCheckingResult *match, NSMatchingFlags flags, BOOl *stop){
    NSRange matchRange = [match range]; // 각 매치 전체의 범위
    NSRange firstHalfRange = [match rangeAtIndex:1]; // 첫 그룹
    NSRange secondHalfRange = [match rangeAtIndex:2]; // 두 번째 그룹
    if (count++ >= 100) *stop = YES; // 100번째 매치를 만나면 그만둔다.
})]

바꾸기

예시로 …

NSString *modifiedString = [regex stringByReplacingMatchesInString:str
                            options:0 range:NSMakeRange(0, [str length])
                            withTemplate:@"$2$1"];

Read more

워드프레스에서 고스트로 이전

워드프레스에서 고스트로 이전

이 글을 쓰면서도 믿기 힘든 사실인데, 블로그라는 걸 처음 시작한지가 20년이 되었습니다. 이글루스에서 처음 시작했다가, SK컴즈가 인수한다고 발표함과 동시에 워드프레스로 플랫폼을 옮겼죠. 워드프레스오 옮긴 이후에는 호스팅 환경을 이리 저리 옮기긴 했지만 거의 18년 가까이 워드프레스를 사용해온 것 같습니다. 그 동안 워드프레스는 블로깅 툴에서 명실상부한 범용CMS로 발전했습니다. 사실 웬만한 홈페이지들은 이제

By sooop
띄어쓰기에 대한 생각

띄어쓰기에 대한 생각

업무 메일을 쓸 때 가장 많이 쓰는 말 중에 하나가 메일 말미에 ‘업무에 참고 부탁 드립니다.‘인데요, 어느 날부터 아웃룩에서 이 ‘부탁 드립니다’가 틀렸다고 맞춤법 지적을 하기 시작했습니다. 맞는 말은 ‘부탁드립니다’라고 붙여 쓰는 거라고. 사실 아래아한글 시절부터 이전의 MS워드까지, 워드프로세서들의 한국어 맞춤법 검사 실력은 거의 있으나 마나 한

By sooop

구글 포토에서 아이클라우드로 탈출한 후기

한 때 구글 포토가 백업 용량을 무제한으로 제공해 주겠다고해서, 구글 포토를 사용해서 사진을 백업해왔습니다. 물론 이 이야기의 결말은 저나 이 글을 읽고 있는 여러분이나 모두 알고 있습니다. 사실 AI에게 학습 시킬 이미지 데이터를 모으기 위한 것일 뿐이라거나 하는 이야기는 그 당시에도 있었습니다만, 에이 그래도 구글인데 용량은 넉넉하게 주겠지…하는 순진한

By sooop

Julia의 함수 사용팁

연산자의 함수적 표기 Julia의 연산자는 기본적으로 함수이며, 함수 호출 표기와 같은 방식으로 호출하는 것이 가능합니다. 또한 그 자체로 함수이기 때문에 filter(), map() 과 같이 함수를 인자로 받는 함수에도 연산자를 그대로 적용하는 것이 가능합니다. 특히 + 연산자는 sum() 함수와 같이 여러 인자를 받아 인자들의 합을 구할 수 있습니다. 2 + 3 # = 5 +(2,

By sooop