본문 바로가기

분류 전체보기225

파이썬 | 정규표현식 (re) re.compile 사용을 위한 표현법 정리 OR(|), *, + , ?, {} 이전 포스팅에서는 대괄호([]) , 이스케이프(\), 마침표(.), 그외 문자 집합에 대해 알아봤었다. 기본적인 정규표현식 기초 OR(|), *, + , ?, {} 에 대해서 알아보도록 하겠다. | : 다자 택일 단어 '하나' , '둘', '셋' 중 하나에 대응하고 싶다면 | 를 써서 다자택일 한다. ( OR 느낌) 하지만 순서에 따라서 결과가 바뀔 수도 있다. (one, oneself) 이런 경우 단어의 경계를 사용하여 해결하면 된다. \bone\b | \bonewself\b * : 0회 이상 반복 어떤 문자나 기호 뒤에 * (Asterisk)를 붙여서 그 문자가 일치되는 만큼 찾는다. 예를 들어 A* 는 'A'나 'AAA" , "" (빈문자열) 과도 일치한다. 하지만 빈문자열도 List에 들어가서 좋.. 2020. 6. 24.
파이썬 | 정규표현식(re) re.compile 사용을 위한 표현법 1. 정규 표현식 (RE : Regular Expression) 정규 표현식은 특정한 규칙을 가진 문자열 패턴을 사용하는 방식이다. 데이터 전처리에 있어서 텍스트에서 특정 문자열을 검색, 치환, 제거할 때 사용한다. 예를들어 정제되지 않은 데이터에서 특정 데이터만 뽑아낸다던가, 웹페이지에서 전화번호 , 이메일 발췌, 특정 에러메세지를 찾을 때 사용한다. 2. 정규 표현식 사용 파이썬에서 정규표현식을 사용하기 위해서는 re을 import 해야한다. re.compile(" ")은 정규식 객체를 리턴해준다. 정규식에서는 숫자를 의미하는 기호로 \d 를 사용한다. (d는 digit을 의미함. 0~9) 예를들어, 전화번호 패턴은 \d\d\d-\d\d\d-\d\d\d\d 가 된다. 이와 같은 문자를 메타 문자라고 .. 2020. 6. 24.
백준 2941번 파이썬 풀이 | 크로아티아 알파벳 https://www.acmicpc.net/problem/2941 2941번: 크로아티아 알파벳 문제 예전에는 운영체제에서 크로아티아 알파벳을 입력할 수가 없었다. 따라서, 다음과 같이 크로아티아 알파벳을 변경해서 입력했다. 크로아티아 알파벳 변경 č c= ć c- dž dz= đ d- lj lj nj nj š s= www.acmicpc.net 이 문제의 핵심은 replace이다. replace는 특정 문자열을 특정 문자 혹은 제거할 수 있는 기능이다. 이 문제에서는 Croatia에 저장된 문자열이 있으면 *로 바꾸어 주어 길이를 1로 계산하게끔 하였다. 2020. 6. 24.
백준 5622번 파이썬 풀이 | 다이얼 https://www.acmicpc.net/problem/5622 5622번: 다이얼 문제 상근이의 할머니는 아래 그림과 같이 오래된 다이얼 전화기를 사용한다. 전화를 걸고 싶은 번호가 있다면, 숫자를 하나를 누른 다음에 금속 핀이 있는 곳 까지 시계방향으로 돌려야 한다. � www.acmicpc.net dial이라는 list에 다이얼 별로 문자를 저장시킨다. 그리고 입력받은 단어의 첫 문자와 dial을 비교하여서 포함되어 있는 j를 찾은 뒤 index(j) +3 만큼 더해주면 된다. 2020. 6. 23.