본문 바로가기

데이터 처리/데이터 처리5

프로그래머스 고득점 SQL 문법 총 정리 0. SELECT SELECT는 조회하는 구문이다. 1. WHERE WHERE은 조건문으로 뒤에 조건을 주면 원하는 값을 고를 수 있다. WHERE에 NOT이나 = 앞에 !을 붙여주면 반대 조건을 찾을 수 있다. SELECT animal_id, name FROM animal_ins WHERE INTAKE_CONDITION != 'Aged' Order BY animal_id NULL이 아닌값WHERE [column] IS NOT NULL2. Order by order by [column] 을 하면 컬럼명을 기준으로 오름차순 정렬한다는 뜻. orber by 1은 첫번째 컬럼을 기준으로 오름차순 정렬한다는 뜻이다. 내림차순으로 하고 싶으면 Order by 1 desc 하면 된다. SELECT *.. 2020. 11. 10.
네이버 웹 이미지 크롤링(Crawling)하기. https://github.com/jun7867/Web_Image_Crawling jun7867/Web_Image_Crawling Naver, Google Website Image Crawling . Contribute to jun7867/Web_Image_Crawling development by creating an account on GitHub. github.com 네이버에서 이미지들을 크롤링하여 이미지 파일을 저장하고, zip 파일로 압축하는 과정입니다. 머신러닝을 학습하기 위해서는 상당한 양의 데이터가 필요합니다. 이때, 이미지를 하나하나 다운받기에는 무리가 있습니다. 따라서, 웹 이미지 크롤링을 사용하여 몇백개의 이미지를 다운받을 겁니다. 먼저 웹 크롤링을 하기 위해서 환경 설정이 필요합니다.. 2020. 7. 8.
파이썬 | 정규표현식 (re) re.compile 사용을 위한 표현법 정리 OR(|), *, + , ?, {} 이전 포스팅에서는 대괄호([]) , 이스케이프(\), 마침표(.), 그외 문자 집합에 대해 알아봤었다. 기본적인 정규표현식 기초 OR(|), *, + , ?, {} 에 대해서 알아보도록 하겠다. | : 다자 택일 단어 '하나' , '둘', '셋' 중 하나에 대응하고 싶다면 | 를 써서 다자택일 한다. ( OR 느낌) 하지만 순서에 따라서 결과가 바뀔 수도 있다. (one, oneself) 이런 경우 단어의 경계를 사용하여 해결하면 된다. \bone\b | \bonewself\b * : 0회 이상 반복 어떤 문자나 기호 뒤에 * (Asterisk)를 붙여서 그 문자가 일치되는 만큼 찾는다. 예를 들어 A* 는 'A'나 'AAA" , "" (빈문자열) 과도 일치한다. 하지만 빈문자열도 List에 들어가서 좋.. 2020. 6. 24.
파이썬 | 정규표현식(re) re.compile 사용을 위한 표현법 1. 정규 표현식 (RE : Regular Expression) 정규 표현식은 특정한 규칙을 가진 문자열 패턴을 사용하는 방식이다. 데이터 전처리에 있어서 텍스트에서 특정 문자열을 검색, 치환, 제거할 때 사용한다. 예를들어 정제되지 않은 데이터에서 특정 데이터만 뽑아낸다던가, 웹페이지에서 전화번호 , 이메일 발췌, 특정 에러메세지를 찾을 때 사용한다. 2. 정규 표현식 사용 파이썬에서 정규표현식을 사용하기 위해서는 re을 import 해야한다. re.compile(" ")은 정규식 객체를 리턴해준다. 정규식에서는 숫자를 의미하는 기호로 \d 를 사용한다. (d는 digit을 의미함. 0~9) 예를들어, 전화번호 패턴은 \d\d\d-\d\d\d-\d\d\d\d 가 된다. 이와 같은 문자를 메타 문자라고 .. 2020. 6. 24.