반응형
[python] selenium, chromedriver를 이용한 동적 크롤링으로 카페 정보 수집 실습하기
Programming/Python2021. 8. 15. 12:18[python] selenium, chromedriver를 이용한 동적 크롤링으로 카페 정보 수집 실습하기

안녕하세요! 이전 포스팅에서 bs4를 이용한 정적 크롤링을 포스팅했습니다. 하지만 데이터 수집을 하면서 느낀 점은 다양한 데이터를 수집하는데 한계가 있고 페이지가 동작하여 동적으로 여러 곳에서 데이터를 받아오기 위해 셀레니움을 실습해보려고 합니다. 개발 환경 Language: python 3.9.4 IDE: PyCharm community Library: selenium 실습하기에 앞서 라이브러리를 먼저 설치해주겠습니다. pip install selenium 셀레니움을 통한 동적 크롤링을 실습하기 전에 동적 크롤링이 무엇인지 간단하게 알아보기 동적 크롤링은 동적인 데이터를 수집하는 방법을 말합니다. - 동적인 데이터는 입력, 클릭, 로그인 같이 페이지 이동이 있어야 보이는 데이터를 의미합니다. - 정적 ..

[python] bs4를 이용한 정적 크롤링으로 이미지 저장 실습하기
Programming/Python2021. 8. 15. 11:17[python] bs4를 이용한 정적 크롤링으로 이미지 저장 실습하기

안녕하세요! 전국의 카페 정보(카페 이미지, 카페 이름, 카페 주소, 카페 메뉴 등)를 얻기 위해서 크롤링을 하다가 정적 크롤링으로 데이터 수집을 시도했습니다. 데이터를 수집하는데 한계를 느껴 셀레니움을 통한 동적 크롤링을 사용했습니다. 이번 시간에는 bs4를 이용한 정적 크롤링을 실습해보도록 하겠습니다. 우선 정적 크롤링이 무엇인지 알아야겠죠? 개발 환경 Language: python 3.9.4 IDE: PyCharm community Library: bs4 (BeatifulSoup) 라이브러리를 먼저 설치하겠습니다. pip install bs4 https://jaaamj.tistory.com/101 크롤링 종류(정적 VS 동적) 크롤링이란? 크롤링(crawling) 또는 스크레이핑(scraping) ..

[Python] requests, beautifulsoup(bs4) 모듈로 강의목록 웹 스크래핑
Programming/Python2021. 7. 6. 18:25[Python] requests, beautifulsoup(bs4) 모듈로 강의목록 웹 스크래핑

최근에 파이썬을 다룰 일이 많이 없었는데 이번에 셀레니움으로 동적 크롤링을 공부하다가 파이썬 처음 입문했을 때 requests와 bs4로 처음 만들었던 코드를 찾아 학사 홈페이지에서 강의목록을 스크래핑하여 보여주는 것도 좋겠다 싶어서 오늘은 간단한 포스팅을 하려고 합니다. 세세한 내용은 Django 카테고리에서 다루려고 합니다. 실습 환경 OS: window 10 Language: python 3.9 IDE: visual studio code 라이브러리 설치 pip install requests pip install bs4 import requests from bs4 import BeautifulSoup login_info = { 'username': 'id', 'password': 'password',..

[C/C++] C언어 Deque 덱을 이용해 문자열을 입력받아 회문 판별하기
Programming/C, C++2021. 4. 23. 22:24[C/C++] C언어 Deque 덱을 이용해 문자열을 입력받아 회문 판별하기

안녕하세요! 이번 시간 역시 예전에 공부했던 C언어를 포스팅하려고 합니다. 그중에서 Deque 덱을 이용한 회문 판별 알고리즘인데요. 제가 공부했던 쉽게 풀어쓴 C언어에서 덱을 이용한 알고리즘이 과제로 나왔었는데, 한국어로 된 포스팅이 없어서 덱을 이용한 회문 역시 포스팅하게 되었습니다. 입력된 문자열로 회문을 판별하는 실습을 진행하겠습니다. 우선 Deque 덱과 회문이 무엇인지 알아야 하는데요. "덱(Deque)이란?" 덱은 삽입과 삭제가 양쪽 끝에서 모두 가능한 자료 구조 형태입니다. 2개의 포인터를 사용하여 양쪽에 삽입 또는 삭제를 할 수 있는데요. FIFO 구조의 큐(Queue)와 LIFO 구조의 스택(Stack)을 합친 형태라고 생각하시면 될 것 같습니다. "회문이란?" 거꾸로 읽어도 제대로 읽..

[C/C++] C언어 문자열을 입력받아 회문 판별하기(공백 제거)
Programming/C, C++2021. 4. 23. 21:58[C/C++] C언어 문자열을 입력받아 회문 판별하기(공백 제거)

안녕하세요! 이번 시간 역시 예전에 공부했던 C언어를 포스팅하려고 합니다. 그중에서 일반적인 회문 판별 알고리즘인데요. 입력된 문자열의 공백까지 제거해서 띄어쓰기 없는 문자열로 회문을 판별하는 실습을 진행하겠습니다. 우선 회문이 무엇인지 알아야 하는데요. "회문이란?" 거꾸로 읽어도 제대로 읽는 것과 같은 문장, 낱말, 숫자, 문자열을 가리킵니다. 예를 들어 "level" 같은 단어는 정방향, 역방향 어느 쪽으로 읽어도 같은 "level"이기 때문에 회문입니다. 오늘 구현해볼 것은 회문에 공백을 제거하여 출력하는 알고리즘을 작성하는 것입니다. 배열에 넣고 반복문을 돌리게 되면 따로 공백 제거를 해주지 않는 이상 인덱스 순서대로 읽기 때문에 공백 문자가 포함되어 있으면 공백 문자 또한 문자열로 취급합니다...

[C/C++] C언어 스택(Stack)을 이용한 간단한 문자열 압축하기
Programming/C, C++2021. 4. 23. 00:45[C/C++] C언어 스택(Stack)을 이용한 간단한 문자열 압축하기

안녕하세요! 이번 시간에 실습할 내용은 문자열 압축입니다. 여러 가지 자료구조 중에서 스택을 이용해서 문자열을 압축하는 실습을 진행하겠습니다. 아마 C를 하다 보면 문자열 압축에 대해 한 번쯤 보실 텐데 문자열 압축이란? 예를 들어 "aaaaaaaa" 라는 문자열이 있을 때 같은 문자가 여러 번 반복되는 것을 압축하여 공간을 절약하는 방법입니다. 8개의 a가 8a로 나타내 지면서 8글자가 2글자가 되는 것이죠. 원래는 압축 효율을 더 높이기 위해 더 심화된 알고리즘을 사용하는데, 문자열 압축이 어떤 식으로 진행되는지만 참고하시면 될 것 같습니다. C program code #include #include #define MAX_SIZE 100 typedef int element; element stack[..

반응형
image