티스토리 뷰
urlib 모듈
✓파이썬의 표준 모듈로써 URL을 다루기 위한 모듈 패키지
✓설치가 필요하기 않고 import urlib로 활용
✓requests모듈과 마찬가지로 URL과 관련된 여러가지 기능을 제공
urlib.request: urlopen()
✓해당 URL을 열기, 응답 데이터는 바이트 형식의 HTTPResponse객체
✓request 객체 또는 URL 을 직접 넣어도 가능
urlib.request: read()
✓urlopen으로 연 객체를 읽고, 인자로 전달하는 숫자만큼 데이터를 읽음
- 바이트 형식의 데이터
✓readlines(): 홈페이지 데이터를 줄 단위로 읽어 리스트에 반환
urlib.request: decode()
✓바이트 형식의 데이터를 원하는 형식으로 변환
-기본값 : utf-8사용
urlib.request: urlretive()
✓웹상의 이미지를 다운
urllib 모듈 활용
✓ 파라미터를 변경해 여러 정보 가져오기
✓ 파이썬 문법을 활용해 연관검색어 리스트 출력
✓정규 표현식 및 문자열 함수 활용
'TextMining' 카테고리의 다른 글
웹 문서 자료 수집- query 자료 수집 (0) | 2023.03.08 |
---|---|
웹 문서 자료 수집- url 자료 수집 (0) | 2023.03.08 |
BeautifulSoup 모듈 (0) | 2023.03.06 |
Web Crawling & 선택자 (0) | 2023.03.06 |