티스토리 뷰

TextMining

urlib 모듈

wlsl00 2023. 3. 6. 18:17

urlib 모듈 
✓파이썬의 표준 모듈로써 URL을 다루기 위한 모듈 패키지
✓설치가 필요하기 않고 import urlib로 활용
✓requests모듈과 마찬가지로 URL과 관련된 여러가지 기능을 제공

urlib.request: urlopen()
✓해당 URL을 열기, 응답 데이터는 바이트 형식의 HTTPResponse객체
✓request 객체 또는 URL 을 직접 넣어도 가능

urlib.request: read()
✓urlopen으로 연 객체를 읽고, 인자로 전달하는 숫자만큼 데이터를 읽음 
   - 바이트 형식의 데이터
✓readlines(): 홈페이지 데이터를 줄 단위로 읽어 리스트에 반환

urlib.request: decode()
✓바이트 형식의 데이터를 원하는 형식으로 변환 
   -기본값 : utf-8사용

urlib.request: urlretive()
✓웹상의 이미지를 다운


urllib 모듈 활용
✓ 파라미터를 변경해 여러 정보 가져오기
✓ 파이썬 문법을 활용해 연관검색어 리스트 출력
✓정규 표현식 및 문자열 함수 활용

'TextMining' 카테고리의 다른 글

웹 문서 자료 수집- query 자료 수집  (0) 2023.03.08
웹 문서 자료 수집- url 자료 수집  (0) 2023.03.08
BeautifulSoup 모듈  (0) 2023.03.06
Web Crawling & 선택자  (0) 2023.03.06
공지사항
최근에 올라온 글
Total
Today
Yesterday
링크
«   2025/06   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30
글 보관함