yehey's 공부 노트 \n ο(=•ω<=)ρ⌒☆

웹 스캐너 본문

기타 기본 지식

웹 스캐너

yehey 2020. 11. 10. 04:39

웹 스캐너 (WEB scanner)

:웹에서 발생하는 수많은 취약점들을 빠르게 진단하기 위한 도구

-취약점 스캐너의 일종

-Acutenetix, OWASP-Zap, w3af, nikto, Burp Suite 등

HTML 파싱

:HTML 소스를 얻어서 원하는 부분(혹은 정보)을 추출하는 기법

-python에서는 beautiful soup4 라는 파이썬 라이브러리를 통해 파싱을 제공한다.

 

Beautiful Soup4

-HTML 및 XML 파일에서 데이터를 가져오기 위한 Python library

-cmd->Python-> pip install beautifulsoup4 를 통해 설치

 

urlopen() html 파일 열기
bsObj.html html 부분만 가져오기
bsObj.html.head html에서 head 부분만 가져오기
bsObj.html.title html에서 title 부분만 가져오기
bsObj.div div 부분만 가져오기

 

from bs4 import BeautifulSoup
from urllib.request import urlopen

html = urlopen("http://")		#urlopen 함수로 HTML 파일 받아옴
bs = BeautifulSoup(html.read(),"html.parser")	#beautiful soup object로 분석, 파싱
print(bsObj.h1)		#h1 가져옴
bsObj.html.head		#head 보기
bsObj.html.title	#title 보기
bsObj.html.div		#div 보기

 

find()

-find('태그명',{'속성명':'값'})

-해당 조건에 맞는 하나의 태그를 가져옴 (중복일 경우 첫 번째 태그)

 

findAll()

-findAll('태그명',{'속성명': '값'})

-해당 조건에 맞는 모든 태그를 가져옴

 

bsObj.find("a")		#첫번째 a태그 가져옴
bsObj.findAll("a")	#모든 a 태그 가져옴
bsObj.findAll("a",{"href":"값"})		# a태그에 href 속성이 "값"인 모든 태그 가져옴

 

'기타 기본 지식' 카테고리의 다른 글

크롤링 (crawling)  (0) 2020.11.10
큐 (Queue)  (0) 2020.10.20
스택 구조 (Stack )  (0) 2020.10.20
List (연결리스트)  (0) 2020.10.20
재귀 함수  (0) 2020.10.20
Comments