Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- promise처리
- 앙버터마카롱
- 지보싶 신촌점
- apollo react native
- useMutation error
- 홍대 카페 장쌤
- typescript
- 홍대 토라비
- 잠실새내 도그존
- 홍대 예술
- 운정 소바동
- graphql react native
- 화이트해커를 위한 웹 해킹의 기술
- 비동기배열처리방법
- promise메서드
- apolloclient
- 도그존
- graphql 400
- 금별맥주
- 잠실새내
- 화이트 해커를 위한 웹 해킹의 기술
- 비동기배열
- graphql with reactnative
- 토라비
- 신촌 소문난집
- 고르드
- 예쁜술집 예술
- graphql
- graphql mutation error
- graphql with RN
Archives
- Today
- Total
yehey's 공부 노트 \n ο(=•ω<=)ρ⌒☆
웹 스캐너 본문
웹 스캐너 (WEB scanner)
:웹에서 발생하는 수많은 취약점들을 빠르게 진단하기 위한 도구
-취약점 스캐너의 일종
-Acutenetix, OWASP-Zap, w3af, nikto, Burp Suite 등
HTML 파싱
:HTML 소스를 얻어서 원하는 부분(혹은 정보)을 추출하는 기법
-python에서는 beautiful soup4 라는 파이썬 라이브러리를 통해 파싱을 제공한다.
Beautiful Soup4
-HTML 및 XML 파일에서 데이터를 가져오기 위한 Python library
-cmd->Python-> pip install beautifulsoup4 를 통해 설치
urlopen() | html 파일 열기 |
bsObj.html | html 부분만 가져오기 |
bsObj.html.head | html에서 head 부분만 가져오기 |
bsObj.html.title | html에서 title 부분만 가져오기 |
bsObj.div | div 부분만 가져오기 |
from bs4 import BeautifulSoup
from urllib.request import urlopen
html = urlopen("http://") #urlopen 함수로 HTML 파일 받아옴
bs = BeautifulSoup(html.read(),"html.parser") #beautiful soup object로 분석, 파싱
print(bsObj.h1) #h1 가져옴
bsObj.html.head #head 보기
bsObj.html.title #title 보기
bsObj.html.div #div 보기
find()
-find('태그명',{'속성명':'값'})
-해당 조건에 맞는 하나의 태그를 가져옴 (중복일 경우 첫 번째 태그)
findAll()
-findAll('태그명',{'속성명': '값'})
-해당 조건에 맞는 모든 태그를 가져옴
bsObj.find("a") #첫번째 a태그 가져옴
bsObj.findAll("a") #모든 a 태그 가져옴
bsObj.findAll("a",{"href":"값"}) # a태그에 href 속성이 "값"인 모든 태그 가져옴
'기타 기본 지식' 카테고리의 다른 글
크롤링 (crawling) (0) | 2020.11.10 |
---|---|
큐 (Queue) (0) | 2020.10.20 |
스택 구조 (Stack ) (0) | 2020.10.20 |
List (연결리스트) (0) | 2020.10.20 |
재귀 함수 (0) | 2020.10.20 |
Comments