Allen's 데이터 맛집

PhantomJS란? 본문

Programming/Docker

PhantomJS란?

Allen93 2023. 8. 27. 20:16

PhantomJS란?

PhantomJS는 브라우저 역할을 하는 Headless 웹 킷입니다. 이해하기 쉽게 설명하자면, 브라우저가 없는 브라우저라고 생각하시면 됩니다.

 

Headless browser란?

헤드리스 브라우저는 그래픽 유저 인터페이스가 없는 웹브라우저를 뜻합니다. 헤드리스 브라우저는 웹 브라우저와 유사한 환경을 가졌지만 커맨드 라인 인터페이스를 통해 실행하고 제어할 수 있는 브라우저들을 말합니다. 헤드리스 브라우저엔 자바로 작성된 HtmlUnit이라는 것도 많이 사용됐었습니다.

 

phantomJS

이미지 출처 : https://tech.buzzvil.com/blog/scaling-phantomjs-ghost-town/

 

1. 웹 페이지 자동화


PhantomJS는 웹 페이지를 불러오고 자동으로 상호 작용하는 데 사용됩니다. 예를 들어, 웹 페이지에서 특정 양식을 작성하거나 버튼을 클릭하는 작업을 자동으로 수행하고 그 결과를 얻어올 수 있습니다. 이를 통해 반복적이고 시간 소모적인 작업을 자동화하여 개발자들의 생산성을 높일 수 있습니다.


2. 스크린 캡처

PhantomJS는 웹 페이지의 스크린숏을 찍는 데에도 사용됩니다. 웹 페이지의 레이아웃이나 디자인을 확인하거나 웹 사이트의 스크린숏을 자동으로 생성하는 데 활용됩니다. 이는 웹 디자이너나 개발자에게 디버깅과 테스트에 유용한 도구로 작용합니다.


3. 스크레이핑과 데이터 수집


PhantomJS는 웹 페이지의 내용을 스크레이핑 하여 데이터를 수집하는 데에도 사용됩니다. 웹 사이트에서 데이터를 추출하거나 특정 정보를 모니터링하고 싶을 때 유용하게 활용될 수 있습니다.

 


이러한 강점들로 인해 PhantomJS는 웹 개발자, 테스터, 데이터 과학자, 자동화 엔지니어 등 다양한 분야에서 활용되고 있습니다. 하지만 참고하셔야 할 점은, PhantomJS는 개발이 중단되었으며 보안 이슈나 호환성 문제가 발생할 수 있습니다. 이를 고려하여 적절한 대안을 검토하는 것이 중요합니다.

728x90