프로그램



    
Track A 강연시간 : 2023.9.20 15:20 ~ 16:00
웹 기반 서비스에서의 스크래핑 유형 및 방지 대책 mail share facebook share twitter share linkedin share band share kakao

디알엠인사이드
김태현 연구소장

웹 브라우저 기반 서비스는 HTML5 표준만으로도 최적의 데이터 처리 및 UI를 제공할 수 있어, 최소의 유지비용만으로 다양한 OS에서 콘텐츠를 제공하고 공유하는 서비스를 할 수 있는 장점이 있습니다.

그러나 플랫폼 특성상 콘텐츠에 대한 복제 방지가 취약하다는 단점도 공존하기 때문에 여전히 다양한 디지털 콘텐츠들이 웹 기반 서비스로 전환되지는 못하고 있습니다. 실재로 최근의 인터넷 양상을 살펴보면 웹툰, 웹소설, 전자책, 동영상, 음악, 정보 제공 사이트, 핀테크 및 금융사이트 등 다수의 웹 기반 서비스들이 웹 크롤링과 스크래핑, 스크린 캡쳐 등의 방법으로 데이터가 추출되어 불법으로 사용되거나 경쟁사의 비즈니스 데이터로 활용되고 있습니다.

이에 따라 각 서비스 업체들은 웹 콘텐츠의 복제 방지를 위해 단 시간의 대량 요청 제어, 웹 브라우저 기능제어, URL 접근 통제 등의 기술을 적용하고는 있지만 여전히 우회할 수 있는 방법들이 존재하기에 서비스 사업자들의 우려는 지속되고 있습니다.

본 강연에서는
1. 웹 기반 서비스에서 현존하는 콘텐츠 추출 유형들을 모두 기술하고
2. 추출 공격에 대한 근본적인 방지 기술 및 대책을 설명합니다.
3. 또한 방지 기술이 포함된 상용화된 웹 콘텐츠 보호 솔루션들을 소개하고
4. 솔루션 도입사례들을 통해 웹 콘텐츠에 대한 복제가 근본적으로 어떻게 차단되었는지를 살펴보도록 하겠습니다.



강연자료 다운로드

디알엠인사이드

Web-X DRM(웹 콘텐츠 보안 기술)

[Web-X DRM 제품 소개]

보안 모듈 설치가 필요 없는 간편한 웹 콘텐츠 보호 기술
Web-X DRM은 웹 브라우저상에서 별도의 보안 모듈 설치 없이 간편하게 웹 콘텐츠 보안이 가능한 콘텐츠 보호 기술입니다. 강력한 스테가노그래피 보안 기술로 보안 내용에 대한 복사 및 인쇄 방지가 가능합니다.

[Web-X DRM 주요 기능]

1. 텍스트 난독화 & 이미지 소스 숨김
HTML 원본을 난독화시켜 이미지 소스를 숨김으로써 원본 콘텐츠에 대한 추출을 불가능하게 합니다.

2. 개발자 도구 실행 방지
F12키 실행 방지 및 메뉴를 통한 개발자 도구(디버그 모드) 실행을 차단할 수 있습니다.

3. 인쇄 제어
웹 페이지의 보안 내용에 대한 인쇄 방지, 보안 경고 문구 표시, 인쇄 허용자 설정 등이 가능합니다.

4. 복사/붙여넣기 방지
강력한 난독화 기술로 복사, 붙여넣기를 시도하더라도 원본 콘텐츠에 대한 내용 확인이 불가능합니다.

5. 크롤링 방지
Web-X DRM이 적용된 웹사이트에서는 텍스트 및 이미지의 크롤링 추출이 불가합니다. 특히 이미지의 경우 HTML 문서에서 이미지 소스 URL 추출이 불가능하여 웹사이트에 게시된 이미지에 대한 무단 복제 차단이 가능합니다.

6. 스크린 캡쳐 방지
Print Screen 키를 클릭하여 붙여넣기를 시도하더라도 원본 콘텐츠의 복제 방지가 이루어집니다.

7. 이미지/미디어 암호화
웹 브라우저 상에 있는 이미지 또는 미디어(MP3,MP4)에 대한 보안이 가능합니다.


이메일 : contact@drminside.com


홈페이지 : https://webxdrm.co.kr/webx/index.html


관련 뉴스



남*민(***-****-7501)    2023.09.20 15:48

스크래핑 방지 기술이 이미 뚫린 방법에 대한 대처 방안이 많이 소개가 되었는데, 결국 GPT 등을 이용하여 새로운 공격 방식을 찾아내면 결국 콘텐츠 보호를 못할 것 같다고 생각이 듭니다. GPT등 AI기술을 활용하여 사이트가 가지고 있는 취약점을 분석해서 사전에 공격을 방어할 수 있는 방안이 있을까요?


디알엠인사이드    2023.10.10 12:32

결론부터 말씀드리자면 AI를 통해 알려지지 않은 방법의 보안 해제는 어렵습니다. GPT등 AI는 이미 알려진 기술을 선행 학습한 후 일반적인 답변을 제공합니다. GPT를 활용하고 계신 분들은 공감하시겠지만 GPT를 통해 새롭게 고안된 보호장치를 해제하는 방법을 얻을 수 있을지는 의문입니다.


주*현(***-****-1603)    2023.09.20 15:48

무설치로 동작하는 것이 인상적입니다 Proxy 형태로 동작하는것 일까요? 만약 그렇다면 Session이 몰리면 부하 문제가 발생할 것 같은데 어떤지 궁금합니다.


디알엠인사이드    2023.10.06 09:52

Web-X DRM은 클라이언트는 설치가 필요없지만, 서버는 말씀하신대로 프록시형태로 동작합니다. Web-X DRM 서버는 캐쉬 기능이 있기 때문에 한번 난독화된 페이지는 다시 난독화하지 않습니다. 따라서 일반 웹 서버와 동일한 기능을 수행한다고 보시면 됩니다. 또한 Web-X DRM 서버는 docker 형태로 설치가 가능하므로 기존 웹 서버 위치에 병행 설치도 가능합니다. 향후에는 SaaS 형태로도 제공될 예정입니다.


한*구(***-****-8622)    2023.09.20 15:46

이러한 솔루션의 존재에도, 원천적으로 스크래핑을 막기엔 무리가 있다고 생각됩니다. 다만 이에 드는 코스트를 높이는 방향으로 기술이 발전하는 것 같은데, 강연자님께서 생각하시는 가장 효율적으로 공격 코스트를 높이는 방어 기법은 뭐라고 생각하시나요?


디알엠인사이드    2023.10.06 10:11

최종적인 공격은 결국 자바스크립트에 대한 리버스엔지니어링이라 생각됩니다. 지금으로서는 가장 적은 비용으로 공력 코스트를 높이는 방법은 브라우저 개발자툴의 실행을 막는 것이라 생각됩니다.


이*웅(***-****-8808)    2023.09.20 15:45

웹 스크래핑 방지를 위해 Web-X DRM 적용시 서비스 퍼포먼스 하락이 있을까요? 있다면 어느 정도 일까요? 유저가 체감 할 수 있을 정도 인지 궁금 합니다.


디알엠인사이드    2023.10.06 10:03

Web-X DRM 서버는 자체적으로 캐쉬기능을 가지고 있기 때문에 정적 생성 페이지의 경우 첫번째를 제외하고는 성능의 변화가 없습니다. 물론 첫 번째 접근도 사용자가 인지 하지 못하는 수준입니다.


이*열(***-****-1401)    2023.09.20 15:43

솔루션을 적용한 이후에는 보호 기술을 통해 차단이 가능하나이미 스크랩핑 해간 웹 컨텐츠에 대한 방지 및 추적할수 있는 방안은 있을까요?


디알엠인사이드    2023.10.06 10:07

이미 스크래핑된 콘텐츠의 경우에는 모니터링을 통한 불법 사용 추적 기술을 사용할 수 있습니다. (주)디알엠인사이드에서는 Web-X DRM 뿐만 아니라, 이미지 검색 기술인 ImageID 그리고 동영상 검색 기술인 VideoID 제품이 있습니다. 이들 기술들을 활용하여 허가없이 유통되고 있는 이미지 또는 동영상을 검색하고 법적인 조치를 할 수 있는 증거자료를 확보할 수 있습니다.