in Implement: 적용

내부 IP 트래픽을 웹로그에서 제외하기

Share

보통 내부 직원이나 관계자들은 일반 방문자에 비해 사이트 이용도가 다르다보니, 이 수치가 로그 데이터에 합쳐지게 되면 정확한 분석이 어려워집니다.

그래서 오늘은 IP 주소 필터를 사용해 구글 웹로그분석 (GA) 에서 내부 트래픽수치를 제외하는 방법을 알려드리겠습니다.

시작 전 아래 두 가지 항목에 대한 이해가 필요합니다.

1. 제외하려는 IP 주소?

본인의 IP 주소를 알고싶으시면 구글에서 “what’s my ip” 를 검색하시면 쉽게 알 수 있습니다.

구글 검색에서 내 IP 주소 확인하게

구글 검색에서 내 IP 주소 확인하기

만약 하나의 IP 주소가 아닌 특정 대역 (xxx.xx.xxx.1, xxx.xx.xxx.2, xxx.xx.xxx.3,…) 을 제외하려면 Regex (정규표현식) 을 사용해야 합니다 (구글 웹로그분석을 사용하시다보면 이 정규표현식을 자주 쓰게 됩니다. 기회가 된다면 RegEx 관련해서 별도로 포스팅을 하겠습니다.)

IP 대역의 처음과 마지막을 알고있다면, 아래와 같이 Regular Expression Builder 툴을 이용해서 쉽게 코드를 생성할 수 있습니다.

RegEx (정규표현식) 사용해서 IP 대역 제외하기

2. 어떤 View (보기) 에 필터를 적용할 것인지?

로그분석 계정 내에는 여러개의 “보기 (View)” 를 생성해놓을 수 있습니다 (GA 한글버전에는 “보기”라고 번역되어 있지만 아무래도 View 가 더욱 이해하기 쉬운 것 같네요 ^^;). 이중 필터를 적용할 보기를 선택해야 합니다.

위에 대한 확인을 마치면, 아래 비디오를 보면서 따라해보시기 바랍니다.

제외하려는 IP 주소 (예시):

  • 123.23.123.1
  • 123.23.123.2
  • 123.23.123.3
  • 123.23.123.4
  • 123.23.123.5

(플레이어우측 하단에서 Annotations “On”, Quality 는 HD 선택)

 자주 묻는 질문

왜 GA 에서 여러개의 보기(View) 가 필요한가요?

필터가 한 번 적용된 수치들은 다시 roll-back 하거나 취소할 수 없기 때문에, 하나의 보기만을 두는 것보다는 여러개가 있는 것이 보다 안정적인 로그분석 환경을 위한 방법입니다.

보통 기업의 분석목적에 따라 달라지겠지만, 아래와 같이 세 가지로 구분하는 것이 가장 보편적입니다.

  • 전체: 필터가 적용되지 않은, 사이트에서 수집된 모든 데이터을 보여주는 곳
  • 테스트용: 새 기능을 보고서용 보기에 적용하기 전 테스트해보는 곳
  • 보고서용: 실제 수치 확인 및 보고서 작성을 위한 곳

필터를 쓰지않고 하는 방법도 있나요?

네, 있습니다! 바로 구글 태그매니저 (Google Tag Manager) 를 사용하는 것입니다.

간단히 설명드리자면 특정 IP 나 호스트네임에 대해 GA 코드 자체를 실행하지 않도록 규칙을 설정하는 것입니다. 이렇게 되면 내부 트래픽 정보가 GA 로 전송되는것이 원천적으로 막히게되는거죠. Luna Metrics 블로그에서 상세히 포스팅해놓았기 때문에, 관심있는 분들은 확인하시기 바랍니다 ^^.

보다 정확한 데이터를 위해, 특정 스마트폰이나 PC 시리얼넘버를 제외할 수 있나요?

이건 불가능합니다. 구글에서는 웹로그분석 데이터에서 개인 식별이 가능한 정보 (PII) 를 포함하지 않도록 원칙을 삼기때문에, 스마트폰 시리얼넘버와 같은 정보를 사용할 수는 없습니다.