본문 바로가기

IT/삽질 로그

[삽질 프로젝트 설계] 티스토리 유입자 대시보드 만들기 - NOSQL 설계 초안

1. https://json.geoiplookup.io 오픈소스

   - 위 링크를 통해 가져 올 수 있는 데이터의 목록은 다음과 같다.

(
   {
      "ip":"-",
      "isp":"-",
      "org":"",
      "hostname":"-",
      "latitude":-,
      "longitude":-,
      "postal_code":"",
      "city":"-",
      "country_code":"KR",
      "country_name":"South Korea",
      "continent_code":"AS",
      "continent_name":"Asia",
      "region":"Seoul",
      "district":"-",
      "timezone_name":"Asia\/Seoul",
      "connection_type":"Corporate",
      "asn_number":3786,
      "asn_org":"-",
      "asn":"-",
      "currency_code":"KRW",
      "currency_name":"South Korean Won",
      "success":true,
      "premium":false
   }
);

  - 하지만, 개인정보 보호법에 따르면 특정인을 유추할 수 있는 정보를 수집하여서는 안되므로, ip address, 위도, 경도를 수집하지 않겠다.

  - 최종적으로 위 오픈소스를 통해 가져갈 정보는 "country code", "region"만 가져가겠다.

 

 

 

2. Javascript - document.referrer 

  - document객체의 referrer를 이용하면, 참조한 페이지를 알 수 있다.

  - 실험 결과, 주소창에 직접 친 경우 빈 string을 출력하였으며,

  - 블로그 내부에서 다른 글을 참조하였을 경우, 블로그 도메인을 포함한 url이 출력되었다.

  - 외부 링크를 타고 오는 경우, 그대로 외부 링크를 표시했다.

  - 이를 이용하여 실질적인 블로그 이용자를 추적할 수 있을 것으로 보인다.

 

 

 

 

3. Javascript - Date.now()

  - 티스토리 대시보드에는 어느 시간대에 사람들이 들어왔는지에 대한 정보가 없다.

  - 시간대까지 포함하면, 개발자들이 어느시간대에 가장 공부를 많이하고 참조를 하는지 알 수 있을거같다. (?)

  - 그래서 이 정보 또한 수집하기로 하였다......

 

 

 

 

4. 기타 필요한 정보

  - 블로그 컨텐츠 정보

  - 디바이스 정보

 

 

 

 

5. NOSQL Table 초안

   {
      "topic":"kafka broker topic - PK"
      "date":"내 블로그를 조회한 날짜 - SK",
      "content":"조회한 블로그 컨텐츠 정보",
      "referer":"블로그 참조 경로",
      "device":"참조한 디바이스 정보",
      "time":"블로그 글을 조회 한 시간",
      "country":"국가",
      "city":"지역 이름 (시 단위 까지만)"
   }

 

 

 

 

6. 작업 이력

  - 2020.06.09 : 초안 작성 완료.

  - 2020.06.10 : AWS DynamoDB 테이블 생성 완료