1. https://json.geoiplookup.io 오픈소스
- 위 링크를 통해 가져 올 수 있는 데이터의 목록은 다음과 같다.
(
{
"ip":"-",
"isp":"-",
"org":"",
"hostname":"-",
"latitude":-,
"longitude":-,
"postal_code":"",
"city":"-",
"country_code":"KR",
"country_name":"South Korea",
"continent_code":"AS",
"continent_name":"Asia",
"region":"Seoul",
"district":"-",
"timezone_name":"Asia\/Seoul",
"connection_type":"Corporate",
"asn_number":3786,
"asn_org":"-",
"asn":"-",
"currency_code":"KRW",
"currency_name":"South Korean Won",
"success":true,
"premium":false
}
);
- 하지만, 개인정보 보호법에 따르면 특정인을 유추할 수 있는 정보를 수집하여서는 안되므로, ip address, 위도, 경도를 수집하지 않겠다.
- 최종적으로 위 오픈소스를 통해 가져갈 정보는 "country code", "region"만 가져가겠다.
2. Javascript - document.referrer
- document객체의 referrer를 이용하면, 참조한 페이지를 알 수 있다.
- 실험 결과, 주소창에 직접 친 경우 빈 string을 출력하였으며,
- 블로그 내부에서 다른 글을 참조하였을 경우, 블로그 도메인을 포함한 url이 출력되었다.
- 외부 링크를 타고 오는 경우, 그대로 외부 링크를 표시했다.
- 이를 이용하여 실질적인 블로그 이용자를 추적할 수 있을 것으로 보인다.
3. Javascript - Date.now()
- 티스토리 대시보드에는 어느 시간대에 사람들이 들어왔는지에 대한 정보가 없다.
- 시간대까지 포함하면, 개발자들이 어느시간대에 가장 공부를 많이하고 참조를 하는지 알 수 있을거같다. (?)
- 그래서 이 정보 또한 수집하기로 하였다......
4. 기타 필요한 정보
- 블로그 컨텐츠 정보
- 디바이스 정보
5. NOSQL Table 초안
{
"topic":"kafka broker topic - PK"
"date":"내 블로그를 조회한 날짜 - SK",
"content":"조회한 블로그 컨텐츠 정보",
"referer":"블로그 참조 경로",
"device":"참조한 디바이스 정보",
"time":"블로그 글을 조회 한 시간",
"country":"국가",
"city":"지역 이름 (시 단위 까지만)"
}
6. 작업 이력
- 2020.06.09 : 초안 작성 완료.
- 2020.06.10 : AWS DynamoDB 테이블 생성 완료
'IT > 삽질 로그' 카테고리의 다른 글
[삽질 프로젝트 계획] 티스토리 유입자 대시보드 만들기 - 밑그림 (0) | 2020.06.16 |
---|