한국관광 데이터랩 우수 활용사례(2023) - 기타 부문 우수상
성균관대학교 김*환 외
저희는 성균관대학교 통계학과에서 데이터사이언스융합을 전공하고 있습니다. 통계학과 소속 통계분석학회원으로 활동하며
통계 이론 스터디와 ML/DL 기반 다양한 데이터 분석 프로젝트를 진행하고 있습니다.
’23년 상반기에는 주식 거래 데이터 및 여론 데이터를 활용하여 주식 매매에 대한 인사이트를 제공하는 모델링 프로젝트를 진행하였고,
방학 동안 지역축제 관련 프로젝트를 진행하였습니다.
지역축제 관련 프로젝트를 진행하면서 관광 데이터 수집을 위해 한국관광 데이터랩을 알게 되었습니다. 문화관광축제 주요 지표, 관광 소비액 등 데이터 수집을 위해 데이터랩을 적극 활용하였습니다
국내관광 활성화를 위한 ‘지역축제 개선 및 활성화를 통한 국내 관광객 유입’을 주제로 프로젝트를 진행하였습니다.
지역축제의 성패 요인을 분석해 데이터에 기반한 개선 방향을 제시하여 지역 특색을 살린 균형 있는 지역 발전과 지역축제의 개선을
제시하는 것을 목적으로 하였습니다.
지역축제의 성패 요인을 분석하는 과정에서 한국관광 데이터랩의 데이터를 활용하였습니다.
(문화관광축제 주요 지표, 목적지 검색 순위, 연도별 방문자 추이, 성/연령별 내국인 방문자, 관광 소비액, 업종별 소비액) 이 외에
문화빅데이터플랫폼의 데이터와 국토교통부의 교통문화지수를 함께 사용하였습니다.
전처리를 완료한 데이터셋의 특징을 파악한 후 변수 중요도를 통해 지역축제 성패에 큰 영향을 미치는 변수들을 파악하였습니다.
해당 변수들을 활용하여 전국 지역축제에 대한 군집분석을 진행하였으며, 성공 축제 프로파일링을 통해 실패 축제의 개선 방안을
제시하였습니다.
축제유형은 [문화예술, 특산물, 역사, 전통, 자연, 체험, 공연]의 7가지 유형으로 재분류하고 일평균 방문객, 방문객/예산 등의
파생 변수를 추가하여 최종 데이터셋을 생성하였습니다.
투자 대비 지역축제의 성공 정도를 평가하기 위해 방문객/예산 정보를 활용하여 지역축제 성패에 영향을 주는 주요 요인을
확인하였습니다. 연령별 지역 관심도, 주변 관광명소 개수, 축제유형, 개최 지역이 유의미한 변수로 선정되어 관련 14개의 변수를
이용하여 군집분석을 진행하였습니다. 예산 대비 방문객과 일평균 방문객을 기준으로 성공 축제 군집과 실패 축제 군집을 구분하여
각각의 특징을 통해 인사이트를 도출하였습니다.
위의 분석을 통해 아래와 같은 주요 시사점을 도출할 수 있었습니다.
1. 지역축제 성공의 주요 요인으로는 지역 관심도, 축제 유형, 비수도권 여부가 있다. 특히 20대, 50대의 관심도가 높거나 특산물 관련
축제인 경우 성공 여부에 긍정적인 영향이 있다.
2. 관광지로 유명한 지역에서 개최되는 축제는 예산 대비 방문객이 많았으나, 수도권에서 개최되는 경우는 예산 대비 방문객이 저조했다.
3. 특산물 테마는 대체로 높은 성과를 보였으나, 전통 테마는 저조한 성과를 보였다.
4. 축제 이름이 직관적이고 주요 방문객이 특정될수록 성공한 사례가 많다.
이러한 인사이트는 지역축제 개선 및 발전에 활용될 수 있을 것입니다.
1. 읍/면/동 단위로 세분화된 지역 정보 및 데이터별 조회할 수 있는 기간을 일별 데이터까지 세분화하여 공통적으로 적용하면 데이터
수집 및 분석에 용이할 것 같습니다.
2. 지역축제를 여러 테마(자연, 역사)로 구분하여 축제 테마에 따른 주요 특징을 알 수 있으면 좋겠습니다.
3. 문화관광축제 분석의 목적지 검색 순위 내에서 실제로 해당 축제를 방문한 사람의 비율을 제공해 주면 좋을 것 같습니다.
4. 방한 여행 페이지에서 목적에 따른 만족도를 추가로 제공해 준다면 더 유의미한 분석을 진행할 수 있을 것입니다.