Simplifying Data and AI

빅데이터 분석과 AI/ML을 단순화합니다

사용 사례

GetGo - 데이터 기반 카셰어링을 통한 자유로운 운전 경험

스누피18 2024. 10. 30. 16:57
차량 분석을 위한 인사이트 도출 시간 66% 단축
지리공간 분석을 통한 연료 도난 50% 감소
새로운 데이터 제품의 시장 출시 시간 20% 단축

이미지 출처: Databricks

 

 
산업: 과학 및 기술 서비스
솔루션: 지리공간 분석,고객 평생 가치,미래 지향적 인텔리전스
플랫폼 사용 사례: 데이터브릭스 SQL,워크플로우
클라우드: AWS

 

"Databricks는 우리가 복잡한 데이터를 활용하여 실행 가능한 인사이트를 제공하고 AI로 새로운 가능성을 열어 모든 사람에게 운전의 자유를 주는 우리의 사명을 강화하는 방식을 변화시켰습니다."
— Maximilian Jackson, GetGo Carsharing 데이터 사이언스 및 엔지니어링 책임자

아시아-태평양 지역은 2025년까지 36.4% 성장률로 Mobility as a Service (MaaS) 시장을 주도하고 있습니다. 싱가포르 최대 카셰어링 회사인 GetGo Carsharing은 1,500개 이상의 위치에서 잉여 차량에 쉽고 즉각적인 접근을 제공합니다. 30만 명 이상의 운전자, 3,000대의 차량, 그리고 하루 최대 6,000건의 예약으로 GetGo Carsharing은 엄청난 양의 원격 측정, 결제 및 이미지 데이터를 생성합니다. 데이터 양이 계속 증가함에 따라 GetGo Carsharing의 작은 데이터 팀은 복잡한 인프라를 관리하고, 안전한 데이터 접근을 제어하고 확장하며, 고객 360도 뷰, 예측 유지보수, 공급망 관리 등의 사용 사례를 효율적으로 충족시키는 데 어려움을 겪었습니다. GetGo Carsharing은 Databricks Data Intelligence Platform으로 마이그레이션하여 데이터와 분석을 통합함으로써 지리공간 분석과 자연어 처리(NLP)를 적용하여 더 빠른 인사이트와 더 나은 비즈니스 솔루션을 얻을 수 있게 되었습니다. 이제 GetGo Carsharing은 최적의 배치와 수요 기반 확장을 통해 고객 만족도와 차량 활용도를 개선하는 동시에 사기 활동을 줄일 수 있게 되었습니다.

레거시 환경에서 데이터 사용과 혁신을 추진하는 데 어려움을 겪다

카셰어링과 같은 모빌리티 서비스는 고객 요구와 가용 차량을 매칭하기 위해 다양한 고객, 차량, 결제 및 이미지 데이터 소스의 수집, 분석 및 적용에 의존합니다. 이 정보는 내부 비즈니스 부서가 사용자 인구 통계와 차량의 고속 원격 측정 데이터를 이해할 수 있는 가시성을 제공합니다. 안타깝게도, GetGo Carsharing의 레거시 데이터 환경은 대규모 데이터 세트를 관리하고 활용하는 능력을 저해했습니다. 또한 Xero, Zendesk, Esso, GetGo Carsharing의 앱 및 실시간 원격 측정을 포함한 다양한 소스에서 유입되는 데이터를 처리하는 데 어려움을 겪었습니다.

GetGo Carsharing의 데이터 사이언스 및 엔지니어링 책임자인 Maximilian Jackson은 "우리는 단순히 MySQL Community Edition 데이터베이스로 데이터를 밀어넣고 있었습니다. 누가 데이터를 사용하는지, 어떤 사용 사례가 있는지 알 수 없었고 접근을 관리할 수도 없었습니다. 새로운 역할을 만들 수 없어서 관리자 비밀번호를 줄 수밖에 없었습니다. 우리는 데이터를 다운로드하고, 이메일로 보내고, 공유 드라이브에 넣고 있었습니다 - 너무 많은 데이터가 여기저기로 흩어지고 있었죠."라고 설명합니다. 엔터프라이즈급 데이터 솔루션 없이는 GetGo Carsharing이 효율적으로 확장하거나, 데이터 보안을 보장하거나, AI와 ML을 구현할 수 없었습니다.

또한 GetGo Carsharing이 데이터베이스의 커뮤니티 버전을 사용하고 있었기 때문에 자체적으로 인프라를 구축하고 유지해야 했습니다. 이는 복잡하고 수동으로 집약적인 구성, 여러 도구의 통합 및 관리가 필요했습니다. 게다가 유지보수 작업은 결과를 더욱 지연시키고 운영 비용을 증가시켜 데이터 팀과 비즈니스 모두를 좌절시켰습니다. GetGo Carsharing의 파트너십 책임자인 Paul Bedi는 "다양한 비즈니스 부서와 파트너에게 인사이트를 제공하는 데 1주일이 걸렸습니다."라고 설명했습니다. "이는 고객이 적절한 차량을 쉽게 찾고 예약할 수 있게 하는 것부터 성능과 유지보수 일정을 최적화하는 것까지, 우리의 카셰어링 경험을 개선할 수 있는 중요한 인사이트의 시장 출시 시간을 크게 늘렸습니다." GetGo Carsharing이 통합 플랫폼으로 데이터의 힘을 활용할 때가 되었습니다.

레이크하우스 아키텍처가 규모에 맞는 데이터와 AI의 기반을 마련하다

GetGo Carsharing 팀은 통합 아키텍처와 완전히 관리되는 인프라를 위해 Databricks Data Intelligence Platform에 전념하고 있습니다. AWS 사용자로서, 그들은 데이터 웨어하우징을 위해 Redshift와 같은 네이티브 서비스에 의존하는 것이 당시에는 큰 의미가 없다는 것을 깨달았습니다. 이는 Databricks Data Intelligence Platform의 핵심인 Delta Lake, 오픈 포맷 스토리지 레이어에서 쉽게 이용할 수 있는 것을 재창조하기 위해 추가적인 노력, 노동 및 비용이 필요했기 때문입니다. Jackson은 "Redshift는 정말 빠르게 비용이 많이 들고, 우리는 장기적으로 생각하고 있었습니다. 우리는 많은 AWS 도구를 관리하고 싶지 않았습니다. 우리는 AI 사용 사례에 집중하기 위해 인프라 관리를 간소화하고 싶었습니다. Databricks는 그것을 쉽게 만들어줍니다."라고 말합니다.

Databricks로 중앙 집중화한 이후, GetGo Carsharing은 제어된 데이터 거버넌스와 보안을 위해 Unity Catalog를 활용했습니다. 데이터가 어떻게, 누구에 의해 접근되는지에 대한 가시성과 권한을 갖게 되면서 - 통합되고, 사용자 친화적이며 확장 가능한 플랫폼에서 간소화된 접근을 제공하는 것 외에도 - GetGo Carsharing은 비즈니스 데이터 사용자 수를 5명에서 40명으로 늘릴 수 있었습니다. 데이터 팀도 생산성 저하 없이 5명에서 20명의 실무자로 성장했습니다. 데이터 팀 구성원들이 이제 전처리나 복잡한 데이터 변환이 필요할 때마다 노트북을 인계받거나 비즈니스 사용자와 협업할 수 있게 되면서 협업도 개선되었습니다.

Databricks Workflows를 사용하여 GetGo Carsharing은 다양한 데이터 환경에서 최적의 성능과 신뢰성을 제공하기 위해 데이터 파이프라인을 조율합니다. Jackson은 "우리는 GitHub에 스테이징 브랜치를 두어 프로덕션으로 푸시하기 전에 Databricks Workflows에서 작업을 테스트합니다. 추가된 스테이징 레이어로 인해 워크플로우가 성공할 것이라는 것을 알 수 있습니다. 우리는 중단을 예상하거나, 수리에 신경 쓰거나, 프로덕션에서 모든 것을 다시 실행할 필요가 없습니다. 이는 엄청난 시간 절약입니다."라고 말합니다.

데이터가 자유롭게 하류로 흐르면서 엔지니어링 팀은 통합된 Power BI 대시보드와 시각화를 통해 데이터 품질과 무결성을 모니터링하고 개선하기 위한 실행 가능한 인사이트를 쉽게 소비할 수 있습니다. 그들은 또한 더 심층적인 시각화를 위해 Databricks SQL 위에 사용자 정의 애플리케이션을 구축하고 있으며 데이터 쿼리를 가속화하기 위해 Photon을 활용하고 있습니다. 이제 GetGo Carsharing은 견고한 기반을 갖추게 되어 비즈니스 부서와 함께 애플리케이션을 구축하고 사용 사례를 충족시켜 고객의 카셰어링 경험에 도움이 되는 더 빠르고 더 지능적인 의사 결정을 할 수 있게 되었습니다.

빠르고 정확하며 접근 가능한 분석이 지속적인 혁신을 주도하다

Databricks Data Intelligence Platform으로 마이그레이션한 이후, GetGo Carsharing은 데이터 제품을 구축하고 유지하는 데 필요한 시간과 노력을 줄여 데이터 팀의 생산성을 20% 향상시켰습니다. 개선된 데이터 처리로 GetGo Carsharing은 인사이트 도출 시간을 66% 단축하고 차량 유지보수 일정, 고장 예측, 차량 360도 뷰 등 새로운 인사이트의 시장 출시 시간을 단축했습니다. 이제 GetGo Carsharing은 모든 사용 사례에 대해 다음 영업일 인사이트를 제공합니다 - 이는 레거시 환경에 비해 7배 개선된 것입니다.

이제 그들은 차량 원격 측정 데이터와 지리공간 분석을 사용하여 사용량에 기반한 관심 지역을 식별하고, 차량 배치와 파트너 관계를 최적화할 수 있습니다. 예약과 여행을 분류하는 것도 GetGo Carsharing이 차량에 추가하는 차량 유형에 영향을 미칩니다. 장거리를 여행하는 교외 가족들에게는 크고 신뢰할 수 있는 차량이 필요하고, 도시의 싱글들은 작고 연료 효율이 높은 차를 원합니다. GetGo Carsharing은 공급과 수요의 균형을 맞춰 고객 만족도를 높이고, 활용도를 높이며, 비용 효율적으로 차량을 확장할 수 있습니다.

GetGo Carsharing은 또한 각 차량에 포함된 Esso 연료 카드의 오용을 통해 발생하는 연료 도난을 최소화할 수 있습니다. 각 사용자의 예약 행동과 주유 패턴을 살펴봄으로써 GetGo Carsharing은 불일치를 통해 사기 행위를 식별하고 이를 해결하기 위한 조치를 취할 수 있습니다. 이는 연료 도난을 50% 줄이고 고객 만족도를 높이는 데 도움이 되었습니다.

앞으로 GetGo Carsharing은 내부 분석을 넘어 데이터 사용을 확장하고 기계 학습과 AI로 구동되는 고객 대면 기능을 도입할 계획입니다. Jackson은 다음과 같이 결론을 내립니다. "Databricks는 금융, 비즈니스 인텔리전스, 운영, 마케팅 및 제품 개발 전반에 걸친 비즈니스 문제를 해결하는 사용 사례를 충족시키기 위한 다양한 도구를 찾을 수 있는 데이터 대장간과 같습니다. 이제 우리는 더 많은 데이터 제품을 만들어내고, 그것들을 프로덕션에 투입하고, 피드백을 통해 반복하여 지속적으로 혁신을 추진할 수 있습니다."