|
|
|
|
|
 |
카카오 게임즈의 데이터 직무에 지원한 동기는 무엇인가요
게임 데이터에서 가장 중요하다고 생각하는 핵심 지표와 선정 이유는 무엇인가요
데이터파이프라인을 설계할 때 안정성과 확장성을 동시에 확보한 사례가 있나요
실시간 스트리밍데이터 처리 경험이 있나요
AB테스트를 설계하고 분석한 경험을 구체적으로 말해주세요
모델 성능 저하나 데이터 드리프트를 탐지하고 대응한 경험을 말해주세요
압박 질문 데이터로 의사결정했지만 결과가 악화되면 책임을 어떻게 지나요
책임은 데이터팀이 나눠져야 합니다.
|
|
|
 |
AB테스트를 설계하고 분석한 경험을 구체적으로 말해주세요
개인정보와 규제 준수 관점에서 데이터 거버넌스를 어떻게 설계했나요
모델 성능 저하나 데이터 드리프트를 탐지하고 대응한 경험을 말해주세요
비용 효율 관점에서 클라우드 데이터스택을 최적화한 방법을 말해주세요
압박 질문 데이터로 의사결정했지만 결과가 악화되면 책임을 어떻게 지나요
압박 질문 출시 하루 전 핵심 지표대시보드가 깨졌습니다
압박 질문 모델이 블랙박스라 설명이 어렵다는 반발이 있습니다
압박 질문 같은 리소스로 실시간 추천과 배치 분석 중 하나만 고르라면 무엇을 선택하겠습니까
퍼널에서는 신규 유입 튜토리얼 완주 첫 과금까지 단계별 전환율을, 코호트에서는 유입일 기준 D1D7D30 리텐션과 ARPDAUARPPULTV를 봅니다.
이 절차로 과거 튜토리얼난이도 상향 후 D1 리텐션이 7포인트 하락했을 때, 난이도롤백과 보상패치로 3일 내 회복했습니다.
초기에는 D3에 노출했으나 LTV 곡선을 분석하니 D5 전후 콘텐츠 소진이 빨랐고, 이 시점에 동기 부여가 필요했습니다.
운영은 체크포인트와 RocksDB 상태 스냅샷으로 재처리를 안전하게 했고, 토픽 파티션 증설로 스케일을 무중단 확보했습니다.
결과는 D1 리텐션 2.1포인트 상승, 완주율 5.7포인트 상승, 세션 길이 큰 변화 없음이었습니다.
실무자는 목적 외 이용을 방지하기 위해 티켓 기반 데이터 제공 프로세스를 통과하도록 했고, 로그 기반 감사 추적으로 책임성을 확보 했습니다.
최종적으로 구매율 6퍼센트, 객단가 3퍼센트 상승을 확인하고 점진롤아웃했습니다.
수집 단계에서는 이벤트 유실률 임계치, 스키마불일치, 지연분포를 규칙화했습니다.
쿼리 패턴을 분석해 냉열 데이터 계층화를 도입하고, 저장포맷을 Parquet로 통일했습니다.
필수 원칙은 첫째 불변성 이벤트 원본은 변경하지 않고 파생은 별도, 둘째 스키마버전 관리와 하위 호환성 유지, 셋째 제품 퍼널을 거울처럼 비추는 이름 규칙과 일관된 단위, 넷째 사용자와 세션 구분키의 명확화입니다.
이후 활성 기준을 재정의하고, 중위수와 윈저 라이징 지표를 함께 보도록 대시보드를 개편했습니다.
출시 당일에는 완전성보다 가시성 확보가 우선입니다.
갈등은 데이터가 아니라 선택지와 리스크 관리의 언어로 풀어야 설득이 됩니다.
의사결정권자에게 필요한 것은 내부 수식이 아니라 예측이 왜 합리적인지에 대한 설명 가능성입니다. |
 |
데이터, 지표, d, 퍼센트, 이벤트, 운영, 분석, 콘텐츠, 기반, 이다, 성, 위해, 유저, 설명, 게임, 파이프라인, 포인트, 경험, 별, 의사결정 |
|
|
|
|
|
|
 |
|
|
|
|
|
|
|
|
|
|
|
| |
|
|
|