본문 바로가기

데이터 분석, 통계11

[Book] 행동 데이터 분석 8장 ~ 12장 : 실험 설계와 분석/분석 도구 Chapter 8 실험 설계의 기초 1. 실험 계획 : 변화 이론 변화이론이란, 행동에 변화를 주어서 현재 수행 중인 작업을 궁극적인 비즈니스 목표와 목표 지표에 연결하는 것입니다. 이를 비즈니스 관점으로 다시 정리해 보면 아래와 같이 표현할 수 있다. [Action]을 구현하면 [행동 논리]를 통해 [목표 지표]를 기반으로 측정한 [사업 목표]를 달성할 수 있습니다. 2. 실험 설계의 구성 요소 비즈니스 목표와 목표 지표 실험 계획의 첫단계로 무엇을 하려는지 명확하게 설정해야 이후의 실험 내용들이 명확해집니다. 비즈니스 목표는 매출, 비용과 같이 회사의 전체적인 큰 지표라고 보면 되고, 이에 영향을 주는 기본 요인인 선행 지표를 목표 지표로 선정합니다. 개입 실제로 우리가 변화시키려는 행동(action.. 2023. 12. 16.
[Book] 행동 데이터 분석 6장 ~ 7장 : 데이터 분석 Chapter 6. 결측 데이터 처리 결측 데이터를 처리하는 것은 매우 중요하다. 일반적으로 결측이 존재하는 데이터를 모두 삭제하는 경우도 있는데 이럴 경우에 데이터에 큰 편향이 생기게 된다. 예시로 보면 전자기기에 친숙하지 않은 노년층의 유저들이 정보를 잘 안채우는 문제로 결측치가 생겼고 이를 모두 제거하게 되면 결론적으로 젊은 사람들을 위한 모델이나 분석을 해서 전체 유저에 대한 편향이 발생할 수 있다. 어떤 기준으로 삭제를 해야할지? 가장 간단한 전략으로 이런 방법을 제안한다. 1. 결측값이 가장 많은 변수를 가지고 하나는 모든 결측값을 해당 변수의 최솟값으로 대체하고, 나머지 하나는 최대값으로 대체한다. 2. 원본 데이터셋과 1에 만들어진 2개 데이터셋을 활용해서 해당 변수의 가장 중요한 관계의 .. 2023. 12. 15.
[Book] 행동 데이터 분석 4장 ~ 5장 : 인과관계 다이어그램과 교란 해소 이 글은 행동 데이터 분석이라는 아래와 같은 책을 읽고 정리한 내용입니다. 앞에서 데이터 분석과 비판적 사고라는 책을 공부했었는데 좀 더 실무적으로 코드와 함께 살펴보고 싶고 다른 관점도 배우고 싶어서 공부하게 되었습니다. Chapter 4. 인과관계 다이어그램 만들기 인과관계에서의 오류 실제 실무에서 인과관계를 파악할 때에는 단순히 원인과 결과만 살펴보면, 왠지 그럴듯해 보인다. 하지만 우리가 바라보는 실험 환경은 우리가 정의한 변수간의 관계만 바라보고 있으며, 실제 인과관계를 관찰하는 곳에서는 우리가 정의하지 못한 변수가 존재한다. 실제로 비즈니스 세계에서는 특정 기능을 배포하고 나서 결과가 좋을 때 당연히 이 기능 배포로 인한 효과다라고 생각하기 쉽다. 따라서 위의 오류에 빠지지 않도록 어떤 관찰하.. 2023. 12. 14.
[book] 행동 데이터 분석 정리 1~3장 이 글은 행동 데이터 분석이라는 아래와 같은 책을 읽고 정리한 내용입니다. 앞에서 데이터 분석과 비판적 사고라는 책을 공부했었는데 좀 더 실무적으로 코드와 함께 살펴보고 싶고 다른 관점도 배우고 싶어서 공부하게 되었습니다. https://m.yes24.com/Goods/Detail/119001159 행동 데이터 분석 - 예스24 ‘정말 고객이 우리 광고 메일을 보고 서비스를 구독할까?’‘연령이 높은 고객이 구매하는 상품은 따로 있을까?’‘무엇이 고객의 행동을 유발하는지’에 대한 답을 주는 책!이 책은 단순히 m.yes24.com 책에서 전달하고자 하는 메세지 대부분의 데이터 과학 책들이 엔지니어 또는 마케터와 같이 서로 다른 분야에 있는 실무자가 당면한 문제를 동일한 접근 방식과 도구로 해결할 수 있다고.. 2023. 12. 12.