일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- python
- Set
- 데이터시각화
- SQLD
- 선형회귀
- ★
- 내일배움캠프
- 시각화
- 다중공선성
- 한줄for문
- Leetcode
- 내배캠_학습기록
- Til
- 리스트
- 반복문
- 데이터전처리
- 내일배움일지
- DATE_SUB
- 이중for문
- 태블로
- 프로그래머스
- f-string
- Join
- 아티클스터디
- 가설검정
- 통계학
- SQL
- map
- Max
- AB테스트
- Today
- Total
노력에는 지름길이 없으니까요
아티클스터디 240816 - AB 테스트 제대로 이해하기 4, 5 본문
4) AB 테스트 표본 크기와 유의미한 결과의 관계
유의미하지 않은 결과가 표본 사이즈와 관련이 있는가?
표본이 많으면 많을수록 그룹 A와 B의 결과 차이가 적더라도 유의미하다고 인정한다.
이는 신뢰도의 문제 (이왕이면 최대한 더 많은 사람에게 물었을 때 오는 신뢰)
표본 크기와 AB 테스트 결과의 차이에서 우리가 착각하는 것
우리의 직관 : 100000명끼리 비교해서 차이가 고작 0.2%p 수준이다.
통계 : 0.2%p 차이밖에 없더라도 표본이 100000명이나 되니 이 정도면 충분하다 + 우연이라고 볼 수 없다.
우리는 단순히 비율을 비교하는 게 아니다.
비율의 차이가 믿을 수 있는 결과인지, 우연이 아니란 걸 증명할 수 있는지 알고 싶은 것.
표본이 커서 모집단의 크기에 가까워질수록 추축은 더욱 정확해지고, A와 B의 차이가 우연에 의해 발생할 가능성은 줄어듦
-> 두 그룹의 차이가 아무리 적어도 표본만 크면 충분히 유의미할 수도 있다.
--
5) AB 테스트에 적정한 표본과 주의 사항
표본이 얼마나 필요한가? = 두 방안의 결과가 몇 % 정도 차이가 날 것이라고 기대하는가?
신뢰 수준에 따라 (1%, 5%) 많은 차이가 있음.
기본 전환율이 20%
-> 차이가 5% (15%~25%)
-> 차이가 1% (19%~21%)
표본 수를 결정할 때도 근거와 이유를 명시한 후에 결정하는 것이 중요하겠다는 생각이 듦
(주간 이용자 수나 10000명을 달성할 때까지의 평균 기간을 판단하는 등)
피해야 할 사항
1) 내가 미는 방안이 이길 때까지 기다리기
2) 내가 미는 방안이 지기 전에 그만두기
3) A안과 B안의 실험을 다른 날짜에 시작하기
- 표본 수를 결정할 때도 근거와 이유를 명시한 후에 결정하는 것이 중요하겠다는 생각이 듦 (주간 이용자 수나 10000명을 달성할 때까지의 평균 기간을 판단하는 등)
- AB 테스트 결과를 얻었을 때, 단순히 성공실패에만 신경을 쓰는 것이 아니라 왜 이 B를 골랐었는지를 상기하고, A와의 차이점을 비교하여 앞으로 고르지 말아야 할 특이사항을 뽑아내는 과정에서 성장이 이루어진다고 생각함
- 용어 정리 : 표본 = 트래픽 ← 같은 맥락으로 사용됨을 기억해두기
https://yozm.wishket.com/magazine/detail/1667/
https://yozm.wishket.com/magazine/detail/1680/
'내일배움캠프 일지 > 아티클스터디' 카테고리의 다른 글
아티클스터디 240813 - A/B 테스트 제대로 이해하기 2, 3 (0) | 2024.08.13 |
---|---|
240809 아티클스터디 - A/B 테스트 제대로 이해하기: 1. 테스트를 설계할 때 우리의 진짜 질문은? (0) | 2024.08.09 |
240807 아티클스터디 - SELECT로 SQL 쿼리를 시작하지 마라 (1) | 2024.08.07 |
240719 아티클스터디 - 대기업 데이터분석가가 추천하는 데이터 분석 프로젝트 주제 (0) | 2024.07.19 |
240716 아티클스터디 - 데이터 기반 의사결정의 장점 (2) | 2024.07.16 |