일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 다중공선성
- ★
- AB테스트
- 시각화
- 통계학
- DATE_SUB
- 아티클스터디
- 리스트
- SQLD
- Leetcode
- f-string
- 이중for문
- 데이터시각화
- Til
- 내일배움일지
- 한줄for문
- Set
- 반복문
- 내배캠_학습기록
- 태블로
- 가설검정
- python
- 프로그래머스
- Max
- 내일배움캠프
- 데이터전처리
- 선형회귀
- map
- Join
- SQL
- Today
- Total
목록내일배움캠프 일지/아티클스터디 (7)
노력에는 지름길이 없으니까요
4) AB 테스트 표본 크기와 유의미한 결과의 관계유의미하지 않은 결과가 표본 사이즈와 관련이 있는가? 표본이 많으면 많을수록 그룹 A와 B의 결과 차이가 적더라도 유의미하다고 인정한다.이는 신뢰도의 문제 (이왕이면 최대한 더 많은 사람에게 물었을 때 오는 신뢰) 표본 크기와 AB 테스트 결과의 차이에서 우리가 착각하는 것우리의 직관 : 100000명끼리 비교해서 차이가 고작 0.2%p 수준이다.통계 : 0.2%p 차이밖에 없더라도 표본이 100000명이나 되니 이 정도면 충분하다 + 우연이라고 볼 수 없다. 우리는 단순히 비율을 비교하는 게 아니다.비율의 차이가 믿을 수 있는 결과인지, 우연이 아니란 걸 증명할 수 있는지 알고 싶은 것.표본이 커서 모집단의 크기에 가까워질수록 추축은 더욱 정확해지고, ..
2. AB테스트를 위한 기초 통계 이해하기기초통계 개념- 결과를 해석하는 데에 필요하다.1. 모집단과 표본우리는 결코 '전체'를 알 순 없다. 이번 실험의 대상은 어디까지나 '일부'다. 2. 일부를 통해서 전체에 대해 추론할 수 있다.아무리 일부일지라도 이 숫자가 충분하면, 일부를 통해 전체에 대해서 추측, 추론, 추정 가능하다. 3. 귀무가설과 대립 가설, 양측 검정과 단측 검정단측 검정 (one-sided) - A가 B보다 무조건 높거나 낮을 것이다.양측 검정 (two-sided) - 뭐가 더 높을지 낮을지는 모르나 차이는 있을 것이다. 4. 실험 결과도 결국 '추측'이다.점 추정 : 정확히 한 점을 콕 짚어 추측하는 것구간 추정 : 특정 범위/구간을 기준으로 추측하는 것 5. 그래서 정말 우연이 ..
https://yozm.wishket.com/magazine/detail/1633/ A/B 테스트 제대로 이해하기: ①테스트를 설계할 때 우리의 진짜 질문은? | 요즘IT서비스 기획, PM, 그리고 그로스 해킹과 관련한 부트캠프나 신입 교육 과정을 살펴보면, A/B 테스트에 관한 이야기가 많다. 아마도 서비스를 개선하는 실험 방안 중 하나로 A/B 테스트가 가장 유명(yozm.wishket.com 좋지 않은 A/B 테스트의 예시트래픽을 절반으로 나눈다, 변수는 1개만 둔다 등 A/B 테스트의 사례나 세팅 방법 정도로 설명이 그친다.단순히 아무거나 A와 B안으로 분리한 다음 가져와서 더 괜찮은 것을 찾았다 식으로 마무리 짓는다. A/B 테스트를 설계할 때 우리가 진짜로 궁금해하는 것1) 우리는 암묵적으..
https://towardsdatascience.com/dont-start-your-sql-queries-with-select-clause-d30fa1b701f6 Don’t Start Your SQL Queries with the ‘Select’ StatementFollow this right approach to write your SQL queriestowardsdatascience.com 팀원분이 추천해주신 아티클로 스터디 진행하기로 했다. 생각해보면 SQL 문제풀이를 할 때 항상 요구되는 컬럼명을 SELECT에 기재하고 시작하는 버릇이 있는데,아티클을 읽으며 깨닫는 점이 있기를 바란다. '이상적인' 쿼리 작성 순서는 SQL이 쿼리를 실행하는 방법과 일치해야 한다. 1. 항상 FROM/JOIN으로..
https://boottent.com/community/article/20230609135911 부트텐트 커뮤니티누구나 참여할 수 있는 부트텐트 커뮤니티boottent.com이건 아티클의 링크이다. 데이터 분석 프로젝트 주제 선정법 데이터 분석 프로젝트 5단계데이터 분석 프로젝트 주제 선정▼활용 데이터셋 찾기▼데이터 분석 프로젝트 문제 정의▼데이터 분석 진행 ▼데이터 분석 시각화 및 포트폴리오 구성가장 중요한 것은 1~3 단계.무엇보다 요구되는 것은, 문제를 파악하는 역량과 논리력이다.따라서 어떤 주제를 어떻게 정의했느냐가 합격의 키 포인트가 된다. 문제 해결 역량을 바탕으로 데이터 분석 프로젝트 주제는 아래 3가지 대표 문제 유형안에서 선정하기를 추천한다.대표 문제 유형1. 회귀 (Regressio..
https://yozm.wishket.com/magazine/detail/1051/ 데이터 기반 의사결정의 장점 | 요즘IT데이터 기반 의사결정은 의사결정을 내리기 전, 데이터를 활용해서 이대로 진행해도 무리가 없는지 체크하여 행동 방침을 승인하는 과정을 의미합니다. 데이터 기반의 의사결정은 분명 수많은yozm.wishket.com 모든 결정을 내릴 때 본능적인 직관력에 의존하는 것은 대단히 위험한 실수가 될 수 있다.우리는 주어진 정보를 꼼꼼히 따져보고 이해하고, 객관적으로 수량화해야 한다. 데이터 기반 의사결정이란?본격적으로 의사결정을 내리기 전, 데이터를 활용해서 이대로 진행해도 무리가 없는지 체크하여 행동방침을 승인하는 과정. Date-Driven Decision-Making (DDDM)이라고 ..
아티클 정리 https://yozm.wishket.com/magazine/detail/1821/ 데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화yozm.wishket.comhttps://blog.naver.com/businessinsight/221918586252 통계로 거짓말 하는 방법?..'시각화 기법'에만 매몰되지 않아야│인터비즈출처 프리미엄 경영 매거진 DBR 196호 필자 서울과학종합대학원 빅데이터 MBA 주임교수 김진호 인터...blog.naver.com 이쪽 자료도 함께 참고했다. 블로그가 참고했다는..