728x90

◆ 일상/◆ 일상-통계 공부하기 7

도구변수란?

[네이버 블로그에서 퍼왔습니다] 주제 : 전쟁 참전이 그사람의 평생 소득에 어떤 인과적인 효과를 주는지를 알고자함. 도구변수(Z) : Draft lottery (징병 우선순위 선발) Treatment(W) : 전쟁 참전 여부 임금 (Z) : 인과효과에 의한 결과 비선발 선발 전쟁 비 참전 5948 1915 전쟁 참전 1372 865 ​ 비선발 선발 전쟁 비 참전 5.4472 5.4028 전쟁 참전 5.4076 5.4289 lottery와 상관없이 징병을 가는 Always takers가 있을수있고, lottery와 상관없이 징병을 가지 않겠다는 Never takers가 있을수있음. 전쟁이라는 context를 생각..

종속변수 로그화 하는 이유

회귀분석에서 로그가 취해진 변수는 % 단위로 변화한다고 생각해 주세요. 자, 그 경우의 수라는 건, ⓵ 독립변수에만 로그가 취해진 경우 ⓶ 종속변수에만 로그가 취해진 경우 ⓷ 둘다 로그가 취해진 경우 가 있을 수 있겠습니다. 구체적인 예와 해석을 들어보면, ⓵ 독립변수에만 로그가 취해진 경우 회귀) y = 상수항 + 1234*ln(x) 이라면 해석) x가 1% 변화할 때 y의 변화량은 12.34이다. ⓶ 종속변수에만 로그가 취해진 경우 회귀) ln(y) = 상수항 + 0.1234*(x) 해석) x가 1 증가할 때 y는 12.34%증가한다. ⓷ 둘 다 로그가 취해진 경우 회귀) ln(y) = 상수항 + 0.413*ln(x) 해석) x가 1% 증가할 때, y는 0.4% 증가한다. 이게 쉬운 것처럼 쓰긴 했지..

[펌] 다중공선성 해결 방법

https://datascienceschool.net/03%20machine%20learning/06.04%20%EB%8B%A4%EC%A4%91%EA%B3%B5%EC%84%A0%EC%84%B1%EA%B3%BC%20%EB%B3%80%EC%88%98%20%EC%84%A0%ED%83%9D.html 6.4 다중공선성과 변수 선택 — 데이터 사이언스 스쿨 .ipynb .pdf to have style consistency --> datascienceschool.net https://ysyblog.tistory.com/122 [회귀분석] 회귀분석 실습(4) - 다중공선성 (Python) 1. [회귀분석] 회귀분석 실습(1) - Statsmodel분석/데이터 스케일링(Python) : ysyblog.tistory.c..

변수를 바꿔가면서 반복적으로 회귀분석할 수 있는 명령어

Stata에서 변수를 바꿔가며 반복적으로 회귀분석을 수행하는 명령어는 다양한 방법으로 가능합니다. 아래에 몇 가지 예시를 제시해 드리겠습니다: foreach 루프를 사용한 반복 분석: foreach 루프를 활용하여 여러 변수를 순차적으로 회귀분석할 수 있습니다. 예를 들어, 다음과 같이 변수 목록을 지정하고 foreach 루프를 사용하여 회귀분석을 반복할 수 있습니다: local varlist "x1 x2 x3 x4" foreach var of local varlist { reg y `var' } forvalues 루프를 사용한 반복 분석: forvalues 루프를 활용하여 숫자 범위를 지정하고 해당 범위 내의 변수를 순차적으로 회귀분석할 수 있습니다. 예를 들어, 다음과 같이 변수 인덱스 범위를 지정하..

coursera 강의 - Data Visualization in R with ggplot2

좋은 강의를 찾았다. 물론 무료로는 한시적으로 일주일 정도 들을 수 있고, 1-3주 차 강의만 들을 수 있지만 R로 그림 그리는 법을 익힐 수 있다. 자막이 있어서 어느 정도 이해할 수 있다. 동영상과 R-code를 다운 받을 수 있다. R 문법이 어렵지만 조금만 익숙해진다면 그림을 잘 그릴 수 있다. 하다가 문법 오류가 나면 Copilot 에게 물어보면 된다. R 시각화 강의를 듣고 싶다면. -> https://www.coursera.org/

T-test 가 이거였지!

1. single sample t-test : 하나의 변수가 특정 값과 같은지 확인하는 방법, stata에서 사용하는 command는 (ttest 변수==특정 값) 2. paired ttest : 한 집단이 경험한 두 가지의 사실을 비교할 때 사용, stata command로는 (ttest 수학==과학) 3. independent group ttest: 두 집단이 경험한 한 가지 사실이 있을 때 그 두 집단 간의 평균을 비교 ttest를 시작하기 전에 주의할 것은, 비교를 하게 될 집단의 속성이 평균에서 동일하게 떨어져 있는가의 여부인데요. 각 집단이 매우 다른 수준으로 평균에서 흩어져 있다면, 두 집단의 특성이 다르기 때문에 평균을 비교하는게 어려울 수 있겠죠. 따라서 우리는 ttest를 하기 전에 두..