결합확률밀도함수 예제 4번 피어슨 실험공식 마할라노비스 거리 베이즈 정리 변화율 공식 전확율 공식
미분
- 다항함수 : (x^n)’ = nx^(n-1)
- 지수함수 : (a^x)’ = a^x * ln(a)
- 지수함수(e) : (e^x)’ = e^x
- 로그함수 : (log_a(x))’ = 1 / (x * ln(a))
- 로그함수(e) : (ln(x))’ = 1 / x
- 합/차 공식 : (f(x) ± g(x))’ = f’(x) ± g’(x)
- 곱셈 공식 : (f(x)g(x))’ = f’(x)g(x) + f(x)g’(x)
- 나눗셈 공식 : (f(x)/g(x))’ = (f’(x)g(x) - f(x)g’(x)) / (g(x))^2
- 연쇄 법칙 : (f(g(x)))’ = f’(g(x))g’(x)
적분
- 분수 : ∫(c/(ax+b))dx = (c/a)ln|ax+b|+C
확률
표본공간(S)
: 가능한 모든 결과들의 집합 e.g. 자연수의 표본공간 S={1,2,3,…}원소(element)
또는표본점(sample point)
: 표본공간의 결과 하나사건(event)
: 표본공간의 부분 집합으로 표본점들의 집합복원추출
: 뽑은 표본을 다시 모집단에 넣어서 추출비복원추출
: 뽑은 표본을 모집단에 넣지 않고 추출단순사건(simple event)
또는근원사건(elementary event)
: 단 하나의 표본점으로 구성된 사건복합사건(compound event)
: 두 개이상의 표본점으로 구성된 사건공사건(∅, empty event)
: 표본점이 하나도 들어있지 않은 사건합사건
: A⋃B, 두 사건 모두의 표본점으로 구성된 사건곱사건
: A⋂B, 두 사건이 공통으로 갖는 표본점으로 구성된 사건여사건
: A-B, A에 포함되지만 B에는 포함되지않는 표본점으로 구성된 사건배반사건
: A⋂B=∅인 사건 비복원추출일 경우 배반사건?쌍마다 배반사건
: 다수의 사건이 서로 배반사건일때분할
: 쌍마다 배반사건을 모두 합사건했을때 표본공간이 나오는 경우확률
: 어떤 사건 A에 대한 확률 P(A)=n(A)/n(S)조건부확률
: 두 사건 A,B에 대해 B일 때 A일 확률 P(A|B)=P(A⋂B)/P(B)곱의 법칙
: P(A⋂B⋂C)=P(A)P(B|A)P(C|A⋂B)독립
: P(A|B)=P(A), P(A⋂B)=P(A)P(B)종속
: 두 사건 A,B가 독립이 아닌 경우쌍마다 독립
: 다수의 사건이 서로 독립일때
문제
- 동전을 세 번 던지는 실험의 표본공간
- 공정한 주사위 두 번 반복해서 던지는 게임에서 나온 눈의 수에 대한 표본공간
- 카드 한장을 뽑는 게임을 할때 표본공간
확률변수
확률변수(X)
: P(X)에 대해 P(X=x)는 확률변수 X=x일때 확률 p를 만족상태공간(Sx)
: 확률변수 X의 가능한 모든 값의 집합확률분포
: 확률변수 X가 특정한 값을 가질 확률을 나타내는 함수를 의미한다.확률분포표
: 확률분포를 나타낸 표확률히스토그램
: 확률분포를 나타낸 그래프분포함수(F(x))
: F(x)=P(X<=x)이산확률변수
: 이산적인(셀수 있는) 값을 갖는 확률변수확률질량함수(f(x))
: x에 대한 확률을 표현한 함수(f(x)=0, otherwise)분포함수(F(x))
: F(x)=P(X<=x)
연속확률변수
: 연속적인 값을 갖는 확률변수확률밀도함수(f(x))
: f(x)>=0인 모든 x에 대해 f(x)를 적분한 값이 1인 경우의 f(x)분포함수(F(x))
: 확률밀도함수를 음의 무한대부터 x까지 적분한 것
기댓값
또는평균
: μ = E(x) = ∑(x*p(x))중앙값(Me)
: F(x)=0.5인 x (0 <= Me 개수 <= 무한대)최빈값(Mo)
: f(x)의 최대값에 대응하는 x (0 <= Mo 개수 < 무한대, 균등하면 최빈값은 없음)사분위수
: F(Q1)=0.25, F(Q2)=0.5, F(Q3)=0.75를 만족하는 Q1, Q2, Q3백분위수(xp)
: x0.25 = 제1사분위수 = 25백분위수 = Q1양의 비대칭분포
: 왼쪽으로 치우쳐짐, Mo < Me < μ음의 비대칭분포
: 오른쪽으로 치우쳐짐, μ < Me < Mo대칭분포
: 좌우대칭, Mo = Me = μ분산(Var(X), σ²)
: ∑(E(X-μ)²)표준편차(σ)
: 분산의 양의 제곱근표준화 확률변수(Z)
: Z = (X-μ)/σ
확률 질량함수는 모든 실수 x에 대해 f(x)>=0이어야하고 f(x)를 모두 더한 값은 1이어야 한다. 분포함수에서 P(X=x)=F(x)-F(x-)이며 만약 분포함수의 그래프가 연속이면 P(X=x)=0이다.
E(aX + bY) = aE(X) + bE(Y)이고, X와 Y가 독립인 경우 E(XY) = E(X)E(Y)
p급수
체비쇼프 부등식 : k>1일 때 P(μ-kσ <= X < μ+kσ)의 하한값은 1-1/k²이다.
표준화 확률변수의 평균(μz)은 0이고 분산(σ²z)는 1이다. Var(X) = E(X²) - E(X)²
문제 (x)²+(x-1)²+…+(x-100)²의 최소값은 x가 평균값일때 공장을 어느위치에 놓아야하는 문제는 중앙값으로 풀면됨 만약 |x|+|x-1|+…|x-100|일 때 x=50일 때 최소값
*피어슨의 실험공식(단봉형)
결합확률분포
결합확률분포
: 확률변수가 여러개일 때 확률분포결합확률질량함수(f(x,y, ...))
: 여러 이산확률변수(X=x,Y=y, …)에 대한 확률질량함수주변확률질량함수(fX(x))
: fX(x) = P(X=x) = 모든 y에 대한 f(x,y)의 합결합확률밀도함수(f(x,y, ...))
: 여러 연속확률변수(X=x,Y=y, …)에 대한 확률밀도함수주변확률질량함수(fX(x))
: fX(x) = P(X=x) = 모든 y에 대해 f(x,y)를 편적분한 함수결합분포함수(F(x,y))
: F(x,y) = P(X<=x, Y<=y), 이산형인 경우 시그마로, 연속형인 경우 적분으로 계산주변분포함수(FX(x))
: FX(x) = P(X<=x), 이산형인 경우 시그마로, 연속형인 경우 적분으로 계산조건부 확률분포
: A={X=x}, B={Y=y}라 할때 P(A|B) = f(x,y)/fY(y)조건부 확률질량함수
: f(x|y) = f(x,y)/fY(y)조건부 확률밀도함수
: 위와 동일항등분포
: fX(x) = fY(y)- 결합확률분포에서
기댓값(E(u(x,y)))
: E(u(X,Y))는 u(x,y)f(x,y)를 ∑ 또는 ∫- u(X,Y)=X이면 μx = E(X) = ∑∑(x*f(x,y))
공분산(Cov(X,Y))
: Cov(X,Y) = E((X-μx)(Y-μy))- Cov(X,Y) = E(XY) - E(X)E(Y)
- X,Y가 독립이면 Cov(X,Y)=0 (역은 성립하지 않음)
- Cov(X,X) = var(X)
- cov(aX+b, cY+d) = ac*Cov(X,Y)
- Var(X±Y) = Var(X)+Var(Y)±2Cov(X,Y)
상관계수(p)
: p = Corr(X,Y) = Cov(X,Y)/(σX, σY)- 양의 상관관계 : p>0인 경우. X,Y가 비례관계 경향을 보임
- 음의 상관관계 : p<0인 경우. X,Y가 반비례관계 경향을 보임
- 무상관관계 : p=0인 경우. Cov(X,Y)=0이므로 X,Y는 독립
- -1<=p<=1, p=1인 경우 완전 양의 상관관계, p=-1인 경우 완전 음의 상관관계
- E(X,Y) = μx*μy+p*σX*σY
- Corr(aX+b,cY+d)는 ac>0인 경우 Corr(X,Y), ac<0인 경우 Corr(X,Y)
상태공간 안에 모든 x,y에 대해 f(x,y)=fX(x)fY(y)이 성립하면 독립이고, 아니면 종속이다. 결합확률분포도 쌍마다 독립이 존재한다. 두 개 이상의 확률변수가 독립이고 항등분포를 이루면 i.i.d. 확률변수라고 한다.
이산확률분포
이산균등분포(X~DU(n))
: 확률질량함수 f(x)=1/n인 경우- 평균 = (n+1)/2
- 분산 = (n²-1)/12
초기하분포(X~H(N,M,n))
: 전체 N개에서 n개를 추출할 때 M개에 포함되어 있는 표본의 개수를 X- f(x) = M_C_x * (N-M)_C_(n-x) / N_C_n
- 평균 = nM/N
- 분산 = nM/N(1-M/N)((N-n)(N-1))
- 다변량 초기하분포 : P(X1=x1, … ,Xk=xk) = (M1_C_x1* … *Mk_C_xk)/N_C_n
베르누이분포(X~B(1,p))
: f(x)=q(x=0) or p(x=1) or 0(otherwise)- 베르누이 시행 : 베르누이 실험을 독립적으로 반복하여 시행(이항분포)
- 평균 = p
- 분산 = pq
이항분포(X~B(n,p))
: f(x) = n_C_x*(p^x)*(q^(n-x)) or 0- 평균 = np
- 분산 = npq
- P(X>=a) = 1-P(X<=a-1)