본문 바로가기

개념정리/Python8

▷ 연속형 확률변수 - 1차원 연속형 확률변수 ▷ 1차원 연속형 확률변수 - 연속형 확률변수 확률변수가 취할 수 있는 값이 연속적인 확률변수 특정 값을 취하는 확률은 정의되지 않음 확률변수가 어느 구간에 들어가는 확률을 정의 - 확률밀도함수 확률변수가 취할 수 있는 값은 구간 [a,b] 확률은 확률밀도함수(PDF) 또는 밀도함수 f(x)에 의해 정의 어떤 특정 값을 취하는 확률로는 정의되지 않음 f(x) ≠ P(X=x) import numpy as np import matplotlib.pyplot as plt from scipy import integrate import warnings warnings.filterwarnings('ignore',category=integrate.IntegrationWarning) - f(x)의 확률밀도 함수 구하기 .. 2023. 4. 2.
▷ 대표적인 이산형 확률변수 - 베르누이 분포, 이항분포, 기하분포, 포아송분포 import numpy as np import matplotlib.pyplot as plt from scipy import stats - 기댓값, 분산, 확률, 그래프를 함수로 나타내기 linestylies = ['-','--',':'] # 그래프에서 선의 종류 def E(X, g=lambda x: x): x_set, f = X return np.sum([g(x_k) * f(x_k) for x_k in x_set]) def V(X, g=lambda x: x): x_set, f = X mean = E(X, g) return np.sum([(g(x_k)-mean)**2 * f(x_k) for x_k in x_set]) def check_prob(X): x_set, f = X prob = np.array([f.. 2023. 3. 22.
▷ 이산형 확률변수 - 1 · 2차원 이산형 확률변수 ¶ 1차원 이산형 확률변수 확률변수 X가 취할수 있는 값의 집합 {x1, x2, ...} X가 xk 라는 값을 취하는 확률 ▷ 확률질량함수(확률함수) # 불공정한 주사위의 확률분포 import numpy as np import matplotlib.pyplot as plt # 확률변수가 취할 수 있는 값의 집합 x_set x_set = np.array([1,2,3,4,5,6]) - 불공정한 주사위의 확률변수 구하기 def f(x): if x in x_set: return x/21 else: return 0 X=[x_set,f] # 확률 p_k 구하기 (1 -> 1/21, 2 -> 2/21, ... 6-> 6/21) prob = np.array([f(x_k) for x_k in x_set]) # x_k 와 .. 2023. 3. 22.
▷ Python 추측 통계의 기본 - 표본추출방법, 확률 분포 import numpy as np import pandas as pd import matplotlib.pyplot as plt # 데이터 불러오기 df = pd.read_csv('data/ch4_scores400.csv') ▷ 표본 추출 방법 (모집단 : 추측하고 싶은 관측 대상 전체 // 표본 : 추측에 사용하는 관측 대상의 일부분 // 표본크기 : 표본의 수) 무작위 추출(임의 추출): 임의로 표본을 추출하는 방법 복원추출: 여러 차례 동일한 표본을 선택하는 방법 비복원추출: 동일한 표본은 한번만 선택하는 방법 # 복원 추출 np.random.choice([1,2,3],3) # 비복원 추출 np.random.choice([1,2,3],3,replace=False) # 시드를 0으로 하는 무작위추출 n.. 2023. 3. 20.
▷ Python 2차원 데이터 정리 - 공분산, 상관계수, 산점도, 회귀직선, 히트맵 import numpy as np import pandas as pd # Jupyter Notebok 의 출력을 소수점 이하 3자리로 제한 %precision 3 # DataFrame의 출력을 소수점 이하 3자리로 제한 pd.set_option('display.float_format','{:.3f}'.format) # 데이터 불러오기 df = pd.read_csv('data/ch2_scores_em.csv',index_col = 'student number') # DataFrame 작성하기 en_scores = df['english'].values[:10] ma_scores = df['mathematics'].values[:10] scores_df = pd.DataFrame({'english':en_sc.. 2023. 3. 19.
▷ Python 1차원 데이터 정리(PART 3) - 도수분포표, 히스토그램, 상자그림 import numpy as np import pandas as pd # Jupyter Notebok 의 출력을 소수점 이하 3자리로 제한 %precision 3 # DataFrame의 출력을 소수점 이하 3자리로 제한 pd.set_option('display.float_format','{:.3f}'.format) # 데이터 불러오기 df = pd.read_csv('data/ch2_scores_em.csv',index_col = 'student number') # DataFrame 작성하기 # 학번 순서대로 10명의 영어 점수를 array 데이터 구조 scores에 저장 scores = np.array(df['english'])[:10] # DataFrame scores_df 작성 scores_df = .. 2023. 3. 18.