전체 글 52

통계적 가설 검정(Statistical Inferences)

1. 통계적 추론:"모든 데이터를 볼 수 없으니까, 일부만 보고 전체를 추측하자!" 통계적 추론에는 3가지 방법:방법설명예시점 추정정확한 수치 추정평균이 딱 50일 거야구간 추정범위를 추정평균이 48~52 사이일 거야가설 검정가설을 세우고 검증정말 평균이 50일까? 이 중, 가설 검정에 대해 알아보자!2. 가설검정(Hypothesis Testing): 샘플 데이터를 이용해, 모집단에 대한 가설이 맞는지 틀린지를 통계적으로 검증하는 과정! 어떤 주장이 맞는지 틀린지 통계적으로 따져보는 과정💡 가설(hypothesis) = 아직 증명되지 않은 주장수학적 가설 → 참/거짓으로 딱 떨어지게 판별 가능통계적 가설 → 100% 확신은 못 하고, '확률적으로 유의미한가'를 보는 것 예를들어,  A라는 피자집에서,"..

통계 2025.02.25

[R 기초] 데이터 전처리 - 결측값 처리 (삭제 & 대체)

데이터 분석에서 결측값(missing values)은 자주 마주치는 문제다.결측값은 데이터에 값이 없는 경우를 의미하며, 데이터를 처리하는 과정에서 반드시 해결해야 하는 중요한 부분이다. R에서는 결측값을 NA로 표시한다.NA는 Not Available을 의미하며, R의 모든 기본 연산에서 특별한 값으로 취급된다.결측값을 처리할 때는 NA를 다루는 방법을 알아야 한다. 이번 포스팅에서는 R에서 결측값을 처리하는 방법에 대해 다루며, 결측값을 삭제하거나 대체하는 기본적인 방법을 소개한다.결측값 처리 방법 (삭제, 대체 등)결측값을 처리하는 주요 방법은 두 가지:결측값 삭제: 데이터셋에서 결측값을 포함하는 행(row) 또는 열(column)을 삭제하는 방법이다. 이 방법은 결측값이 적고, 삭제해도 데이터에 ..

R 2025.02.23

[R 기초] R에서 데이터 불러오기 및 데이터 확인하기

R에서 (1)데이터를(CSV파일) 불러오는 방법과 (2)불러온 데이터의 구조를 확인하는 방법을 알아보자. 1. 기존 데이터 불러오기(read.csv())R에서는 데이터를 외부 파일에서 불러올 때 read.csv() 함수를 많이 사용한다. ✔ read.csv("파일명.csv") : CSV 파일을 불러오는 함수✔ header=F : 첫 행이 변수명이 아니라 데이터일 경우 사용# CSV 파일 불러오기dt  이때 파일 경로를 정확히 지정해야 하며, 작업 디렉토리에 파일이 있으면 경로를 간단히 입력할 수 있다.🔥TIP: 만약 파일이 작업 디렉토리에 없다면 전체 경로를 지정하거나 file.choose()로 파일을 직접 선택할 수 있다# 파일을 직접 선택하여 불러오기dt  2. 데이터 구조 확인하기 (str(), ..

R 2025.02.22