분류 전체보기 47

Am I self-motivated, or just following the flow?

대학원 생활, 나는 충분히 준비되어 있었을까?(아직 일주일도 안 되었는데 벌써?!) 대학원에 오기 전, 나는 내가 충분히 motivated(동기부여) 되어 있다고 생각했다.나는 관심 있는 연구 분야가 있었고, 그 분야에서 (어떤 연구던) 연구를 하면 된다고 생각했다.연구실에 들어가면 자연스럽게 진행되는 프로젝트를 하나 맡고, 거기서 내가 해야 할 일이 정해질 거라고 예상했다. 하지만, 교수님들은 내가 생각한 것보다 훨씬 더 구체화된 대답을 기대하셨다. 그리고 특히 근래들어"단순히 연구 분야를 정하는 것만으로는 부족하다."문제는 "그 안에서 나는 어떤 연구를 하고 싶은가?"였다.나는 막연하게 분야만 생각했지,어떤 문제를 해결하고 싶은지,어떤 연구를 통해 성장하고 싶은지,어떤 스킬을 쌓고 싶은지그동안 이걸 ..

대학원이야기 2025.03.05

대학원 입학(개강)을 앞두고

3월 4일 대학원 입학(개강)을 앞두고 있습니다.대학원을 이미 다녀본 친구들은 개강 전까지 많이 놀아두라고 했지만, 솔직히 그럴 수가 없었습니다. 그동안 통계학(R), 프로그래밍(딥러닝, 머신러닝) 등을 비롯하여 공부할 것이 너무 많았습니다. 부족한 나의 모습을 직면하여, 개강 전에 기본이라도 다져놔야 한다는 생각에 하루하루가 바빴고, 지금도 여전히 바쁜 나날을 보내고 있습니다. (입학하기도 전부터..!) 사실 저는 대학원 입학을 체계적으로 준비한 사람이 아니었고, 특히 원래 생각했던 곳과는 다른 분야로 오게 되면서 공부해야 할 양이 더욱 많아졌습니다. 그래서 더 급하게 여러 가지를 배우고 익히느라 숨이 찼지만, 그렇다고 해서 힘들기만 한 것은 아닙니다. 아직까지는 배움의 즐거움이 더 크다고 느끼고 있습..

대학원이야기 2025.03.02

[통계] 제 1종 오류(α) vs 제 2종 오류(β)

제 1종 오류와 제 2종 오류가 헷갈려서 다시 정리해본다. 제1종 오류(α) vs 제2종 오류(β)구분정의제1종 오류 (Type I Error, α) (False Positive)귀무가설이 참인데 잘못 기각하는 오류제2종 오류 (Type II Error, β) (False Negative) 귀무가설이 거짓인데 잘못 채택하는 오류 제 1종 오류 vs 제 2종 오류, 많이 나오는 예제로 이해하자[예제 1] 법원 판결실제상황결과 오류 여부결백한 사람 (H₀ 참)유죄 선고 (H₀ 기각)제1종 오류 (α) → 억울한 사람을 잡음유죄인 범인 (H₀ 거짓)무죄 판결 (H₀ 채택)제2종 오류 (β) → 범인을 놓침 🔥 헷갈릴때는, 이렇게 외우자!제1종 오류(α): "나 무죄인데, 유죄 선고 받아서 마음이 아파( α ..

통계 2025.02.27

[통계] 단측 검정(One-tailed Test) 이론 & 예시

1. 단측 검정이란?단측 검정은 가설 검정에서 한 방향으로만 차이를 검증할 때 사용하는 방법.오른쪽 단측 검정: 값이 기준보다 큰지 확인할 때왼쪽 단측 검정: 값이 기준보다 작은지 확인할 때 단측검정 vs 양측검정 비교표구분양측 검정(Two-tailed Test)단측 검정 (One-tailed Test)유의수준 (α)α = 0.05 → 양쪽으로 나눠 각 2.5%씩 분배α = 0.05 → 한쪽에 5% 집중기준 Z값±1.961.645 또는 -1.645 (검정 방향에 따라 선택)기각 기준Z값이 ±1.96을 벗어나면 귀무가설 기각Z값이 1.645 (또는 -1.645)를 넘으면 기각신뢰구간중앙 95%한쪽으로 95%사용 예시"평균이 다를까?" → 차이가 있는지 확인"평균이 더 클까/작을까?" → 특정 방향 확인적합..

통계 2025.02.26

통계적 가설 검정(Statistical Inferences)

1. 통계적 추론:"모든 데이터를 볼 수 없으니까, 일부만 보고 전체를 추측하자!" 통계적 추론에는 3가지 방법:방법설명예시점 추정정확한 수치 추정평균이 딱 50일 거야구간 추정범위를 추정평균이 48~52 사이일 거야가설 검정가설을 세우고 검증정말 평균이 50일까? 이 중, 가설 검정에 대해 알아보자!2. 가설검정(Hypothesis Testing): 샘플 데이터를 이용해, 모집단에 대한 가설이 맞는지 틀린지를 통계적으로 검증하는 과정! 어떤 주장이 맞는지 틀린지 통계적으로 따져보는 과정💡 가설(hypothesis) = 아직 증명되지 않은 주장수학적 가설 → 참/거짓으로 딱 떨어지게 판별 가능통계적 가설 → 100% 확신은 못 하고, '확률적으로 유의미한가'를 보는 것 예를들어,  A라는 피자집에서,"..

통계 2025.02.25

[R 기초] 데이터 전처리 - 결측값 처리 (삭제 & 대체)

데이터 분석에서 결측값(missing values)은 자주 마주치는 문제다.결측값은 데이터에 값이 없는 경우를 의미하며, 데이터를 처리하는 과정에서 반드시 해결해야 하는 중요한 부분이다. R에서는 결측값을 NA로 표시한다.NA는 Not Available을 의미하며, R의 모든 기본 연산에서 특별한 값으로 취급된다.결측값을 처리할 때는 NA를 다루는 방법을 알아야 한다. 이번 포스팅에서는 R에서 결측값을 처리하는 방법에 대해 다루며, 결측값을 삭제하거나 대체하는 기본적인 방법을 소개한다.결측값 처리 방법 (삭제, 대체 등)결측값을 처리하는 주요 방법은 두 가지:결측값 삭제: 데이터셋에서 결측값을 포함하는 행(row) 또는 열(column)을 삭제하는 방법이다. 이 방법은 결측값이 적고, 삭제해도 데이터에 ..

R 2025.02.23

[R 기초] R에서 데이터 불러오기 및 데이터 확인하기

R에서 (1)데이터를(CSV파일) 불러오는 방법과 (2)불러온 데이터의 구조를 확인하는 방법을 알아보자. 1. 기존 데이터 불러오기(read.csv())R에서는 데이터를 외부 파일에서 불러올 때 read.csv() 함수를 많이 사용한다. ✔ read.csv("파일명.csv") : CSV 파일을 불러오는 함수✔ header=F : 첫 행이 변수명이 아니라 데이터일 경우 사용# CSV 파일 불러오기dt  이때 파일 경로를 정확히 지정해야 하며, 작업 디렉토리에 파일이 있으면 경로를 간단히 입력할 수 있다.🔥TIP: 만약 파일이 작업 디렉토리에 없다면 전체 경로를 지정하거나 file.choose()로 파일을 직접 선택할 수 있다# 파일을 직접 선택하여 불러오기dt  2. 데이터 구조 확인하기 (str(), ..

R 2025.02.22

[R 기초] R에서 말하는 벡터(Vector)란?

R에서 벡터(Vector)는 가장 기본적인 데이터 구조로, 하나의 데이터 유형을 가진 값들의 집합이다.쉽게 말해, 벡터는 1차원 배열에 해당하며, 같은 데이터 유형만 포함하는 값들의 모임이다.벡터의 특징1. 1차원 배열벡터는 1차원 데이터 구조로, 여러 값들이 한 줄로 나열된 형태.예를 들어, 숫자들의 리스트를 벡터로 저장할 수 있다. 2. 하나의 데이터 유형만 포함벡터는 같은 타입의 데이터만 저장할 수 있다.예를 들어, 숫자형 벡터, 문자형 벡터, 논리형 벡터가 있다.숫자형 벡터: 숫자만 포함문자형 벡터: 문자만 포함논리형 벡터: TRUE/FALSE만 포함만약, 숫자와 문자가 섞이면 모든 값이 문자형으로 바뀐다.벡터 생성 방법1. c() 함수 사용벡터 생성의 가장 기본적인 방법은 c() 함수를 사용하는..

R 2025.02.21

[R 기초] R에서 자료 입력 및 저장하기

R에서 데이터를 직접 입력하거나 CSV 파일을 저장하는 방법을 알아보자.(CSV 불러오는 방법은 다음 포스팅에서!) 1. 데이터를 직접 입력하기R에서는 벡터(Vector)를 활용해 데이터를 직접 입력할 수 있다. ✔ c() : 여러 개의 값을 벡터로 입력할 때 사용✔ rep(k, n) : 특정 값을 n번 반복✔ data.frame() : 여러 변수를 모아서 데이터 프레임 생성 💡 Vector란?R의 가장 기본적인 데이터 구조로, 하나의 데이터 유형을 가진 값들의 집합벡터는 1차원 배열에 해당하며, 동일한 타입의 데이터만 포함할 수 있음💡 데이터 프레임이란?엑셀(Excel) 표처럼 행과 열로 이루어진 데이터 구조각 열(컬럼)마다 다른 데이터 유형을 포함 가능R에서 가장 많이 사용하는 데이터 형태!# 개..

R 2025.02.20

[R 기초] R에서 작업 경로 설정하기

R에서 데이터를 불러오려면, 작업 경로(Working Directory)를 정확히 설정해야 한다.작업 경로(Working Directory)란?작업 경로는 파일을 저장하고 불러오는 기준이 되는 폴더를 말한다.R에서 데이터를 저장하거나 불러올 때, 이 경로를 정확히 설정하는 것이 중요하다. 1. R에서 작업 경로 설정하기방법 1: 명령어로 설정하기 (R, Rstudio 공통)# 작업 경로 설정setwd("C:/Users/내폴더") # 현재 작업 경로 확인getwd() 🔥 TIP: Windows 에서 현재 경로를 모른다면? 파일 탐색기에서 작업 폴더를 열어 상단 주소창을 클릭하면 파일 경로가 텍스트로 변한다.복사 + 붙여넣기 하면 쉽게 현재 경로를 따올 수 있다. 주의사항:(1) 백슬래시 \ 대신 슬래시 ..

R 2025.02.19