R 7

[R 기초] 데이터 전처리 - 결측값 처리 (삭제 & 대체)

데이터 분석에서 결측값(missing values)은 자주 마주치는 문제다.결측값은 데이터에 값이 없는 경우를 의미하며, 데이터를 처리하는 과정에서 반드시 해결해야 하는 중요한 부분이다. R에서는 결측값을 NA로 표시한다.NA는 Not Available을 의미하며, R의 모든 기본 연산에서 특별한 값으로 취급된다.결측값을 처리할 때는 NA를 다루는 방법을 알아야 한다. 이번 포스팅에서는 R에서 결측값을 처리하는 방법에 대해 다루며, 결측값을 삭제하거나 대체하는 기본적인 방법을 소개한다.결측값 처리 방법 (삭제, 대체 등)결측값을 처리하는 주요 방법은 두 가지:결측값 삭제: 데이터셋에서 결측값을 포함하는 행(row) 또는 열(column)을 삭제하는 방법이다. 이 방법은 결측값이 적고, 삭제해도 데이터에 ..

R 2025.02.23

[R 기초] R에서 데이터 불러오기 및 데이터 확인하기

R에서 (1)데이터를(CSV파일) 불러오는 방법과 (2)불러온 데이터의 구조를 확인하는 방법을 알아보자. 1. 기존 데이터 불러오기(read.csv())R에서는 데이터를 외부 파일에서 불러올 때 read.csv() 함수를 많이 사용한다. ✔ read.csv("파일명.csv") : CSV 파일을 불러오는 함수✔ header=F : 첫 행이 변수명이 아니라 데이터일 경우 사용# CSV 파일 불러오기dt  이때 파일 경로를 정확히 지정해야 하며, 작업 디렉토리에 파일이 있으면 경로를 간단히 입력할 수 있다.🔥TIP: 만약 파일이 작업 디렉토리에 없다면 전체 경로를 지정하거나 file.choose()로 파일을 직접 선택할 수 있다# 파일을 직접 선택하여 불러오기dt  2. 데이터 구조 확인하기 (str(), ..

R 2025.02.22

[R 기초] R에서 말하는 벡터(Vector)란?

R에서 벡터(Vector)는 가장 기본적인 데이터 구조로, 하나의 데이터 유형을 가진 값들의 집합이다.쉽게 말해, 벡터는 1차원 배열에 해당하며, 같은 데이터 유형만 포함하는 값들의 모임이다.벡터의 특징1. 1차원 배열벡터는 1차원 데이터 구조로, 여러 값들이 한 줄로 나열된 형태.예를 들어, 숫자들의 리스트를 벡터로 저장할 수 있다. 2. 하나의 데이터 유형만 포함벡터는 같은 타입의 데이터만 저장할 수 있다.예를 들어, 숫자형 벡터, 문자형 벡터, 논리형 벡터가 있다.숫자형 벡터: 숫자만 포함문자형 벡터: 문자만 포함논리형 벡터: TRUE/FALSE만 포함만약, 숫자와 문자가 섞이면 모든 값이 문자형으로 바뀐다.벡터 생성 방법1. c() 함수 사용벡터 생성의 가장 기본적인 방법은 c() 함수를 사용하는..

R 2025.02.21

[R 기초] R에서 자료 입력 및 저장하기

R에서 데이터를 직접 입력하거나 CSV 파일을 저장하는 방법을 알아보자.(CSV 불러오는 방법은 다음 포스팅에서!) 1. 데이터를 직접 입력하기R에서는 벡터(Vector)를 활용해 데이터를 직접 입력할 수 있다. ✔ c() : 여러 개의 값을 벡터로 입력할 때 사용✔ rep(k, n) : 특정 값을 n번 반복✔ data.frame() : 여러 변수를 모아서 데이터 프레임 생성 💡 Vector란?R의 가장 기본적인 데이터 구조로, 하나의 데이터 유형을 가진 값들의 집합벡터는 1차원 배열에 해당하며, 동일한 타입의 데이터만 포함할 수 있음💡 데이터 프레임이란?엑셀(Excel) 표처럼 행과 열로 이루어진 데이터 구조각 열(컬럼)마다 다른 데이터 유형을 포함 가능R에서 가장 많이 사용하는 데이터 형태!# 개..

R 2025.02.20

[R 기초] R에서 작업 경로 설정하기

R에서 데이터를 불러오려면, 작업 경로(Working Directory)를 정확히 설정해야 한다.작업 경로(Working Directory)란?작업 경로는 파일을 저장하고 불러오는 기준이 되는 폴더를 말한다.R에서 데이터를 저장하거나 불러올 때, 이 경로를 정확히 설정하는 것이 중요하다. 1. R에서 작업 경로 설정하기방법 1: 명령어로 설정하기 (R, Rstudio 공통)# 작업 경로 설정setwd("C:/Users/내폴더") # 현재 작업 경로 확인getwd() 🔥 TIP: Windows 에서 현재 경로를 모른다면? 파일 탐색기에서 작업 폴더를 열어 상단 주소창을 클릭하면 파일 경로가 텍스트로 변한다.복사 + 붙여넣기 하면 쉽게 현재 경로를 따올 수 있다. 주의사항:(1) 백슬래시 \ 대신 슬래시 ..

R 2025.02.19

[통계] R vs Python

R과 Python 비교: 무엇을 선택해야 할까?R과 Python은 둘 다 데이터 분석에 널리 사용되는 언어지만, 각각 강점이 다르다.  R: 통계 분석과 시각화에 강한 언어✔ 강점통계 분석과 고급 데이터 시각화에 최적화ggplot2, lattice 같은 고급 시각화 패키지 제공다양한 통계 모델과 분석 기법이 내장됨✔ 추천 사용자연구 중심 분야(사회과학, 생물학, 경제학 등)데이터 시각화를 세련되게 만들고 싶은 사용자Python: 머신러닝과 빅데이터 처리에 강한 언어✔ 강점머신러닝 및 딥러닝 생태계가 강력 (TensorFlow, PyTorch 등)데이터 전처리, 웹 스크래핑, 자동화 작업 가능데이터 엔지니어링과 빅데이터 처리에 유용 (Pandas, NumPy, Dask 등)✔ 추천 사용자머신러닝, 딥러닝을..

R 2025.02.18

[통계] R 설치하기

R이란?R은 통계 분석과 데이터 과학에 특화된 프로그래밍 언어이자 소프트웨어 환경이다.다양한 통계 기법, 머신러닝, 데이터 시각화 등을 지원하는 패키지가 풍부해서 연구자, 데이터 과학자, 비즈니스 애널리스트들이 널리 사용하고 있다. 📌 R의 특징무료이면서 강력한 오픈소스 통계 분석 도구데이터 분석, 시각화, 머신러닝 등을 위한 다양한 패키지 제공Python과 함께 가장 인기 있는 데이터 분석 언어 중 하나🖥️ R 설치 방법 (Step by Step)1. R 다운로드R을 설치하려면 공식 사이트인 CRAN (Comprehensive R Archive Network)에 방문해야 한다.The Comprehensive R Archive Network여기서 "Download R" 버튼을 클릭하면 운영체제별 다운..

R 2025.02.17