안녕하세요 구도입니다.


오늘은 R 자체에 내장된 데이터를 불러와 히스토그램을 그리는 방법에 대해 배워보도록 하겠습니다.


작성한 코드만 보고 이해하시지 말고 프로그램에서 직접 실습해보시면서 공부하시면 이해가 훨씬 빠르시답니다.


*프로그램은 'R x64 3.5.1' 을 사용하였습니다*



#지진 데이터를 활용한 히스토그램 그리기

data(quakes)  # 지진 강도의 데이터 세트 불러오기

quakes


?quakes #해당자료 quakes에 대한 자세한 설명 볼 수 있음


head(quakes)  # 자료의 상위 일부만 나타낼 때 사용. 

head(quakes, 10L)  # 자료의 상위 10줄만 나타낼 때 사용. 


str(quakes)   #str()를 이용하여 자료 및 변수들의 유형 확인. num=숫자형(실수), Factor=인자형, chr=문자형, int=숫자형(정수)


mag <- quakes$mag    # 지진의 강도에 대한 벡터 데이터 할당

mag     # 지진의 강도 출력


hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", ylab="발생 건수")   #지진 강도에 대한 히스토그램 출력



# 계급구간 설정


min(mag)

max(mag)


par(mfrow=c(1,3))

hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", ylab="발생 건수", breaks="Sturges")   # 계급의 구간을 Sturges 공식으로 정함

hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", ylab="발생 건수", breaks=seq(4,6.5,by=0.5))   # 계급의 구간 설정을 4~6.5 구간을 0.5 간격으로 하는 계급 설정

hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", ylab="발생 건수", breaks=c(4.0,4.4,4.8,5.2,5.6,6.0,6.4,6.8))  

##xlim=c(150,190),  ylim=c(0, .09)) 옵션 이용해보기!




# 색깔 지정


par(mfrow=c(1,2))

colors <- c("red", "orange", "yellow", "green", "blue", "navy", "violet")

hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", ylab="발생 건수", col=colors, breaks=seq(4,6.5,by=0.5))  


hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", ylab="발생 건수", col=rainbow(7), breaks=seq(4,6.5,by=0.5))  



# y축 선택(도수 vs 상대도수)


par(mfrow=c(1,2))

colors <- c("red", "orange", "yellow", "green", "blue", "navy", "violet")

hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", col=colors, breaks=seq(4,6.5,by=0.5), freq=TRUE)  # freq=TRUE가 디폴트&도수


hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", col=colors, breaks=seq(4,6.5,by=0.5), freq=FALSE) # freq=FALSE 의 의미는 분포밀도값. 확률에 대응하며, probability=T로 설정한 결과와 동일


hist(mag, main="지진 발생 강도의 분포", xlab="지진 강도", col=colors, breaks=seq(4,6.5,by=0.5), probability=T) # freq=FALSE 의 의미는 분포밀도값. 확률에 대응하며, probability=T로 설정한 결과와 동일



오늘도 글 읽어주셔서 감사합니다.

+ Recent posts