13 minute read

  1. R ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜
  2. blog.naver.com/dataedu03 ๋‹ค์šด๋กœ๋“œ ๋ฐ D:/ ์— ์••์ถ•ํ’€๊ธฐ

##########################################R ํ”„๋กœ๊ทธ๋ž˜๋ฐ ๊ธฐ์ดˆ #################################################### ############# 1. R ๊ธฐ์ดˆ

R ๋‘˜๋Ÿฌ๋ณด๊ธฐ

์ž‘์—… ๊ณต๊ฐ„ ํ• ๋‹นํ•˜๊ธฐ

getwd() setwd(โ€œd:/r_classโ€)

์ปค๋งจ๋“œ ์ž…๋ ฅํ•˜๊ธฐ

1+1

๋ถˆ์™„์ „ํ•œ ์ปค๋งจ๋“œ ์ž…๋ ฅ

max(4,6,8), max(4,6, )

์—ฌ๋Ÿฌ์ค„์„ ํ•œ๊บผ๋ฒˆ์— ์‹คํ–‰

a<-1+1; b<-a/2

์Šคํฌ๋ฆฝํŠธ ํ™œ์šฉํ•˜๊ธฐ

rnorm(20) a<-rnorm(20)

๋„์›€๋ง ๊ธฐ๋Šฅ ํ™œ์šฉํ•˜๊ธฐ

help.start()
help(max) ?max RSiteSearch(โ€œmaxโ€)

๋ช…๋ น์–ด ํžˆ์Šคํ† ๋ฆฌ ํ™œ์šฉํ•˜๊ธฐ

#์˜ˆ๋ฅผ ๋“ค์–ด์„œ ์•„๋ž˜์™€ ๊ฐ™์€ ๋ช…๋ น์–ด๋“ค์„ ์‹คํ–‰์‹œ์ผฐ๋‹ค๋ฉด ls() a<-rnorm(20) b<-hist(a)

                            # ์œ„์˜ ๋ช…๋ น์–ด๋“ค์„ ๋‹ค์‹œ ๋ถˆ๋Ÿฌ๋“ค์ธ๋‹ค
                            # ๋ช…๋ น์–ด ํžˆ์Šคํ† ๋ฆฌ๋ฅผ ์ €์žฅ(working Directory์— ์ €์žฅ๋จ)
                            # ๋ช…๋ น์–ด ํžˆ์Šคํ† ๋ฆฌ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ

ํŒจํ‚ค์ง€ ํ™œ์šฉํ•˜๊ธฐ

                          #ํ˜„์žฌ ํ™œ์„ฑํ™”๋œ ํŒจํ‚ค์ง€๋“ค์ด ๋ฌด์—‡์ธ์ง€ ํ™•์ธ


                          #ํ•˜๋“œ๋””์Šคํฌ์— MASS ํŒจํ‚ค์ง€๋ฅผ ์‹คํ–‰ํ•˜์ง€ ์•Š์•˜๊ธฐ ๋•Œ๋ฌธ์— ํŒŒ์ผ์ด ์—†๋Š”๊ฒƒ์œผ๋กœ ๋‚˜์˜ด

                          #MASS ํŒจํ‚ค์ง€๋ฅผ ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์— ์„ค์น˜
                          #๋ฐ์ดํ„ฐ ํ™•์ธ ๊ฐ€๋Šฅ




                          #ํ•˜๋“œ๋””์Šคํฌ์— ์กด์žฌํ•˜์ง€ ์•Š๋Š” boot ํŒจํ‚ค์ง€ ๋‹ค์šด๋กœ๋“œ ๋ฐ ์„ค์น˜

                          #๋‹ค์šด๋กœ๋“œ ๋œ boot ํŒจํ‚ค์ง€์˜ help ๋‹คํ๋จผํŠธ๋ฅผ ๋ณด์—ฌ์คŒ
                          #์›น์„ ํ†ตํ•ด boot ํŒจํ‚ค์ง€์˜ ๋‹คํ๋จผํŠธ๋ฅผ ๋ณด์—ฌ์คŒ
                          #์›น์„ ํ†ตํ•ด boot ํŒจํ‚ค์ง€์˜ ๋‹คํ๋จผํŠธ๋ฅผ ๋ณด์—ฌ์คŒ

R ํ”„๋กœ๊ทธ๋žจ ํŒŒ์ผ ์‹คํ–‰

source(โ€œa.Rโ€)

######### 2. ์ž…๋ ฅ๊ณผ ์ถœ๋ ฅ############### ######### ์ถœ๋ ฅํ•˜๊ธฐ ############### #######################################

pi sqrt(2)

print(pi) print(sqrt(2))

                                # 3 x 2
                                # 2 x 3

#printํ•จ์ˆ˜๋Š” ์˜ค๋กœ์ง€ ํ•˜๋‚˜์˜ ๊ฐ์ฒด๋งŒ ํ”„๋ฆฐํŠธ

print(โ€œTHe zoro occur atโ€, 2*pi, โ€œradians.โ€) #error ๋ฐœ์ƒ

#catํ•จ์ˆ˜๋Š” print์˜ ๋Œ€์•ˆ์œผ๋กœ ์—ฌ๋Ÿฌ๊ฐœ์˜ ํ•ญ๋ชฉ์„ ๋ฌถ์–ด์„œ ์—ฐ๊ฒฐ๋œ ๊ฒฐ๊ณผ๋กœ ์ถœ๋ ฅํ•ด์คŒ

#catํ•จ์ˆ˜๋Š” ๊ฐ„๋‹จํ•œ ๋ฒกํ„ฐ๋„ ์ถœ๋ ฅ ๊ฐ€๋Šฅ

f<-c(0,1,1,2,3,5,8,13)

#catํ•จ์ˆ˜์˜ ํ•œ๊ณ„๋Š” ํ–‰๋ ฌ์ด๋‚˜ ๋ฆฌ์ŠคํŠธ ๊ฐ™์€ ๋ณต์žกํ•œ ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ๋ฅผ ์ถœ๋ ฅํ•  ์ˆ˜ ์—†์Œ

cat(list(โ€œaโ€,โ€bโ€,โ€cโ€))

####### ๋ณ€์ˆ˜ ์„ค์ •ํ•˜๊ธฐ ############## ######################################

๋Œ€์ž…์—ฐ์‚ฐ์ž (<-)

x<-3
y<-2 z<-sqrt(x^2+2*y) z

#R์€ ๋™์  ํƒ€์ž… ์–ธ์–ด์ด๋‹ค.

x<-c(โ€œaโ€, โ€œbโ€, โ€œcโ€, โ€œdโ€)
x

#๋ณ€์ˆ˜ ๋ชฉ๋ก ๋ณด๊ธฐ

#๋ณ€์ˆ˜ ๋ชฉ๋ก ๋ฟ์•„๋‹ˆ๋ผ ๊ตฌ์กฐ๋ฅผ ๋ณด์—ฌ์ฃผ๋Š” ํ•จ์ˆ˜

ls.str()

                     # ๋ณ€์ˆ˜ ์‚ญ์ œ , ํ•œ๋ฒˆ ๋ณ€์ˆ˜๋ฅผ ์‚ญ์ œํ•˜๋ฉด ์˜์›ํžˆ ์‚ญ์ œ ๋จ
                     # ํ•œ๊บผ๋ฒˆ์— ๋ณ€์ˆ˜ ์‚ญ์ œ ๊ฐ€๋Šฅ ls()

warning ๋ณ€์ˆ˜ ๋ชฉ๋ก์„ ๋ฆฌ์ŠคํŠธ ์ธ์ž์— ์ง€์ •ํ•œ ๋‹ค์Œ ์‚ญ์ œํ•˜๊ฒŒ ๋จ์— ๋”ฐ๋ผ ๊ธฐ์กด์— ์žˆ๋Š” ๋ชจ๋“  ๋ณ€์ˆ˜๋ฅผ ์‚ญ์ œํ•˜๊ฒŒ ๋จ ์กฐ์‹ฌํ•ด์•ผ ํ•จ.

ls()

####### ๋ฒกํ„ฐ ์ƒ์„ฑํ•˜๊ธฐ ############## ######################################

#R ํ”„๋กœ๊ทธ๋žจ์—์„œ ์‚ฌ์šฉํ•˜๋Š” ๊ฐ€์žฅ ๊ธฐ๋ณธ์ ์ธ ๋ฐ์ดํ„ฐ์…‹์˜ ํ˜•ํƒœ

d<- e<- f<-

#๋ฒกํ„ฐ์˜ ์ธ์ž ์ž์ฒด๊ฐ€ ๋ฒกํ„ฐ์ธ ๊ฒฝ์šฐ ๋ฒกํ„ฐ๋ฅผ ํ’€์–ด์„œ ํ•˜๋‚˜๋กœ ํ•ฉ์นœ๋‹ค.

g<- g

#๋ฒกํ„ฐ์˜ ์ธ์ž ์ค‘ ํ•˜๋‚˜๋ผ๋„ ๋ฌธ์ž๊ฐ€ ํฌํ•จ๋˜์–ด ์žˆ๋Š” ๊ฒฝ์šฐ ๋ชจ๋“  ์›์†Œ๋“ค์€ ๋ฌธ์žํ˜•์œผ๋กœ ์ •์˜ ๋œ๋‹ค.

h<- h

####### ๊ธฐ๋ณธ์ ์ธ ํ†ต๊ณ„๋Ÿ‰ ๊ณ„์‚ฐํ•˜๊ธฐ ########### #######################################

a<-c(0,1,1,2,3,5,8,13) b<-log(a+1) c<-c(0,1,1,2,3,5,8,13,NA)

#ํ‰๊ท 

#์ค‘์•™๊ฐ’

#ํ‘œ์ค€ํŽธ์ฐจ

#๋ถ„์‚ฐ

#์ƒ๊ด€๊ณ„์ˆ˜

#๊ณต๋ถ„์‚ฐ

#ํ‰๊ท , ์ค‘๊ฐ„๊ฐ’, ํ‘œ์ค€ํŽธ์ฐจ๋Š” ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ๊ฐ ๋ณ€์ˆ˜๋“ค์„ ๊ธฐ์ค€์œผ๋กœ ๊ฐ’์„ ์‚ฐ์ถœ #๋ถ„์‚ฐ์€ ๊ณต๋ถ„์‚ฐ ํ–‰๋ ฌ์„ ์ œ๊ณต, ์ƒ๊ด€๊ณ„์ˆ˜๋Š” ์ƒ๊ด€๊ณ„์ˆ˜ ํ–‰๋ ฌ์„ ์ œ๊ณต

๋‹จํ•˜๋‚˜์˜ NA ๊ฐ’์ด ํฌํ•จ๋˜์–ด๋„ ๊ฒฐ๊ณผ๋Š” NA๋กœ ๋‚˜์˜ค๋ฏ€๋กœ ์•„๋ž˜์™€ ๊ฐ™์ด ํ™œ์šฉ

mean(c) sd(c)

hei<-c(187,178,176,169,181,172)

wei<-c(82,72,70,65,74,68)

####### ์ˆ˜์—ด ์ƒ์„ฑํ•˜๊ธฐ ############## ##################################

1:10

by์˜ ๋””ํดํŠธ๋Š” 1

        # 0~9
        # 5~10
        # 9~0

์ˆ˜์—ด์˜ ๊ธธ์ด๋ฅผ ์ง€์ •ํ•˜๊ณ ์ž ํ• ๋•Œ, length.out ์‚ฌ์šฉ

############ ๋ฒกํ„ฐ์˜ ๋น„๊ต ############## ####################################

                 #๋ฒกํ„ฐ์˜ ๊ฐ’๋“ค ์ค‘ ํ•˜๋‚˜๋ผ๋„ ๊ฐ™์€๊ฐ€?
                 #๋ฒกํ„ฐ์˜ ๊ฐ’๋“ค์ด ๋ชจ๋‘ ๊ฐ™์€๊ฐ€?   all(z==0) ๋ชจ๋“  ๊ฐ’๋“ค์ด 0์ธ๊ฐ€?๋Š” ๋งŽ์ด ํ™œ์šฉ๋œ๋‹ค.

############ ๋ฒกํ„ฐ์— ์žˆ๋Š” ์›์†Œ ์„ ํƒํ•˜๊ธฐ ######## ###########################################

a<-c(0,1,1,2,3,5,8,13) a

์ธ๋ฑ์Šค๊ฐ€ ์Œ์ˆ˜์ธ ๊ฒฝ์šฐ๋Š” 1๋ฒˆ์งธ ๊ฐ’์„ ์ œ์™ธํ•˜๋ผ๋Š” ์˜๋ฏธ

์ค‘์•™๊ฐ’๋ณด๋‹ค ํฐ ๋ชจ๋“  ์›์†Œ๋ฅผ ์„ ํƒ

์ƒํ•˜์œ„ 5% ์•ˆ์— ์žˆ๋Š” ๋ชจ๋“  ์›์†Œ๋ฅผ ์„ ํƒ

ํ‰๊ท ์—์„œ + - ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ ๋„˜๋Š” ๋ชจ๋“  ์›์†Œ ์„ ํƒ

NA๋‚˜ NULL์ด ์•„๋‹Œ ๋ชจ๋“  ์›์†Œ๋ฅผ ์„ ํƒ

############ ๋ฒกํ„ฐ ์—ฐ์‚ฐ ์ˆ˜ํ–‰ํ•˜๊ธฐ ######## ###########################################

v1<-c(10,11,12,13,14) v2<-c(1,2,3,4,5)

############ ์—ฐ์‚ฐ์ž ์šฐ์„ ์ˆœ์œ„ ######## ###########################################

#PPT ์ฐธ์กฐ

############ R ํ•จ์ˆ˜ ์ •์˜ ######## ########################################### #

function(๋งค๊ฐœ๋ณ€์ˆ˜1, ๋งค๊ฐœ๋ณ€์ˆ˜2, ๋งค๊ฐœ๋ณ€์ˆ˜3,โ€ฆ.) expr

#

function(๋งค๊ฐœ๋ณ€์ˆ˜1, ๋งค๊ฐœ๋ณ€์ˆ˜2, ๋งค๊ฐœ๋ณ€์ˆ˜3,โ€ฆ.) {

expr1

expr2

expr3

โ€ฆ..

}

# ##############################################?

f1<- #์ •๊ทœ๋ถ„ํฌ๋ฅผ ํ‘œ์ค€์ •๊ทœ๋ถ„ํฌ๋กœ ํ‘œ์ค€ํ™” f1(1:10)

skew.and.kurto <-function(x) #์™œ๋„์™€ ์ฒจ๋„๋ฅผ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜ {

}

t5<- 1:1000 #1000 random obs from t with df 5 skew.and.kurto(t5)

######### ๋ฐ์ดํ„ฐ ์ž…๋ ฅํ•˜๊ธฐ ############ ####################################

#ํ‚ค๋ณด๋“œ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅํ•  ๋•Œ conbine ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉ

#๋นˆ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๋งŒ๋“  ๋’ค ๋‚ด์žฅ๋œ ํŽธ์ง‘๊ธฐ๋ฅผ ๋ถˆ๋Ÿฌ์™€ ๋ฐ์ดํ„ฐ ์ž…๋ ฅ

temp<-data.frame()

b

#๋ฉ”๋‰ด->edit->data editor -> object๋ช… ์ž…๋ ฅ

๊ฐ„๋‹จํ•œ ๋ฌธ์ œ๋ฅผ ๋‹ค๋ฃฐ ๋•Œ๋Š” ๋ฐ์ดํ„ฐ ํŒŒ์ผ์„ ์ƒ์„ฑํ•˜๊ณ  ์ฝ์–ด์˜ค๋Š” ๊ฒƒ์ด ๊ท€์ฐฎ์Šต๋‹ˆ๋‹ค.

์ด๋Ÿด๋•Œ๋Š” R์— ๋ฐ์ดํ„ฐ๋ฅผ ๊ณง๋ฐ”๋กœ ์ž…๋ ฅํ•˜๋Š” ๊ฒŒ ํŽธ๋ฆฌํ•˜ํ•ฉ๋‹ˆ๋‹ค.

์ด๋Ÿฌํ•œ ๋ฐฉ๋ฒ•์„ ์œ„ํ•ด ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ์ •์˜ํ•˜๊ณ  cํ•จ์ˆ˜๋กœ ๋ฒกํ„ฐ ์ƒ์„ฑํ•ด์„œ ๋ฐ์ดํ„ฐ๋ฅผ ์ž…๋ ฅํ•ด ๋ด…์‹œ๋‹ค.

c<-

c

######### ๋ฐ์ดํ„ฐ ์ž๋ฆฌ์ˆ˜ ์กฐ์ ˆ ############ ####################################

R์„ ๊ธฐ๋ณธ์ ์œผ๋กœ ๋ถ€๋™์†Œ์ˆ˜์ ์„ ํฌํ•จํ•ด 7์ž๋ฆฌ๋ฅผ ํ‘œ์‹œ

pi

์ž๋ฆฌ์ˆ˜๋ฅผ 4์ž๋ฆฌ๋กœ ํ‘œํ˜„

cat(โ€œpi ๊ฐ’์€ โ€œ, pi,โ€์ž…๋‹ˆ๋‹ค.โ€, โ€œ\nโ€)

cat ํ•จ์ˆ˜๋Š” ํ˜•์‹ ์กฐ์ • ๋ถˆ๊ฐ€->format ํ•จ์ˆ˜ ํ™œ์šฉ

์˜ต์…˜ํ•จ์ˆ˜๋ฅผ ํ™œ์šฉํ•ด์„œ digit์˜ ๊ธฐ๋ณธ๊ฐ’์„ ๋ฐ”๊พธ๊ธฐ

pi

######### ํŒŒ์ผ์— ์ถœ๋ ฅํ•˜๊ธฐ ############ ####################################

a<-sqrt(10)

sink(โ€œfileout2.txtโ€)

#- ๊ฒฐ๊ณผ๋ฅผ txt ํŒŒ์ผ๊ณผ pdf๋กœ ์ถœ๋ ฅํ•จ

######### ํŒŒ์ผ ๋ชฉ๋ก๋ณด๊ธฐ ############ ####################################

                         #์›Œํ‚น ๋””๋ ‰ํ† ๋ฆฌ์˜ ํŒŒ์ผ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Œ.

                         #ํ•˜์œ„ ๋””๋ ‰ํ† ๋ฆฌ์˜ ์ˆจ๊ฒจ๋†“์€ ํŒŒ์ผ(๋งˆ์นจํ‘œ๋กœ ์‹œ์ž‘ํ•˜๋Š” ํŒŒ์ผ)๊นŒ์ง€ ๋ชจ๋‘ ๋ณผ์ˆ˜ ์žˆ์Œ

######### ์œˆ๋„์šฐ์—์„œ โ€˜cannot open file ํ•ด๊ฒฐํ•˜๊ธฐ ############ ##########################################################

d:\dataedu\R\basic\exam1.txt ์œ„๋„์šฐ์—์„œ ํŒŒ์ผ์ด ์žˆ์Œ์„ ์•Œ๊ณ  ์žˆ๋‹ค.

#ํ•˜์ง€๋งŒ

์—ญ์Šฌ๋ ˆ์‰ฌ()๊ฐ€ ์ด๋ฆ„์— ํฌํ•จ๋˜์–ด ์žˆ์œผ๋ฉด ๋ฌธ์ œ๊ฐ€ ๋ฐœ์ƒ

์—ญ์Šฌ๋ ˆ์‰ฌ ๋’ค์— ์˜ค๋Š” ๋ชจ๋“  ๋ฌธ์ž๋ฅผ ์ด์Šค์ผ€์ดํ”„ ์ฒ˜๋ฆฌํ•œ๋’ค d:dataeduRbasicexam1.txt ๋กœ ์ธ์‹

์œˆ๋„์šฐ์—์„œ R์€ ์Šฌ๋Ÿฌ์‰ฌ(/)๋ฅผ ์—ญ์Šฌ๋ ˆ์‰ฌ์™€ ๋˜‘๊ฐ™์ด ์ทจ๊ธ‰ํ•˜๋ฏ€๋กœ ๋ฌธ์ œ ํ•ด๊ฒฐ

#R์—์„œ๋Š” ์—ญ์Šฌ๋ ˆ์‰ฌ (\)๋ฅผ ์—ญ์Šฌ๋ ˆ์‰ฌ ()๋กœ ์ธ์‹ํ•˜์—ฌ ์ทจ๊ธ‰ํ•˜๋ฏ€๋กœ ๋ฌธ์ œ ํ•ด๊ฒฐ

############๊ณ ์ •๋ฐ์ดํ„ฐ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ#################### ###############################################

f2<-read.fwf(โ€œexam2.txtโ€, widths=c(w1,w2,w3,w4)) ๊ณ ์ • ์ž๋ฆฌ ๋ฐ์ดํ„ฐ ์ฝ๊ธฐ

#1์งธ๋Š” ๊ณผ์ œ์ œ์ถœ์—ฌ๋ถ€, 2์งธ๋Š” ์ ์ˆ˜ ์‚ฌ์ด์—๋Š” 2์นธ์˜ ๋นˆ์นธ

                                    # col๋ช… ์ง€์ •

f2

###########๋น„๊ณ ์ •๋ฐ์ดํ„ฐ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ#############################

(ํƒญ ๋˜๋Š” ๊ณต๋ฐฑ์œผ๋กœ ๊ตฌ๋ถ„๋œ )ํ…์ŠคํŠธ ํŒŒ์ผ๋กœ ๋œ ํ…Œ์ด๋ธ”ํ˜•์‹์˜ ๋ฐ์ดํ„ฐ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ

๊ฐ ์ค„์ด ํ•˜๋‚˜์˜ ๋ ˆ์ฝ”๋“œ

f3<-
f3

ํ•˜๋‚˜์˜ ๋ ˆ์ฝ”๋“œ ๋‚ด์—์„œ, ๊ณต๋ฐฑ, ํƒญ, ์‰ฝํ‘œ ๋“ฑ ํ•œ๊ธ€์ž ์งœ๋ฆฌ ๊ตฌ๋ถ„๋ฌธ์ž

f3<-read.table(โ€œkings.txtโ€, sep= :, )

๊ฐ ๋ ˆ์ฝ”๋“œใ…ก ๋™์ผํ•œ ์ˆ˜์˜ ํ•„๋“œ๋ฅผ ๊ฐ€์ง

class(f3$V1)

๋ฌธ์ž์—ด ๋ ˆ์ฝ”๋“œ๊ฐ’์„ factor๋กœ ์ธ์‹ํ•˜์ง€ ์•Š๊ณ  ๋ฌธ์ž์—ด๋กœ ์ธ์‹ํ•˜๊ฒŒ ํ•จ

f3<- f3 class(f3$V1)

f3<- # SAS์˜ ๊ฒฐ์ธก๊ฐ’(.) ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ๋ฅผ NA ํ˜•ํƒœ๋กœ ๊ฒฐ์ธก๊ฐ’์„ ๋ณ€๊ฒฝ f3

csv ํŒŒ์ผ์€ R, ์—‘์…€, ๋‹ค๋ฅธ ์Šคํ”„๋ ˆ๋“œ์‹œํŠธ ํ”„๋กœ๊ทธ๋žจ, ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค ๊ด€๋ฆฌ์ž๋“ค์ด ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ํ˜•์‹

f4<- f4 class(f4$ename)

#ํƒ์ƒ‰๊ธฐ๋ฅผ ํ†ตํ•œ ๋ฐ์ดํ„ฐ ํŒŒ์ผ ๋ถˆ๋Ÿฌ์˜ค๊ธฐ

file.choose<- head(file.choose)

########### csv ํŒŒ์ผ ์ถœ๋ ฅํ•˜๊ธฐ ############################ ######################################################

############ HTML ํ…Œ์ด๋ธ” ์ฝ์–ด์˜ค๊ธฐ ############################

####์„ธ๊ณ„ 500๋Œ€ ๊ธฐ์—… ๋ฆฌ์ŠคํŠธ# install.packages(c(โ€œXMLโ€,โ€httrโ€,โ€RCurlโ€)) library(XML) library(httr) library(RCurl)

############ ๋ณต์žกํ•œ ๊ตฌ์กฐ ํŒŒ์ผ ์ฝ์–ด์˜ค๊ธฐ ############################

๊ตฌ์กฐ๊ฐ€ ๋ณต์žกํ•˜์—ฌ 10์ค„๋งŒ ์ฝ๊ณ  ๋ฉˆ์ถค

l1<-readlines(โ€œexam1.txtโ€,n=10)

๋ณ€์ˆ˜๋ฅผ ์ˆซ์žํ˜•์œผ๋กœ ์ธ์‹ํ•˜๊ณ  ์ฝ์–ด๋“ค์ž„

l2

#scan()์— ํ™œ์šฉ๋˜๋Š” ์ธ์ž #what=numeric(0) ๋‹ค์Œ ํ† ํฐ์€ ์ˆซ์ž๋กœ ํ•ด์„ #what=integer(0) ๋‹ค์Œ ํ† ํฐ์€ ์ •์ˆ˜๋กœ ํ•ด์„ #what=complex(0) ๋‹ค์Œ ํ† ํฐ์€ ๋ณต์†Œ์ˆ˜๋กœ ํ•ด์„ #what=character(0) ๋‹ค์Œ ํ† ํฐ์€ ๋ฌธ์ž์—ด๋กœ ํ•ด์„ #what=logical(0) ๋‹ค์Œ ํ† ํฐ์€ ๋…ผ๋ฆฌ๊ฐ’์œผ๋กœ ํ•ด์„

#n=number ์ด๋งŒํผ์˜ ํ† ํฐ์„ ์ฝ์€ ๋‹ค์Œ์— ๋ฉˆ์ถค #nlines=number ์ด๋งŒํผ์˜ ์ž…๋ ฅ ๋ผ์ธ์„ ์ฝ์€ ๋‹ค์Œ ๋ฉˆ์ถค #skip=number ๋ฐ์ดํ„ฐ๋ฅผ ์ฝ๊ธฐ ์ „์— ๊ฑด๋„ˆ ๋›ฐ๋Š” ์ž…๋ ฅ ๋ผ์ธ์˜ ๊ฐœ์ˆ˜ #na.strings=list NA๋กœ ํ•ด์„๋  ๋ฌธ์ž์—ด ๋ฆฌ์ŠคํŠธ

์˜ˆ์ œ 1. ๊ฒฝ์ฃผ์‹œ์™ธ๋ฒ„์Šคํ„ฐ๋ฏธ๋„ ๊ฐ€๊ฒฉํ‘œ

๋ฌธ์ž์™€ ์ˆซ์ž๊ฐ€ ์กฐํ•ฉ๋œ ํ˜•ํƒœ์˜ ๋ฐ์ดํ„ฐ ์ฝ๊ธฐ

l3<-scan(โ€œgyeongju_ternimal.csvโ€,what=list(des=character(0), fare=numeric(0)),skip=1,sep=โ€,โ€)

gyeongju<-as.data.frame(l3) gyeongju

?l3<-scan(โ€œgyeongju_ternimal.csvโ€,what=list(des=character(0), fare=numeric(0)),skip=1,sep=โ€,โ€)

########### ๊ฐ์ฒด๋ฅผ ์ €์žฅํ•˜๊ณ  ์ „์†กํ•˜๊ธฐ ###################### ######################################################

save(gyeongju,file=โ€myData.RDataโ€) #saveํ•จ์ˆ˜๋Š” ๋ฐ”์ด๋„ˆ๋ฆฌ ๋ฐ์ดํ„ฐ๋ฅผ ์ž‘์„ฑ, ASCII ํ˜•์‹์€ dput, dump๋ฅผ ์‚ฌ์šฉ

load(โ€œmyData.RDataโ€)

                                            #๋ณ€์ˆ˜ ์•ž๋’ค์˜ ๋”ฐ์›€ํ‘œ์— ์ฃผ์˜

dput(โ€œmyDataโ€, file=โ€myData.txtโ€) dump(โ€œmyDataโ€, file=โ€myData.txtโ€)

#saveํ•จ์ˆ˜๋Š” ํŒŒ์ผ์˜ ํฌ๊ธฐ๋ฅผ ์ž‘๊ฒŒ ์œ ์ง€ํ•˜๊ธฐ ์œ„ํ•ด ๋ฐ”์ด๋„ˆ๋ฆฌ ํ˜•์‹์œผ๋กœ ์ €์žฅํ•œ๋‹ค. ASCII ํ˜•์‹์€ dput, dump๋ฅผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

#๋ฉ”์ผ๋ง ๋ฆฌ์ŠคํŠธ์— ์งˆ์˜๋ฅผ ๋ณด๋‚ผ๋•Œ ๋‹ค๋ฅธ ์‚ฌ๋žŒ๋“ค์ด ๋ฌธ์ œ๋ฅผ ์žฌํ˜„ํ•˜๊ธฐ ์œ„ํ•ด์„œ ASCII ํ˜•์‹์˜ ๋ฐ์ดํ„ฐ์˜ ๋คํ”„๋ฅผ ์ฒจ๋ถ€ ํ•  ์ˆ˜ ์žˆ๋‹ค.

#ํ”„๋กœ๊ทธ๋žจ์—์„œ ๋ฐ์ดํ„ฐ๊ฐ€ ํŠน์ • ํŒจํ‚ค์ง€์— ์žˆ๋Š” ๋ฐ์ดํ„ฐ๋ฅผ ํ™œ์šฉํ•œ๋‹ค๋ฉด ํŒจํ‚ค์ง€๋ฅผ ๋กœ๋”ฉํ•ด ๋‘์–ด์•ผ ํ™œ์šฉํ•  ์ˆ˜์žˆ๋‹ค.

9/29 10:00

############# 3. ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ์™€ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„(1) ######### ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ ############ ####################################

#๋ถˆ๋Ÿฌ๋“ค์ธ csv ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์— ์ ์šฉ

a<-read.csv(โ€œframe.csvโ€, header=T) str(a) a b<-as.data.frame(a)
b c<-as.vector(b[โ€œphoneโ€]) c

#1๋ฒˆ์งธ ๋ฆฌ์ŠคํŠธ๋ฅผ ํ”„๋ฆฐํŠธ

b[1]

#1๋ฒˆ์งธ ๋ฆฌ์ŠคํŠธ๋‚ด์˜ ๊ฐ’๋“ค์„ ํ”„๋ฆฐํŠธ

b[[1]]

ํ•ญ๋ชฉ๊ณผ ๊ทธ ๊ฐ’๋“ค์„ ํ”„๋ฆฐํŠธ

b[1] b[โ€œempnoโ€]

ํ•ญ๋ชฉ๋ช…์„ ํ†ตํ•ด์„œ ๊ฐ’๋“ค์„ ํ”„๋ฆฐํŠธ

b[โ€œempnoโ€] b$empno

#1ํ–‰, 2์—ด์— ํ•ด๋‹นํ•˜๋Š” ์›์†Œ

b[1,2]

#2ํ–‰์— ํ•ด๋‹นํ•˜๋Š” ๋ชจ๋“  ์›์†Œ

b[2,]

#2์—ด์— ํ•ด๋‹นํ•˜๋Š” ๋ชจ๋“  ์›์†Œ

b[,2]

๋‹จ์ผ๊ฐ’

#๋‹จ์ผ๊ฐ’์€ ์›์†Œ๊ฐ€ ํ•˜๋‚˜์ธ ๋ฒกํ„ฐ๋กœ ์˜๋ฏธ

pi

length(pi) length(b$empno) pi[1] pi[2]

####### ํ–‰๋ ฌ ######### #์ฐจ์›์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ๋ฒกํ„ฐ๋กœ ์ธ์‹ํ•˜๋ฉด ๋จ

a<-1:9 a dim(a)<-c(3,3) a

c == combine

####### ๋ฐฐ์—ด #########

b<-1:12

dim(b)<-c(2,3,2) b

####### ๋ฒกํ„ฐ์— ๋ฐ์ดํ„ฐ ์ถ”๊ฐ€์™€ ์‚ฝ์ž… ##########

#๋ฒกํ„ฐ์— ๋‹จ์ผ๊ฐ’ ์‚ฝ์ž…

v1 <- c(1,2,3) v1 <- c(v1, 4, 5) v1 v2 <- c(6,7,8,9,10)

v2 #๋ฒกํ„ฐ์— ๋‹ค๋ฅธ ๋ฒกํ„ฐ๋ฅผ ์‚ฝ์ž…

v1 <- c(v1,v2)
v1

#๋ฒกํ„ฐ์˜ ํŠน์ •์œ„์น˜์— ๋‹จ์ผ๊ฐ’ ์‚ฝ์ž…

v1[12]<-12 v1

#๋ฒกํ„ฐ์˜ ํŠน์ • ์œ„์น˜์— ๋‹จ์ผ๊ฐ’ ์‚ฝ์ž…

v1 v3 <- append(v1,100,after=5) v3

#๋ฒกํ„ฐ์˜ ํŠน์ • ์œ„์น˜์— ๋ฐ์ดํ„ฐ ์‚ฝ์ž…

v4 <- append(v1,v2,after=0)

v4

append(v1,v2,after=1)

#col ๊ฐ’์„ ๋ฒกํ„ฐ๋กœ ์—ฐ๊ฒฐ

c1<- cbind(1:6) c1

๋ฐ์ดํ„ฐ๋ฅผ ๊ฒฐํ•ฉํ•  ๋•Œ ์‚ฌ์šฉํ•˜๋Š” ํ•จ์ˆ˜

#

cbind : ์—ด ๊ฒฐํ•ฉ, # column

rbind : ํ–‰ ๊ฒฐํ•ฉ. # row

c1
c2<-cbind(1:3) c2 cbind(1:6, 1:3)

recycling rule

#๋‘๊ฐœ์˜ ๋ฒกํ„ฐ๋ฅผ col์œผ๋กœ ์—ฐ๊ฒฐ

cbind(1:6, 1:3)

#๋‘๊ฐœ์˜ object๋ฅผ ์—ฐ๊ฒฐํ•  ๋•Œ๋Š” ๊ธธ์ด๊ฐ€ ๊ฐ™์•„์•ผ ํ•จ cbind(c1, c2) c3 <- cbind(1:6, 1:3) cbind(c3,c1)

2019-09-29 10:54

recycling rule

a<- c(1,2,3,4,5,6,10) b<- c(7,8,9) a+b

ํ•จ์ˆ˜์—๋„ ์žฌํ™œ์šฉ ๊ทœ์น™์€ ์ ์šฉ๋œ๋‹ค.

########## ์š”์ธ ์ƒ์„ฑ ######### ############################### # #์—ฐ์†ํ˜• ๋ณ€์ˆ˜๋ฅผ ๋ฒ”์ฃผํ˜•๋ณ€์ˆ˜๋กœ ๋ณ€๊ฒฝ

f<- factor(c2) f #๋ฒ”์ฃผํ˜•๋ณ€์ˆ˜์— ๋ฐ์ดํ„ฐ ์‚ฝ์ž…

f<- factor(c(โ€œAโ€,โ€Aโ€,โ€Aโ€,โ€Bโ€,โ€Bโ€,โ€Cโ€,โ€Aโ€,โ€Aโ€,โ€Cโ€,โ€Bโ€,โ€Aโ€,โ€Aโ€)) f

#๋ฒ”์ฃผํ˜•๋ณ€์ˆ˜์— ๋ ˆ๋ฒจ์„ ์ •์˜

f<-factor(f,c(โ€œAโ€,โ€Cโ€,โ€Dโ€,โ€Eโ€,โ€Fโ€)) f

############## ๋ฆฌ์ŠคํŠธ ์ƒ์„ฑํ•˜๊ธฐ ######################

๋ฆฌ์ŠคํŠธ๋Š” ๊ฐ ์›์†Œ์˜ ๋ชจ๋“œ๊ฐ€ ๋‹ฌ๋ผ๋„ ๋˜๋Š” ํŠน์ง•์ด ์žˆ์Œ

l<- list(3.14, โ€œTomโ€, c(1,2,3,4), mean) l

l[[3]][3]

๋นˆ ๋ฆฌ์ŠคํŠธ๋ฅผ ์ƒ์„ฑํ•˜๊ณ  ์›์†Œ๋ฅผ ์ฑ„์›Œ ๋„ฃ๋Š” ๋ฐฉ๋ฒ•์œผ๋กœ ๋ฆฌ์ŠคํŠธ ์ƒ์„ฑ

l1<-list()

l1[[1]] <- 2.714 l1[[2]] <- โ€œTYโ€ l1[[3]] <- c(5,6,7) l1[[4]] <- mean

l1[3] l1[[3]] l1[c(2,3)]

๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ์— ์ด๋ฆ„์„ ๋ถ™์ผ ์ˆ˜ ์žˆ์Œ

l2<- list(mid=1.1, far=1.5, more.far=2.0) l3<- list(msadasdid=1.1, fasdsadar=1.5, mosadsadsadre.fsadsadsadar=2.0)

l2 l3

์ž๋ฆฌ์ˆ˜๋กœ ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ๋ฅผ ์„ ํƒํ•˜๊ธฐ

l2[[1]] l2[1] l2[c(1,2)]

๋ฆฌ์ŠคํŠธ์˜ ๊ตฌ์กฐ๋ฅผ ํ™•์ธํ•ด ๋ณด๊ธฐ->numeric

class(l2[[1]]) mode(l2[[1]])

๋ฆฌ์ŠคํŠธ์˜ ๊ตฌ์กฐ ํ™•์ธํ•ด ๋ณด๊ธฐ ->list

class(l2[1]) mode(l2[1])

class(l2) mode(l2)

์›์†Œ์˜ ์ด๋ฆ„์œผ๋กœ ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ๋ฅผ ์„ ํƒํ•˜๊ธฐ

2019-09-29 11:16

๋ฆฌ์ŠคํŠธ์—์„œ ์›์†Œ๋ฅผ ์ œ๊ฑฐํ•˜๊ธฐ

l2

l3<- # ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ์— NULL ์ด ํฌํ•จ๋˜์–ด ์žˆ์„ ๋•Œ ์‚ญ์ œํ•˜๊ธฐ l3

                                              # ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ์˜ ๊ฐ’์ด NULL์ธ ์›์†Œ๋ฅผ ์‚ญ์ œ l3
๋ฆฌ์ŠคํŠธ์—์„œ ์›์†Œ ์ œ๊ฑฐํ•˜๋Š” ๋‹ค์–‘ํ•œ ๋ฐฉ๋ฒ•
                                              # ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ๊ฐ€ 0์ธ ์›์†Œ๋ฅผ ์ œ๊ฑฐ
                                              # ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ๊ฐ€ na์ธ ์›์†Œ๋ฅผ ์ œ๊ฑฐ
                                              # ๋ฆฌ์ŠคํŠธ์˜ ์›์†Œ๊ฐ€ ์ ˆ๋Œ€๊ฐ’์ด 1๋ณด๋‹ค ์ž‘์€ ์›์†Œ๋ฅผ ์ œ๊ฑฐ # abs ํ•จ์ˆ˜๋Š” list๋ฅผ ๋‹ค๋ฃจ์ง€ ๋ชปํ•˜๋ฏ€๋กœ ์—๋Ÿฌ ๋ฐœ์ƒ

########## ํ–‰๋ ฌ์˜ ์ดˆ๊ธฐ ๋‚ด์šฉ ์„ค์ •๊ณผ ์—ฐ์‚ฐ ######### ##############################################

#๋ฒกํ„ฐ๋ฅผ ์ƒ์„ฑ

rowm1<-c(1.1,1.2,1.3,1.4,2.4,2.3)
rowm2<-c(3.1,3.4,3.6,4.1,4.3,4.7) rowm3<-c(1.1,1.2,1.3,3.1,3.4,3.6,4.1,4.3,4.7)

#๋ฒกํ„ฐ์˜ ๋ฐ์ดํ„ฐ๋ฅผ 2x3 ํ–‰๋ ฌ๋กœ ๋ณ€๊ฒฝ,,, ๋””ํดํŠธ๋Š” ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ์ž…๋ ฅ๋จ m1<- matrix(rowm1,2,3) m1

#๋ฒกํ„ฐ์˜ ๋ฐ์ดํ„ฐ๋ฅผ 3x2 ํ–‰๋ ฌ๋กœ ๋ณ€๊ฒฝ,,, ๋””ํดํŠธ๋Š” ์—ด์„ ๊ธฐ์ค€์œผ๋กœ ์ž…๋ ฅ๋จ

m2<- matrix(rowm2, 3,2) m2

#๋ฒกํ„ฐ์˜ ๋ฐ์ดํ„ฐ๋ฅผ ํ–‰์„ ๊ธฐ์ค€์œผ๋กœ 2x3 ํ–‰๋ ฌ๋กœ ๋ณ€๊ฒฝ m3<- matrix(rowm3, 3,3,byrow=T) m3 m3<- matrix(rowm3, 3,3,byrow=F) m3

2x2 ํ–‰๋ ฌ์„ 0์œผ๋กœ ์ดˆ๊ธฐํ™”ํ•œ ํ–‰๋ ฌ ์ƒ์„ฑ

m4<- matrix(0,2,2) m4

2x2 ํ–‰๋ ฌ์„ NA์œผ๋กœ ์ดˆ๊ธฐํ™”ํ•œ ํ–‰๋ ฌ ์ƒ์„ฑ

m5<- matrix(NA,2,2) m5

๋ฒกํ„ฐ์˜ ๊ตฌ์กฐ๋ฅผ ํ–‰๋ ฌ๊ตฌ์กฐ๋กœ ๋ณ€๊ฒฝํ•˜์—ฌ ํ–‰๋ ฌ์„ ์ƒ์„ฑ

dim(rowm3)<-c(3,3) rowm3

r1<-c(1,2,3,4,5,6)
r2<-c(6,5,4,3,2,1) r3<-c(1,2,3,4)

r1<-matrix(r1, 2,3) r2<-matrix(r2, 3,2) r3<-matrix(r3, 2,2) r1 r2 r3

2019-09-29 11:28

ํ–‰๋ ฌ์˜ ์—ฐ์‚ฐ

์ „์น˜ํ–‰๋ ฌ์„ ๊ตฌํ•จ

t(r3) #transpose(r3)

์—ญํ–‰๋ ฌ์„ ๊ตฌํ•จ

solve(r3)

ํ–‰๋ ฌ์˜ ๊ณฑ ๊ตฌํ•จ

r1%*%r2

#2์ฐจ ๋‹จ์œ„ํ–‰๋ ฌ์„ ๊ตฌํ•จ

diag(5)

######### ํ–‰๋ ฌ์˜ ์—ด๊ณผ ํ–‰์— ์ด๋ฆ„ ๋ถ™์ด๊ธฐ ###############

ํ–‰๋ ฌ์˜ ํ–‰์— ์ด๋ฆ„๋ถ™์ด๊ธฐ

rownames(m1)<-c(โ€œclass Aโ€, โ€œclass Bโ€)
m1

ํ–‰๋ ฌ์˜ ์—ด์— ์ด๋ฆ„๋ถ™์ด๊ธฐ

colnames(m1)<-c(โ€œmin_dโ€,โ€disโ€,โ€max_dโ€) m1

######### ํ–‰๋ ฌ์˜ ์—ด๊ณผ ํ–‰ ์„ ํƒํ•˜์—ฌ ํ•˜์œ„ํ–‰๋ ฌ ์ƒ์„ฑ ###############

#m1 ํ–‰๋ ฌ์—์„œ 1ํ–‰์„ ๋ฝ‘์•„ ๋ฒกํ„ฐ vm1 ์ƒ์„ฑ

vm1<-m1[1,]

#m1 ํ–‰๋ ฌ์—์„œ 2์—ด์„ ๋ฝ‘์•„ ๋ฒกํ„ฐ vm2 ์ƒ์„ฑ

vm2<-m1[,2]

#m1 ํ–‰๋ ฌ์—์„œ 1ํ–‰์„ ๋ฝ‘์•„ ํ•˜์œ„ํ–‰๋ ฌ sm1 ์ƒ์„ฑ

sm1 <- m1[1, , drop=TRUE] sm1
sm1 <- m1[1, , drop=FALSE] sm1

#m1 ํ–‰๋ ฌ์—์„œ 2์—ด์„ ๋ฝ‘์•„ ํ•˜์œ„ํ–‰๋ ฌ sm2 ์ƒ์„ฑ

sm2<-m1[,2, drop=FALSE]
sm2

2019-09-29 11:41

############# 4. ๋ฐ์ดํ„ฐ ๊ตฌ์กฐ์™€ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„(2) ######### ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๋งŒ๋“ค๊ธฐ ########

๋ฒกํ„ฐ์™€ ์š”์ธ์ด ํ˜ผํ•ฉ๋œ ๋ฐ์ดํ„ฐ๋ผ๋ฉด data.frame ํ•จ์ˆ˜๋ฅผ ์‚ฌ์šฉํ•ด์„œ ์กฐ๋ฆฝ

dfm<-data.frame(v1,v2,v3,f1,f2)

๋ฐ์ดํ„ฐ๊ฐ€ ๋ฆฌ์ŠคํŠธ ๊ตฌ์กฐ๋ผ๋ฉด as.data.frame ์œผ๋กœ ์žฌ์„ค์ • ๊ฐ€๋Šฅ

dfm<-as.data.frame(list.of.vectors)

#๋ฒกํ„ฐ ์ƒ์„ฑ level<-c(โ€œlowโ€,โ€midโ€,โ€highโ€) lbound<-c(0.1,0.5,1.5) ubound<-c(0.5,1.5,2.5)

#๋ฒกํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜ dfm1<-data.frame(level,lbound,ubound) dfm1

#์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๋ฅผ ๋ถˆ๋Ÿฌ์™€ ์–ด๋ธŒ์ ํŠธ์— ํ• ๋‹น a<-read.csv(โ€œframe.csvโ€, header=T)
a str(a)

a$ename<-as.character(a$ename) a$phone<-as.character(a$phone)

์™ธ๋ถ€ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ฆฌ์ŠคํŠธ ๊ตฌ์กฐ์ž„์— ๋”ฐ๋ผ ๊ตฌ์กฐ ๋ณ€๊ฒฝ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์— ์ ์šฉ

k<-as.list(a) k dfm1<- as.data.frame(a) dfm1 str(dfm1)

#์˜ค๋ธŒ์ ํŠธ์˜ ๋‚ด์šฉ ์ค‘ ํ•„์š”ํ•œ ๋ณ€์ˆ˜๋งŒ ์„ ํƒํ•ด์„œ data.frame ํ˜•์‹์œผ๋กœ ์žฌ ๊ตฌ์„ฑ

dfm2<-data.frame(a$empno, a$ename, a$deptno) dfm2

์—ด์˜ ์ด๋ฆ„์„ ์ ์šฉํ•˜์—ฌ data.frame ํ˜•์‹์œผ๋กœ ์žฌ ๊ตฌ์„ฑ

dfm2<- data.frame(empno = a$empno, ename = a$ename, deptno = a$deptno) dfm2

๊ฐœ๋ณ„ ๋ฒกํ„ฐ๋กœ ์ •์˜๋œ ๋ฐ์ดํ„ฐ๋“ค์„ ๋ฆฌ์ŠคํŠธ๋กœ ๊ตฌ์กฐ๋ฅผ ๋ณ€๊ฒฝํ•˜๊ณ  ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ํ˜•์‹์œผ๋กœ ์ ์šฉ

lst<-list(a1=a$empno, a2=a$ename, a3=a$deptno, a4=a$phone) lst lst1<- lst1

#ํ•˜๋‚˜์˜ ๋ฐ์ดํ„ฐ๋ฅผ ๋ฆฌ์ŠคํŠธ๊ตฌ์กฐ๋กœ ์…‹ํŒ…

a5<- list(a1=10011, a2=โ€ a5

#๊ธฐ์กด์˜ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์— a5๋ฅผ ์ถ”๊ฐ€

lst
lst1<-

#์ถ”๊ฐ€ํ•  ํ–‰ ์ •๋ณด๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ํ˜•์‹์œผ๋กœ ์ •์˜

newrow<-

#ํ–‰ ๊ฒฐํ•ฉ์„ ํ†ตํ•ด 2๊ฐœ์˜ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ๊ฒฐํ•ฉ

lst1<-
lst1

๋‹ค๋ฅธ ํ‘œํ˜„์œผ๋กœ

lst1<-

lst1

๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ํ• ๋‹นํ•˜๊ธฐ

#1,000,000๊ฐœ์˜ ํ–‰๊ณผ 3๊ฐœ์˜ ์—ด(2๊ฐœ๋Š” ์ˆ˜์น˜ํ˜•, 1๊ฐœ๋Š” ๋ฌธ์žํ˜•)์œผ๋กœ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ• ๋‹น

N<-1000000 dtfm<-data.frame(no=numeric(N), name=character(N), score=numeric(N)) dtfm

head(dtfm)

#๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด 2๋ฒˆ์งธ ์›์†Œ๋ฅผ ์„ ํƒ

#๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด 2๋ฒˆ์งธ ์›์†Œ๋‚ด ๋ฆฌ์ŠคํŠธ๋ฅผ ์„ ํƒ

๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„๋‚ด 2๋ฒˆ์งธ ํ–‰์›์†Œ๋ฅผ ์„ ํƒ

๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ ๋‚ด, ๋ชจ๋“  ํ–‰๊ณผ 1,3๋ฒˆ์งธ ์—ด์„ ์„ ํƒ

subset(๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„,select=c(์—ด์ด๋ฆ„, ์—ด์ด๋ฆ„,โ€ฆ)) ์œผ๋กœ ์‰ฝ๊ฒŒ ๋ฐ์ดํ„ฐ ์„ ํƒ

subset(๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„,select=c(์—ด์ด๋ฆ„, ์—ด์ด๋ฆ„,โ€ฆ),subset=(์—ด์ด๋ฆ„>์กฐ๊ฑด))

lst<-as.data.frame(k) lst

lst1<-subset(lst,select=-phone) lst1

lst1<-subset(lst,select=c(empno, deptno)) lst1

lst1<-subset(lst,select=c(empno, deptno), subset=(deptno==30)) lst1

lst1<-subset(lst,subset=(deptno==30)) lst1

############## ์—ฐ์Šต ๋ฌธ์ œ #############

MASS ๋ผ๋Š” ํŒจํ‚ค์ง€ ๋‚ด Cars93 ๋ฐ์ดํ„ฐ์…‹์—์„œ

1) city ์—์„œ ๊ฐค๋Ÿฐ๋‹น 30๋งˆ์ผ ์ด์ƒ ์ฃผํ–‰ํ•˜๋Š” ์—ฐ๋น„๋ฅผ ๊ฐ€์ง€๋Š” ์ฐจ๋ฅผ ์„ ํƒ

2) ๊ณ ์†๋„๋กœ์—์„œ MPG ๊ฐ’์ด ์ค‘์•™๊ฐ’์ด์ƒ์ธ ๋ชจ๋“  ์ฐจ์˜ ์ œ์กฐ์‚ฌ์™€ ๋ชจ๋ธ๋ช…

#########################################################

1)

library(MASS) ?Cars93

2)

newCars93<-

newCars93

#์—ด์ด๋ฆ„์œผ๋กœ ์—ด์‚ญ์ œ newCars93<- newCars93

#๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ์—ด์ด๋ฆ„ ๋ฐ”๊พธ๊ธฐ

newCars93

####### data editor ์—์„œ ๋ฐ์ดํ„ฐ ๋ณ€๊ฒฝ ##########

์ฃผ์˜)์‹คํ–‰ ์ทจ์†Œ ๊ธฐ๋Šฅ์ด ์—†๋‹ค.

##################################################

๋ฐ์ดํ„ฐ ์—๋””ํ„ฐ๋ฅผ ๋ถˆ๋Ÿฌ๋“ค์ž„

temp<-edit(lst1)

์—๋””ํ„ฐ์—์„œ ๋ณ€๊ฒฝํ•œ ๋‚ด์šฉ์„ ๋‹ค์‹œ ์ €์žฅ

lst1<-temp

์—๋””ํ„ฐ์—์„œ ๋ณ€๊ฒฝํ•œ ๋‚ด์šฉ์„ ๋ฎ์–ด์”€

fix(lst1)

lst1

######### NA ๊ฐ’์ด ์žˆ๋Š” ํ–‰์„ ์‚ญ์ œํ•˜๊ธฐ ###########

#๋ฒกํ„ฐ ์ƒ์„ฑ

x<-c(0.1,-0.5,1.5,1.6,-0.9,NA) y<-c(0.5,-1.5,NA,NA,1.5,2.5)

#๋ฒกํ„ฐ๋ฅผ ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜ NA_example<-data.frame(x,y) NA_example
cumsum(NA_example) # ๋ˆ„์ ํ•ฉ์„ ๊ตฌํ•˜๋Š” ํ•จ์ˆ˜

NA ๊ฐ’์„ ๊ฐ€์ง€๊ณ  ์žˆ๋Š” ํ–‰์„ ์‚ญ์ œ

NA_clean<-na.omit(NA_example) # omit NA์กด์žฌ ํ–‰ ์‚ญ์ œ NA_clean
cumsum(NA_clean)

๋‘๊ฐœ์˜ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์„ ํ•ฉ์น ๋•Œ

x<-c(1.5,1.3,1.5,1.4,1.8,1.8) y<-c(2.7,2.8,3.5,3.2,3.4,3.9) z<-c(5.7,5.8,6.9,5.8,5.1,5.6) b_dfm1<-data.frame(x,y) b_dfm2<-as.data.frame(z) cb_dfm<-cbind(b_dfm1,b_dfm2) cb_dfm

x<-c(1.5,1.3,1.5) y<-c(2.7,2.8,3.5) z<-c(5.7,5.8,6.9) b_dfm3<-data.frame(x,y,z) rb_dfm<-rbind(b_dfm3, b_dfm3) rb_dfm

#recycling rule ์ฃผ์˜

x<-c(1.5,1.3,1.5,1.4,1.8,1.8) y<-c(2.7,2.8,3.5,3.2,3.4,3.9) z<-c(5.7,5.8,6.9,9.9,1.1) b_dfm1<-data.frame(x,y) b_dfm2<-as.data.frame(z) cb_dfm<-cbind(b_dfm1,b_dfm2) cb_dfm

x<-c(1.5,1.3,1.5) y<-c(2.7,2.8,3.5) z<-c(5.7,5.8,6.9) a<-c(8.9,7.9,5.9) b_dfm3<-data.frame(x,y,z) b_dfm4<-data.frame(x,y,a) rb_dfm<-rbind(b_dfm3, b_dfm4) rb_dfm

######## ๋‘๊ฐœ์˜ ๋ฐ์ดํƒ€ ํ”„๋ ˆ์ž„์„ ๋™์ผํ•œ ๋ณ€์ˆ˜๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ํ•ฉ์น˜๊ธฐ #######

T_name<-c(โ€œT1โ€,โ€T2โ€,โ€T3โ€,โ€T4โ€,โ€T5โ€,โ€T6โ€) x<-c(1.5,1.3,1.5,1.4,1.8,1.8) y<-c(2.7,2.8,3.5,3.2,3.4,3.9)

T_na<-c(โ€œT1โ€,โ€T3โ€,โ€T5โ€) z<-c(5.7,5.8,6.9)

b_dfm1<-data.frame(T_name, x, y) b_dfm2<-data.frame(T_name=T_na, z) b_dfm1 b_dfm2

mg_dfm<-merge(b_dfm1, b_dfm2, by=โ€T_nameโ€) mg_dfm

mg_dfm<-merge(b_dfm1, b_dfm2, by=โ€T_nameโ€, all=T) mg_dfm ?merge

2019-09-29 12:31

# # #ํ•œ๋ฒˆ๋” ์—ฐ์Šตํ•ด ๋ณด์ž # #

a<-read.csv(โ€œframe.csvโ€, header=T) b<-read.csv(โ€œframe2.csvโ€, header=T)
merg1<-as.data.frame(a) merg2<-as.data.frame(b)

merg1 merg2

#empno ๋ณ€์ˆ˜๋ฅผ ์ค‘์‹ฌ์œผ๋กœ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๋ณ‘ํ•ฉ

merg <-
merg

#enmae.y ๊ฐ€ ์ค‘๋ณต๋˜์–ด ์‚ญ์ œ

merg<- merg

# #๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„ ๋‚ด์šฉ์„ ๋” ์‰ฝ๊ฒŒ ์ ‘๊ทผํ•˜๊ธฐ # #

zz<- zz

attach(rb_dfm) zzz<-x+y-z zzz detach()

############# 5. ๋ฐ์ดํ„ฐ ๋ณ€ํ˜•

์ž๋ฃŒํ˜• ๋ณ€ํ™˜ํ•˜๊ธฐ

# #as.charater() #as.complex() #as.numeric() ๋˜๋Š” as.double() #as.integer() #as.logical()

๋ฐ์ดํ„ฐ ๊ตฌ์กฐ ๋ณ€ํ™˜ํ•˜๊ธฐ

# #as.data.frame() #as.list() #as.matrix() #as.vector()

######### ๋ฐ์ดํ„ฐ ๋ณ€ํ˜• ############ ####################################

apply ํ•จ์ˆ˜, (apply, lapply, sapply, tapply, mapply)###

byํ•จ์ˆ˜, split ํ•จ์ˆ˜

์œ„์˜ ํ•จ์ˆ˜๋“ค์„ ํ†ตํ•ด ๋‹จ๋ฒˆ์— ๋ฐ์ดํ„ฐ๋ฅผ ๋ณ€ํ˜•ํ•˜๊ณ  ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋‹ค.

#########################################################

์š”์ธ์„ ํ†ตํ•ด ์ง‘๋‹จ ์ •์˜

v<-c(24,23,52,46,75,25) w<-c(87,86,92,84,77,68) f<-factor(c(โ€œAโ€,โ€Aโ€,โ€Bโ€,โ€Bโ€,โ€Cโ€,โ€Aโ€)) dfm<-data.frame(value=v,group=f) dfm

๋ฒกํ„ฐ๋ฅผ ์—ฌ๋Ÿฌ ์ง‘๋‹จ์œผ๋กœ ๋ถ„ํ• ํ•˜๊ธฐ

#group<-split(v,f) #๋ฒกํ„ฐ๋ฅผ ์š”์ธ์— ๋”ฐ๋ผ ๋ถ„ํ•  #group <-unstack(data.frame(v,f)) #๋ฒกํ„ฐ๊ฐ€ ๋™์ผํ•œ ๊ธธ์ด์ธ ๊ฒฝ์šฐ ๋ฆฌ์ŠคํŠธ๋ฅผ ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์œผ๋กœ ๋ณ€ํ™˜ํ•ด์คŒ

group<- group

group<- group

group<- group

group<- group

library(MASS)
head(Cars93)
# Origin={USA,non-USA}, MPG.city๋Š” ๋„์‹œ์—์„œ์˜ ์—ฐ๋น„

g<- g

                                         #MPG ํ‰๊ท  ๊ณ„์‚ฐ

๋ฆฌ์ŠคํŠธ์˜ ๊ฐ ์›์†Œ์— ํ•จ์ˆ˜ ์ ์šฉ

#list<-lapply(l,func) #vector<-sapply(l,func)

s1<-c(91,87,95,96,89,87,86,85,84,86,88,92,91,93,92,92,91,93,94,94,95,96,96,96,99,95,98,97,92,86,84,89,87,86,89,85,84) s2<-c(89,86,85,92,93,91,90,89,81,84,85,89,92,95,96,91,93,92,90,90,92,91,93,92,90,92,92,93,94,99,95,96,94) s3<-c(89,86,78,89,84,95,87,92,90,90,91,93,93,92,93,94,95,95,96,98,100,85,79,82,89,86,95,89,92,91,90,90,93,90,85,86,84,90) s4<-c(89,79,85,86,86,85,84,82,82,91,92,100,89,91,92,90,93,91,90,85,86,84,87,89,90,90,89,86,89,85,89,87,84,80,79,90,82)

length(s1) length(s2) length(s3) length(s4)

scores<- scores

ttest<- ttest

๋ชจ๋“  ํ–‰์— ํ•จ์ˆ˜ ์ ์šฉํ•˜๊ธฐ

results<-apply(met, 1, func)

m1<-c(82.5,88.2,89.2,87.5,89.9,78.3,79.8,80.9,81.9,83.5,85.6,87.2,88.2,89.5,91.5,78.9,79.2,81.5,83.2,82.5) dim(m1)<-c(4,5) colnames(m1) <- c(โ€œtr1โ€,โ€tr2โ€,โ€tr3โ€,โ€tr4โ€,โ€tr5โ€) rownames(m1) <- c(โ€œTomโ€,โ€Yoonโ€,โ€Moonโ€,โ€Songโ€) m1

#applyํ•จ์ˆ˜๋Š” ํ–‰๋ ฌ์˜ ์ฒ˜๋ฆฌ๋ฅผ ์œ„ํ•ด ๋งŒ๋“ค์–ด์กŒ๊ณ  1-ํ–‰,2-์—ด์„ func์œผ๋กœ ์ฒ˜๋ฆฌ

#lapply๋Š” ๋ฆฌ์ŠคํŠธ ํ˜•ํƒœ์—์„œ ์ ์šฉํ•  ์ˆ˜ ์žˆ์œผ๋ฏ€๋กœ ํ–‰๋ ฌ์˜ ๋ชจ๋“  ์›์†Œ๋ฅผ ๋ฆฌ์ŠคํŠธ๋กœ ์ธ์‹ํ•จ

#sapply๋Š” ๋ชจ๋“  ํ–‰๋ ฌ์˜ ์›์†Œ๋ฅผ ๋ฒกํ„ฐ๋กœ ์ธ์‹ํ•˜์—ฌ ๋ฐ˜ํ™˜ํ•จ

t<-read.csv(โ€œtest.csvโ€, header=T) test<-data.frame(t) test

#๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ apply๋ฅผ ์ ์šฉํ•˜๋ ค๋ฉด ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋‘ ์ˆซ์ž๋‚˜ ๋ฌธ์ž๋กœ ๋™์งˆ์ ์ธ ๊ฒฝ์šฐ๋งŒ ์ ์šฉ๊ฐ€๋Šฅ

#๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์˜ ๊ฐ ์—ด๋“ค์˜ ํด๋ ˆ์Šค๋ฅผ ํ™•์ธํ•  ๋•Œ ํ™œ์šฉ ๊ฐ€๋Šฅ

#๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ์—ด์„ ๊ธฐ์ค€์œผ๋กœ๋งŒ func์„ ์ ์šฉํ•  ๋•Œ ์‚ฌ์šฉ๊ฐ€๋Šฅ, lapply๋Š” ๋ฆฌ์ŠคํŠธ๋กœ ๊ฐ’์„ ๋ฐ˜ํ™˜

#๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ์—ด์„ ๊ธฐ์ค€์œผ๋กœ๋งŒ func์„ ์ ์šฉํ•  ๋•Œ ์‚ฌ์šฉ๊ฐ€๋Šฅ, sapply๋Š” ๋ฒกํ„ฐ๋กœ ๊ฐ’์„ ๋ฐ˜ํ™˜

๋ฐ์ดํ„ฐ ์ง‘๋‹จ์— ํ•จ์ˆ˜ ์ ์šฉํ•˜๊ธฐ

############################################### ###############################################

tapply(x,f,func) # x๋Š” ๋ฒกํ„ฐ, f๋Š” ์ง‘๋‹จ ๋ถ„๋ฅ˜ ์š”์ธ, func๋Š” ํ•จ์ˆ˜

Cars93 attach(Cars93)

sum(Weight) mean(Weight)

Origin

                                 # Cars93 ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ๋ฌด๊ฒŒ๋ฅผ ์ƒ์‚ฐ์ง€ ๊ตฌ๋ถ„๋ณ„๋กœ ํ•ฉ๊ณ„
                                 # Cars93 ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ๋ฌด๊ฒŒ๋ฅผ ์ƒ์‚ฐ์ง€ ๊ตฌ๋ถ„๋ณ„๋กœ ํ‰๊ท 
                                 # Cars93 ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ๋ฌด๊ฒŒ์˜ ๊ฐ์ˆ˜๋ฅผ ์ƒ์‚ฐ์ง€ ๊ตฌ๋ถ„๋ณ„๋กœ ์นด์šดํŠธ
ํ–‰ ์ง‘๋‹จ์— ํ•จ์ˆ˜ ์ ์šฉํ•˜๊ธฐ

############################################### ############################################### library(MASS) # Cars93 ๋ฐ์ดํ„ฐ ํ”„๋ ˆ์ž„์—์„œ ์ƒ์‚ฐ์ง€๊ตฌ๋ถ„๋ณ„๋กœ ์š”์•ฝ

head(Cars93) attach(Cars93) model<- model

ํ•จ์ˆ˜๋ฅผ ์ƒ์„ฑ

#๋ฌธ์ž์—ด๋‹ค๋ฃจ๊ธฐ

#๋ฌธ์ž์—ด ๊ธธ์ด ์•Œ์•„๋‚ด๊ธฐ

n<-c(โ€œmyโ€, โ€œnameโ€, โ€œisโ€, โ€œTomโ€) length(n)

#๋ฌธ์ž์—ด ์—ฐ๊ฒฐํ•˜๊ธฐ

name<-c(โ€œTomโ€, โ€œMoeโ€, โ€œLarryโ€)

#ํ•˜์œ„๋ฌธ์ž์—ด ์ถ”์ถœํ•˜๊ธฐ

#๊ตฌ๋ถ„์ž๋กœ ๋ฌธ์ž์—ด ๋ถ„ํ• ํ•˜๊ธฐ

#ํ•˜์œ„ ๋ฌธ์ž์—ด ๋Œ€์ฒดํ•˜๊ธฐ s<-โ€œCurly is the smart one. Curly is funny, too.โ€

#๋ฌธ์ž์—ด์˜ ๋ชจ๋“  ์Œ๋ณ„ ์กฐํ•ฉ ๋งŒ๋“ค๊ธฐ location<-c(โ€œSeoulโ€,โ€Pusanโ€,โ€Inchonโ€) treatment<-c(โ€œT1โ€,โ€T2โ€,โ€T3โ€)

#ํ˜„์žฌ ๋‚ ์งœ ์•Œ์•„๋‚ด๊ธฐ

#๋ฌธ์ž์—ด์„ ๋‚ ์งœ๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ

#๋‚ ์งœ๋ฅผ ๋ฌธ์ž์—ด๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ

#๋‚ ์งœ ์ผ๋ถ€ ์ถ”์ถœํ•˜๊ธฐ d<- p<-

#๋‚ ์งœ๋กœ ์ˆ˜์—ด ์ƒ์„ฑํ•˜๊ธฐ start<- end<- countdown<-seq(from=start, to=end, by=1) countdown


#์—ฐ์Šต๋ฌธ์ œ 20190929

1. MASS ํŒจํ‚ค์ง€์— ๋‚ด์žฅ๋œ ๋ฐ์ดํ„ฐ cats๋Š” ๋‹ค์Œ 3๊ฐœ์˜ ๋ณ€์ˆ˜๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค.

Sex - ์„ฑ๋ณ„: ๋ฒ”์ฃผํ˜•, ์•”์ปท(โ€œFโ€), ์ˆ˜์ปท(โ€œMโ€)

Bwt - ๋ชธ๋ฌด๊ฒŒ(kg)

Hwt - ์‹ฌ์žฅ์˜ ๋ฌด๊ฒŒ(g)

1-1. ์•„๋ž˜ ์ฝ”๋“œ์˜ ์˜๋ฏธ๋Š”? (๊ฐ ๋ผ์ธ๋ณ„๋กœ ์„ค๋ช…ํ•˜์‹œ์˜ค)

library(MASS) #- ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ ์ž„ํฌํŠธ

head(cats)
#- cats์˜ ์ƒ์œ„ 6๊ฐœ ํ–‰ ๋ฐ์ดํ„ฐ๋ฅผ ์ถœ๋ ฅ

1-2. ์ƒ์ฅ ์ž๋ฃŒ(cats)์˜ ์ž๋ฃŒ์˜ ์ˆ˜๋ฅผ ๊ตฌํ•˜์‹œ์˜ค.

cats length(cats[[1]]) #- 144 * 3

1-3. ์ƒ์ฅ์˜ ๋ชธ๋ฌด๊ฒŒ์™€ ์‹ฌ์žฅ์˜ ๋ฌด๊ฒŒ์˜ ํ‰๊ท ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ ๊ตฌํ•˜๋ผ.

bwt<-cats$Bwt

str(bwt)

mean(bwt) sd(bwt)

hwt<-cats$Hwt

mean(hwt) sd(hwt)

mean(bwt) [1] 2.723611 sd(bwt) [1] 0.4853066 hwt<-cats$Hwt

mean(hwt) [1] 10.63056 sd(hwt) [1] 2.434636

1-4. ์ƒ์ฅ์˜ ์•”์ˆ˜๋ณ„ ๋ชธ๋ฌด๊ฒŒ์™€ ์‹ฌ์žฅ์˜ ๋ฌด๊ฒŒ์˜ ํ‰๊ท ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ ๊ฐ๊ฐ ๊ตฌํ•˜๋ผ.

cats male <- subset(cats,subset=(Sex==โ€Mโ€)) female <- subset(cats,subset=(Sex==โ€Fโ€))

mean(male$Bwt) sd(male$Bwt) mean(male$Hwt) sd(male$Hwt)

mean(female $Bwt) sd(female $Bwt) mean(female $Hwt) sd(female $Hwt)

mean(male$Bwt) [1] 2.9 sd(male$Bwt) [1] 0.4674844 mean(male$Hwt) [1] 11.32268 sd(male$Hwt) [1] 2.542288 mean(female $Bwt) [1] 2.359574 sd(female $Bwt) [1] 0.2739879 mean(female $Hwt) [1] 9.202128 sd(female $Hwt) [1] 1.357666

2. ์•„๋ž˜์™€ ๊ฐ™์€ ํ–‰๋ ฌ X์™€ ๋ฒกํ„ฐ y๊ฐ€ ์žˆ๋‹ค.

2-1. X์™€ y๋ฅผ ๊ฐ๊ฐ R๊ฐ์ฒด X, y๋กœ ์ €์žฅํ•˜์—ฌ๋ผ.

2.2 X์˜ ์ „์น˜ํ–‰๋ ฌ์„ ๊ตฌํ•˜๋ผ

2.3 X ์ „์น˜ํ–‰๋ ฌ๊ณผ X์˜ ๊ณฑ์„ ๊ตฌํ•˜๋ผ

2.4 X ์ „์น˜ํ–‰๋ ฌ* X์˜ ์—ญํ–‰๋ ฌ์„ ๊ตฌํ•˜๋ผ

2.4 (X^TX)^-1X^T*y๋ฅผ ๊ตฌํ•˜๋ผ

3. ์‚ฌ์šฉ์ž ์ •์˜ํ•จ์ˆ˜ ๋งŒ๋“ค๊ธฐ

3-1. ํ‰๊ท , ํ‘œ์ค€ํŽธ์ฐจ, min, max๊ฐ’์„ listํ˜•ํƒœ๋กœ ๊ฐ๊ฐ ๋‚˜ํƒ€๋‚ด๋Š” ํ•จ์ˆ˜๋ฅผ ์ž‘์„ฑํ•˜์—ฌ๋ผ.

๊ทธ๋ฆฌ๊ณ  Cars93 ๋ฐ์ดํ„ฐ์˜ MPG.highway๋ณ€์ˆ˜์˜ ํ‰๊ท , ํ‘œ์ค€ํŽธ์ฐจ, min, max ๊ฐ’์„ ๋‚˜ํƒ€๋‚ด๋ผ.

3-2. ๋‘ ๊ฐœ์˜ ์ˆซ์ž๋ฅผ ์ž…๋ ฅ ๋ฐ›์€ ํ›„ ๋‘ ๊ฐ’์ด ๋ชจ๋‘ ์–‘์ˆ˜์ผ ๊ฒฝ์šฐ ๋‘ ์ˆ˜์˜ ๊ณฑ์„ ์ถœ๋ ฅํ•˜๊ณ 

๋‘ ๊ฐ’ ์ค‘ ํ•˜๋‚˜๋ผ๋„ 0์ด๋‚˜ ์Œ์ˆ˜์ผ ๊ฒฝ์šฐ๋Š” ๋‘ ์ˆ˜์˜ ํ•ฉ์„ ์ถœ๋ ฅํ•˜๋Š” ํ•จ์ˆ˜๋ฅผ R์ฝ”๋“œ๋กœ

์ž‘์„ฑํ•˜๊ณ  3์™€ -1์„ ๋„ฃ์€ ๊ฒฐ๊ณผ๋ฅผ ์ถœ๋ ฅํ•˜์‹œ์˜ค. (๋‹จ, if, else ๋ฌธ์„ ์‚ฌ์šฉํ•˜์„ธ์š”.)

4. smoke ๋ฐ์ดํ„ฐ๋Š” ๋‹ค์Œ 9๊ฐœ์˜ ๋ณ€์ˆ˜๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ๋‹ค.

Gender - ์„ฑ๋ณ„ - ๋ฒ”์ฃผํ˜•(F:์—ฌ์ž, M:๋‚จ์ž)

Age - ๋‚˜์ด - ์—ฐ์†ํ˜•

Smoker - ํก์—ฐ์—ฌ๋ถ€ - ๋ฒ”์ฃผํ˜•(yes, no)

HowLong - ํก์—ฐ๊ธฐ๊ฐ„(๋…„) - ์—ฐ์†ํ˜•

Cigarettes - ์ผํก์—ฐ๋Ÿ‰(๊ฐœํ”ผ) - ์—ฐ์†ํ˜•

Height - ํ‚ค(cm) - ์—ฐ์†ํ˜•

Waist - ๊ฐ€์Šด๋‘˜๋ ˆ(cm) - ์—ฐ์†ํ˜•

Hips - ์—‰๋ฉ์ด๋‘˜๋ ˆ(cm) - ์—ฐ์†ํ˜•

Weight - ๋ชธ๋ฌด๊ฒŒ(kg) - ์—ฐ์†ํ˜•

1. ์ฃผ์–ด์ง„ ์—‘์…€ ๋ฐ์ดํ„ฐ๋ฅผ ์ฝ์–ด R ๋ฐ์ดํ„ฐํ”„๋ ˆ์ž„ smokers๋กœ ์ €์žฅํ•˜์—ฌ๋ผ.

2. smokers์—์„œ ์ž๋ฃŒ์˜ ์ˆ˜(๋ ˆ์ฝ”๋“œ์˜ ์ˆ˜)๋ฅผ ๊ตฌํ•˜์‹œ์˜ค.

3. smokers ์ž๋ฃŒ์˜ ์•ž์—์„œ ๋ถ€ํ„ฐ 10๊ฐœ์˜ ๋ ˆ์ฝ”๋“œ๋ฅผ ์ถœ๋ ฅํ•˜์—ฌ๋ผ.

4. ์ž๋ฃŒ์—์„œ ์—ฌ์ž์™€ ๋‚จ์ž์˜ ์ˆ˜๋ฅผ ๊ตฌํ•˜์‹œ์˜ค.

?table

5. ์ž๋ฃŒ์—์„œ ํก์—ฐ์ž์˜ ์ˆ˜์™€ ํก์—ฐ๋น„์œจ์„ ๊ตฌํ•˜์‹œ์˜ค.

6. ์ž๋ฃŒ์—์„œ ์„ฑ๋ณ„ ํก์—ฐ์ž์˜ ์ˆ˜์™€ ํก์—ฐ๋น„์œจ์„ ๊ตฌํ•˜์‹œ์˜ค.

7. BMI(์ฒด์งˆ๋Ÿ‰์ง€์ˆ˜)๋Š” ๋ชธ๋ฌด๊ฒŒ๋ฅผ ํ‚ค(m)์˜ ์ œ๊ณฑ์œผ๋กœ ๋‚˜๋ˆˆ ๊ฐ’์ด๋‹ค. ์ž๋ฃŒ์—์„œ BMI๋ฅผ ๊ตฌํ•˜์—ฌ๋ผ.

8. ์„ฑ๋ณ„ BMI์˜ ํ‰๊ท ๊ณผ ํ‘œ์ค€ํŽธ์ฐจ๋ฅผ ๊ตฌํ•˜๋ผ.

Categories:

Updated: