# Definindo o diretorio a ser usado setwd("C:/Users/hedibertFL/Desktop") # Lendo conjunto de dados da pagina do professor data = read.table("http://hedibert.org/wp-content/uploads/2016/02/wage.txt",header=TRUE) dim(data) # exibe a dimensao da matriz de dados data[1:10,] # listando as 10 primeiras linhas de data hist(data[,1]) # histograma da 1a coluna de data # Melhorando a aparencia do histograma hist(data[,1],xlab="",ylab="Frequencia",main="Salario\ndolares por hora") hist(data[,1],ylab="Frequencia",main="Salario",xlab="dolares por hora") # Boxplot com e seu "outliers" par(mfrow=c(1,2)) boxplot(data[,1],ylab="dolares por hora") boxplot(data[,1],ylab="dolares por hora",outline=FALSE) # Salvando graficos em PDF pdf(file="meuarquivo1.pdf",height=12,width=10) hist(data[,1],ylab="Frequencia", main="Salario",xlab="dolares por hora") dev.off() pdf(file="meuarquivo2.pdf",height=12,width=10) boxplot(data[,1],ylab="dolares por hora",outline=FALSE) dev.off() # attach : carrega as variaveis pelos nomes attach(data) # diagrama de dispersao plot(exper,wage) # correlacao entre variaveis cor(exper,wage) # Minha primeira regressao no R # Utilizado o commando lm (linear model) minharegressao = lm(wage ~ exper) # resumo da regressao linear simples summary(minharegressao) # adicionando a linha de regressao ao grafico plot(exper,wage) abline(minharegressao$coef,col="red") abline(h=mean(wage),col="blue") # Graficos e regressoes para subgrupos das variaveis: homens e mulheres # Boxplot de renda por sexo boxplot(wage,wage[female==1],wage[female==0], names=c("todos","M","H"), xlab="salario em dolares por hora", outline=FALSE,horizontal=TRUE) # regressao wage contra exper para mulheres e homens plot(exper,wage,pch=16,col=female+1) legend("topright",legend=c("homen","mulher"),col=1:2,pch=16) abline(lm(wage[female==1] ~ exper[female==1]),col=2) abline(lm(wage[female==0] ~ exper[female==0])) abline(h=mean(wage[female==1]),col=3) abline(h=mean(wage[female==0]),col=4) # regressao wage contra educ para mulheres e homens plot(educ,wage,pch=16,col=female+1) legend("topleft",legend=c("homen","mulher"),col=1:2,pch=16) abline(lm(wage[female==1] ~ educ[female==1]),col=2) abline(lm(wage[female==0] ~ educ[female==0])) abline(h=mean(wage[female==1]),col=3) abline(h=mean(wage[female==0]),col=4)