Dra. Melanie Kolb

M. en F. C. Gustavo Magallanes-Guijón

Dr. Oliver López-Corona

# Librerías
library(RColorBrewer) 
library(funModeling)
library(corrplot)
library(mpmi)
library(minerva)
library(infotheo)
library(DT)
library(knitr)

Sitio: Metztitlán 1

Se tiene un marco de datos que contiene varias métricas relacionadas, y se calculó (con la teoría de la información): entropía, información mutua, ganancia de información y relación de ganancia.

Para esto se contó con los datos multivariados (marco de datos de entrada), y todas las variables se evaluaron contra una variable definida (como parámetro “objetivo”).

Acontinuación se presentan cuatro apartados de gráficos del cuerpo de agua Río Metztitlán, sitio Metztitlán 1.

Los gráficos son en el siguiente orden:

Matríz de Información Mutua

#Datos
sitio_mim <- read.csv("data/metztitlan_1_mim.csv")
# Discretizar cada variable
matriz=discretize(sitio_mim) 

# Calcular la "correlación" basándonos en información mutua
matriz_im=mutinformation(matriz, method= "emp")

# Truco para visualizar el valor máximo de la escala
# excluyendo la diagonal (variable con respecto a sí misma)
diag(matriz_im)=0

# Gráfico de correlación con color y correlación con información mutua del paquete Infotheo. 
corrplot(matriz_im, method="color",type="lower", number.cex=0.6,addCoef.col = "black", tl.col="red", tl.srt=90, tl.cex = 0.9, diag=FALSE, is.corr = F)

eti_sitio = c(
  'E_COLI', 
  'HG_TOT', 
  'TURBIEDAD', 
  'SST', 
  'COLOR_VER', 
  'DUR_TOT', 
  'N_TOT',
  'COLI_FEC', 
  'N_NH3', 
  'N_NO2', 
  'N_NO3')

names_eti_sitio = c(
  'Escherichia coli',
 'Mercurio Total',
 'Turbiedad',
 'Sólidos Suspendidos Totales',
 'Color Verdadero',
 'Dureza Total',
 'Nitrógeno Total (Cálculo)',
 'Coliformes Fecales',
 'Nitrógeno Amoniacal',
 'Nitrógeno de Nitritos',
 'Nitrógeno de Nitratos')

Gráficas Información Mutua

for (i in seq_along(eti_sitio)) {

  #plot in Rmd
    print(myplot <- ggplot(var_rank_info(sitio_mim,  eti_sitio[i]), aes(x = reorder(var, mi),y = mi, fill = var))
          + geom_bar(stat = "identity") 
          + coord_flip() 
          + theme_bw() 
          + xlab("")
          + ylab("Información Mutua")
          + ggtitle(names_eti_sitio[i])
          + theme(plot.title = element_text(hjust = 0.5))
          + guides(fill = FALSE))
  
    print(kable(var_rank_info(sitio_mim, eti_sitio[i])))
  #save table in csv
  #name_mi <- names_eti_sitio[i]
  #name_table_mi <- paste("csv-graphs/metz1/mi/",name_mi,"_mi.csv",sep = "")
  #write.table(var_rank_info(sitio_mim, eti_sitio[i]), file = name_table_mi, sep = ",", col.names = NA)
  
  #save plot
  #plot_mi <- paste("images/metz1/mi/",name_mi,"_mi.png",sep = "")
  #ggsave(plot_mi)
  
  
}

var en mi ig gr
en3 COLOR_VER 3.547 2.507 2.507380 0.8906983
en2 SST 3.700 3.239 3.238901 0.8752747
en4 DUR_TOT 3.700 3.239 3.238901 0.8752747
en5 N_TOT 3.700 3.239 3.238901 0.8752747
en7 N_NH3 3.700 3.239 3.238901 0.8752747
en8 N_NO2 3.700 3.239 3.238901 0.8752747
en9 N_NO3 3.700 3.239 3.238901 0.8752747
en1 TURBIEDAD 3.700 3.085 3.085055 0.8698643
en6 COLI_FEC 3.700 3.085 3.085055 0.8698643
en HG_TOT 3.700 2.931 2.931209 0.8639632

var en mi ig gr
en2 SST 3.7 3.393 3.392747 0.9168498
en4 DUR_TOT 3.7 3.393 3.392747 0.9168498
en5 N_TOT 3.7 3.393 3.392747 0.9168498
en7 N_NH3 3.7 3.393 3.392747 0.9168498
en8 N_NO2 3.7 3.393 3.392747 0.9168498
en9 N_NO3 3.7 3.393 3.392747 0.9168498
en1 TURBIEDAD 3.7 3.239 3.238901 0.9132429
en6 COLI_FEC 3.7 3.239 3.238901 0.9132429
en E_COLI 3.7 2.931 2.931209 0.9050010
en3 COLOR_VER 3.7 2.507 2.507380 0.8906983

var en mi ig gr
en2 SST 3.7 3.547 3.546594 0.9584249
en4 DUR_TOT 3.7 3.547 3.546594 0.9584249
en5 N_TOT 3.7 3.547 3.546594 0.9584249
en7 N_NH3 3.7 3.547 3.546594 0.9584249
en8 N_NO2 3.7 3.547 3.546594 0.9584249
en9 N_NO3 3.7 3.547 3.546594 0.9584249
en6 COLI_FEC 3.7 3.393 3.392747 0.9566214
en1 HG_TOT 3.7 3.239 3.238901 0.9546544
en E_COLI 3.7 3.085 3.085055 0.9525005
en3 COLOR_VER 3.7 2.661 2.661226 0.9453491

var en mi ig gr
en E_COLI 3.7 3.239 3.238901 1
en1 HG_TOT 3.7 3.393 3.392747 1
en2 TURBIEDAD 3.7 3.547 3.546594 1
en3 COLOR_VER 3.7 2.815 2.815072 1
en6 COLI_FEC 3.7 3.547 3.546594 1
en4 DUR_TOT 3.7 3.700 3.700440 1
en5 N_TOT 3.7 3.700 3.700440 1
en7 N_NH3 3.7 3.700 3.700440 1
en8 N_NO2 3.7 3.700 3.700440 1
en9 N_NO3 3.7 3.700 3.700440 1

var en mi ig gr
en E_COLI 3.547 2.507 2.507380 0.7741453
en3 SST 3.700 2.815 2.815072 0.7607400
en4 DUR_TOT 3.700 2.815 2.815072 0.7607400
en5 N_TOT 3.700 2.815 2.815072 0.7607400
en7 N_NH3 3.700 2.815 2.815072 0.7607400
en8 N_NO2 3.700 2.815 2.815072 0.7607400
en9 N_NO3 3.700 2.815 2.815072 0.7607400
en2 TURBIEDAD 3.700 2.661 2.661226 0.7503612
en6 COLI_FEC 3.700 2.661 2.661226 0.7503612
en1 HG_TOT 3.700 2.507 2.507380 0.7390412

var en mi ig gr
en E_COLI 3.7 3.239 3.238901 1
en1 HG_TOT 3.7 3.393 3.392747 1
en2 TURBIEDAD 3.7 3.547 3.546594 1
en4 COLOR_VER 3.7 2.815 2.815072 1
en6 COLI_FEC 3.7 3.547 3.546594 1
en3 SST 3.7 3.700 3.700440 1
en5 N_TOT 3.7 3.700 3.700440 1
en7 N_NH3 3.7 3.700 3.700440 1
en8 N_NO2 3.7 3.700 3.700440 1
en9 N_NO3 3.7 3.700 3.700440 1