Dra. Melanie Kolb

M. en F. C. Gustavo Magallanes-Guijón

Dr. Oliver López-Corona

# Librerías
library(RColorBrewer) 
library(funModeling)
library(corrplot)
library(minerva)
library(infotheo)
library(DT)
library(knitr)

Sitio: Tlacotepec

Se tiene un marco de datos que contiene varias métricas relacionadas, y se calculó (con la teoría de la información): entropía, información mutua, ganancia de información y relación de ganancia.

Para esto se contó con los datos multivariados (marco de datos de entrada), y todas las variables se evaluaron contra una variable definida (como parámetro “objetivo”).

Acontinuación se presentan cuatro apartados de gráficos del cuerpo de agua Río Metztitlán, sitio sitio.

Los gráficos son en el siguiente orden:

Matríz de Información Mutua

#data
sitio_mim <- read.csv("data/tlacotepec_mim.csv")
# Discretizar cada variable
matriz=discretize(sitio_mim) 
# Calcular la "correlación" basándonos en información mutua
matriz_im=mutinformation(matriz, method= "emp")
# Truco para visualizar el valor máximo de la escala
# excluyendo la diagonal (variable con respecto a sí misma)
diag(matriz_im)=0
# Gráfico de correlación con color y correlación con información mutua del paquete Infotheo. 
corrplot(matriz_im, method="color",type="lower", number.cex=0.6,addCoef.col = "black", tl.col="red", tl.srt=90, tl.cex = 0.9, diag=FALSE, is.corr = F)

eti_sitio = c(
  'SAAM', 
  'OD_mg.L', 
  'COLI_TOT', 
  'pH_CAMPO', 
  'TEMP_AGUA', 
  'NI_TOT',
  'E_COLI', 
  'HG_TOT', 
  'CR_TOT', 
  'AS_TOT', 
  'TURBIEDAD', 
  'SST', 
  'COLOR_VER',
  'DUR_TOT', 
  'N_TOT', 
  'COLI_FEC', 
  'N_NH3', 
  'N_NO2', 
  'N_NO3')
names_eti_sitio = c(
  'Sustancias Activas al Azul de Metileno',
 'Oxígeno Disuelto',
 'Coliformes Totales',
 'Potencial de Hidrógeno',
 'Temperatura agua',
 'Níquel Total',
 'Escherichia coli',
 'Mercurio Total',
 'Cromo Total',
 'Arsénico Total',
 'Turbiedad',
 'Sólidos Suspendidos Totales',
 'Color Verdadero',
 'Dureza Total',
 'Nitrógeno Total (Cálculo)',
 'Coliformes Fecales',
 'Nitrógeno Amoniacal',
 'Nitrógeno de Nitritos',
 'Nitrógeno de Nitratos')

Gráficas Información Mutua

#, results='hide'
for (i in seq_along(eti_sitio)) {
  
    print(myplot <- ggplot(var_rank_info(sitio_mim,  eti_sitio[i]), aes(x = reorder(var, mi),y = mi, fill = var))
          + geom_bar(stat = "identity") 
          + coord_flip() 
          + theme_bw() 
          + xlab("")
          + ylab("Información Mutua")
          + ggtitle(names_eti_sitio[i])
          + theme(plot.title = element_text(hjust = 0.5))
          + guides(fill = FALSE))
  
  print(kable(var_rank_info(sitio_mim, eti_sitio[i])))
  #save table in csv
  #name_mi <- names_eti_sitio[i]
  #name_table_mi <- paste("csv-graphs/tlaco/mi/",name_mi,"_mi.csv",sep = "")
  #write.table(var_rank_info(sitio_mim, eti_sitio[i]), file = name_table_mi, sep = ",", col.names = NA)
  
  #save plot
  #plot_mi <- paste("images/tlaco/mi/",name_mi,"_mi.png",sep = "")
  #ggsave(plot_mi)
}

var en mi ig gr
en4 NI_TOT 5.037 4.500 4.500391 0.9028284
en7 CR_TOT 5.037 4.375 4.375263 0.9003263
en6 HG_TOT 5.070 4.323 4.322631 0.8931470
en12 DUR_TOT 5.248 4.553 4.553023 0.8675850
en13 N_TOT 5.248 4.553 4.553023 0.8675850
en15 N_NH3 5.248 4.553 4.553023 0.8675850
en16 N_NO2 5.248 4.553 4.553023 0.8675850
en17 N_NO3 5.248 4.553 4.553023 0.8675850
en8 AS_TOT 5.248 4.500 4.500391 0.8662435
en OD_mg.L 5.248 4.448 4.447760 0.8648746
en9 TURBIEDAD 5.248 4.395 4.395128 0.8634774
en10 SST 5.248 4.395 4.395128 0.8634774
en14 COLI_FEC 5.248 4.395 4.395128 0.8634774
en5 E_COLI 5.248 4.237 4.237234 0.8591068
en3 TEMP_AGUA 5.248 4.217 4.217368 0.8585371
en1 COLI_TOT 5.248 4.198 4.197503 0.8579627
en11 COLOR_VER 5.143 3.296 3.295801 0.8482434
en2 pH_CAMPO 5.195 3.008 3.007522 0.8240249

var en mi ig gr
en12 DUR_TOT 5.248 5.143 5.142664 0.9799420
en13 N_TOT 5.248 5.143 5.142664 0.9799420
en15 N_NH3 5.248 5.143 5.142664 0.9799420
en16 N_NO2 5.248 5.143 5.142664 0.9799420
en17 N_NO3 5.248 5.143 5.142664 0.9799420
en8 AS_TOT 5.248 5.090 5.090033 0.9797388
en9 TURBIEDAD 5.248 4.985 4.984770 0.9793197
en10 SST 5.248 4.985 4.984770 0.9793197
en14 COLI_FEC 5.248 4.985 4.984770 0.9793197
en4 NI_TOT 5.248 4.880 4.879506 0.9788830
en5 E_COLI 5.248 4.827 4.826875 0.9786577
en3 TEMP_AGUA 5.248 4.807 4.807009 0.9785714
en1 COLI_TOT 5.248 4.787 4.787144 0.9784844
en7 CR_TOT 5.248 4.754 4.754378 0.9783393
en6 HG_TOT 5.248 4.735 4.734512 0.9782504
en SAAM 5.248 4.448 4.447760 0.9768806
en11 COLOR_VER 5.248 3.780 3.780179 0.9729083
en2 pH_CAMPO 5.248 3.545 3.544531 0.9711592