tanggle 1.6.0
Esta es la viñeta en español para el paquete de R tanggle, en ella proveemos una vista general de sus funciones y ejemplos de uso. Tanggle extiende el paquete de R ggtree (Yu et al. 2017), lo cual permite la visualización de múltiples tipos de redes filogenéticas usando la sintaxis de ggplot2 (Wickham 2016). Especificamente, tanggle contiene funciones que permiten al usuario visualizar: (1) redes divididas o implícitas (no-enraizadas, no-direccionadas) y (2) redes explícitas (enraizadas, direccionadas) con reticulaciones. Estas funciones ofrecen alternativas a las funciones gráficas disponibles en ape (Paradis and Schliep 2018) y phangorn (Schliep 2011).
name | Brief description |
---|---|
geom_splitnet |
Adds a splitnet layer to a ggplot, to combine visualising data and the network |
ggevonet |
Grafica una red explícita de un objeto phylo |
ggsplitnet |
Grafica una red implícita de un objeto phylo |
minimize_overlap |
Reduce el número de líneas de reticulación entrecruzadas en la gráfica |
node_depth_evonet |
Devuelve las profundidades o alturas de los nodos y puntas en la red filogenética |
Instalar el paquete desde Bioconductor directamente:
Install the package from Bioconductor directly:
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("tanggle")
O instalar la versión de desarrollo del paquete desde: Github.
if (!requireNamespace("remotes", quietly=TRUE))
install.packages("remotes")
remotes::install_github("KlausVigo/tanggle")
Si necesita installer ggtree desde github:
remotes::install_github("YuLab-SMU/ggtree")
Y cargar todas las librerías:
library(tanggle)
library(phangorn)
library(ggtree)
Las redes divididas son objetos de visualización de datos que permiten la definición de 2 (o más) opciones de división no compatibles. Las redes divididas son usadas frecuentemente para graficar redes consenso (Holland et al. 2004) o redes vecinas (Bryant and Moulton 2004). Esto puede llevarse a cabo utilizando las funciones consensusNet
o neighbor-net
en phangorn (Schliep 2011), o importando archivos Nexus provenientes de SplitsTree (Huson and Bryant 2006).
tanggle acepta tres formatos de entrada para redes divididas. Las siguientes opciones de entrada generan un objeto network para graficar.
Archivo Nexus creado con SplitsTree (Huson and Bryant 2006) e importado con la función read.nexus.network
en phangorn (Schliep 2011).
Carga de red dividida en formato Nexus:
fdir <- system.file("extdata/trees", package = "phangorn")
Nnet <- phangorn::read.nexus.networx(file.path(fdir,"woodmouse.nxs"))
read.nexus
Archivo de texto en formato Newick (un árbol de genes por línea) importado con la función read.tree
Estimación de una red dividida consenso mediante la función consensusNet
en phangorn (Schliep 2011).
read.phyDat
en phangorn (Schliep 2011) o la función read.dna
en ape (Paradis and Schliep 2018). Luego se calculan las matrices de distancia para los modelos de evolución específicos utilizando la función dist.ml
en phangorn (Schliep 2011) o
dist.dna
en ape (Paradis and Schliep 2018). Con base en las matrices de distancia, se reconstruye una red dividida utilizando la función neighborNet
en phangorn (Schliep 2011).
Opcional: las longitudes de las ramas pueden ser estimadas utilizando la función splitsNetworks
en phangorn (Schliep 2011).Podemos graficar una red con las siguientes opciones por defecto:
p <- ggsplitnet(Nnet) + geom_tiplab2()
p
Luego podemos establecer los límites para los ejes x & y permitiendo la lectura de los nombres de los ejes.
p <- p + xlim(-0.019, .003) + ylim(-.01, .012)
p
Es posible renombrar las puntas. Aquí cambiamos los nombres por un consecutivo de 1 a 15:
Nnet$translate$label <- seq_along(Nnet$tip.label)
Podemos incluir los nombres de las puntas con geom_tiplab2
, y con esto personalizar algunas de sus opciones. Por ejemplo, las puntas de color azul, en negrilla e itálicas; también los nodos internos en verde:
ggsplitnet(Nnet) + geom_tiplab2(col = "blue", font = 4, hjust = -0.15) +
geom_nodepoint(col = "green", size = 0.25)
Los nodos pueden ser anotados con geom_point
.
ggsplitnet(Nnet) + geom_point(aes(shape = isTip, color = isTip), size = 2)
La función ggevonet
dibuja redes explícitas (árboles filogenéticos reticulados). Una adición reciente en ape (Paradis and Schliep 2018) permite importar árboles en un formato Newick extendido (Cardona, Rosselló, and Valiente 2008).
Importar una red explícita (ejemplo de Fig. 2 en Cardona et al. 2008):
z <- read.evonet(text = "((1,((2,(3,(4)Y#H1)g)e,(((Y#H1,5)h,6)f)X#H2)c)a,
((X#H2,7)d,8)b)r;")
Para graficar una red explícita:
ggevonet(z, layout = "rectangular") + geom_tiplab() + geom_nodelab()
p <- ggevonet(z, layout = "slanted") + geom_tiplab() + geom_nodelab()
p + geom_tiplab(size=3, color="purple")
p + geom_nodepoint(color="#b5e521", alpha=1/4, size=10)
Esta viñeta ilustra todas las funciones en el paquete tanggle para R. Aquí se proveen algunos ejemplos de como graficar redes implícitas y explícitas. La visualización de redes divididas toma (se sirve de / utiliza ???) la mayoría de las funciones compatibles con árboles no enraizados en ggtree. Las opciones de diseño para las redes explícitas son rectangular o slanted.
sessionInfo()
#> R version 4.3.0 RC (2023-04-13 r84269)
#> Platform: x86_64-pc-linux-gnu (64-bit)
#> Running under: Ubuntu 22.04.2 LTS
#>
#> Matrix products: default
#> BLAS: /home/biocbuild/bbs-3.17-bioc/R/lib/libRblas.so
#> LAPACK: /usr/lib/x86_64-linux-gnu/lapack/liblapack.so.3.10.0
#>
#> locale:
#> [1] LC_CTYPE=en_US.UTF-8 LC_NUMERIC=C
#> [3] LC_TIME=en_GB LC_COLLATE=C
#> [5] LC_MONETARY=en_US.UTF-8 LC_MESSAGES=en_US.UTF-8
#> [7] LC_PAPER=en_US.UTF-8 LC_NAME=C
#> [9] LC_ADDRESS=C LC_TELEPHONE=C
#> [11] LC_MEASUREMENT=en_US.UTF-8 LC_IDENTIFICATION=C
#>
#> time zone: America/New_York
#> tzcode source: system (glibc)
#>
#> attached base packages:
#> [1] stats graphics grDevices utils datasets methods base
#>
#> other attached packages:
#> [1] phangorn_2.11.1 ape_5.7-1 tanggle_1.6.0 ggtree_3.8.0
#> [5] ggplot2_3.4.2 BiocStyle_2.28.0
#>
#> loaded via a namespace (and not attached):
#> [1] yulab.utils_0.0.6 sass_0.4.5 utf8_1.2.3
#> [4] generics_0.1.3 tidyr_1.3.0 ggplotify_0.1.0
#> [7] lattice_0.21-8 digest_0.6.31 magrittr_2.0.3
#> [10] evaluate_0.20 grid_4.3.0 bookdown_0.33
#> [13] fastmap_1.1.1 Matrix_1.5-4 jsonlite_1.8.4
#> [16] BiocManager_1.30.20 purrr_1.0.1 fansi_1.0.4
#> [19] aplot_0.1.10 scales_1.2.1 codetools_0.2-19
#> [22] lazyeval_0.2.2 jquerylib_0.1.4 cli_3.6.1
#> [25] rlang_1.1.0 munsell_0.5.0 tidytree_0.4.2
#> [28] withr_2.5.0 cachem_1.0.7 yaml_2.3.7
#> [31] tools_4.3.0 parallel_4.3.0 dplyr_1.1.2
#> [34] colorspace_2.1-0 fastmatch_1.1-3 vctrs_0.6.2
#> [37] R6_2.5.1 gridGraphics_0.5-1 magick_2.7.4
#> [40] lifecycle_1.0.3 ggfun_0.0.9 treeio_1.24.0
#> [43] pkgconfig_2.0.3 pillar_1.9.0 bslib_0.4.2
#> [46] gtable_0.3.3 glue_1.6.2 Rcpp_1.0.10
#> [49] highr_0.10 xfun_0.39 tibble_3.2.1
#> [52] tidyselect_1.2.0 knitr_1.42 farver_2.1.1
#> [55] igraph_1.4.2 htmltools_0.5.5 nlme_3.1-162
#> [58] patchwork_1.1.2 labeling_0.4.2 rmarkdown_2.21
#> [61] compiler_4.3.0 quadprog_1.5-8
Bryant, David, and Vincent Moulton. 2004. “Neighbor-Net: An Agglomerative Method for the Construction of Phylogenetic Networks.” Molecular Biology and Evolution 21 (2): 255–65. https://doi.org/10.1093/molbev/msh018.
Cardona, Gabriel, Francesc Rosselló, and Gabriel Valiente. 2008. “Extended Newick: It Is Time for a Standard Representation of Phylogenetic Networks.” BMC Bioinformatics 9 (1): 532. https://doi.org/10.1186/1471-2105-9-532.
Holland, Barbara R., Katharina T. Huber, Vincent Moulton, and Peter J. Lockhart. 2004. “Using Consensus Networks to Visualize Contradictory Evidence for Species Phylogeny.” Molecular Biology and Evolution 21 (7): 1459–61. https://doi.org/10.1093/molbev/msh145.
Huson, D. H., and D. Bryant. 2006. “Application of Phylogenetic Networks in Evolutionary Studies.” Molecular Biology and Evolution 23 (2): 254–67.
Paradis, Emmanuel, and Klaus Schliep. 2018. “Ape 5.0: An Environment for Modern Phylogenetics and Evolutionary Analyses in R.” Bioinformatics 35 (3): 526–28.
Schliep, Klaus Peter. 2011. “Phangorn: Phylogenetic Analysis in R.” Bioinformatics 27 (4): 592–93. https://doi.org/10.1093/bioinformatics/btq706.
Stamatakis, A. 2014. “raXml Version 8: A Tool for Phylogenetic Analysis and Post-Analysis of Large Phylogenies.” Bioinformatics 30 (9): 1312–3.
Wickham, Hadley. 2016. Ggplot2: Elegant Graphics for Data Analysis. Springer-Verlag New York. https://ggplot2.tidyverse.org.
Yu, Guangchuang, David Smith, Huachen Zhu, Yi Guan, and Tommy Tsan-Yuk Lam. 2017. “Ggtree: An R Package for Visualization and Annotation of Phylogenetic Trees with Their Covariates and Other Associated Data.” Methods in Ecology and Evolution 8 (1): 28–36. https://doi.org/10.1111/2041-210X.12628.