### R code from vignette source 'GOexpress-UsersGuide.Rnw' ### Encoding: UTF-8 ################################################### ### code chunk number 1: style-Sweave ################################################### BiocStyle::latex() ################################################### ### code chunk number 2: GOexpress-UsersGuide.Rnw:24-25 ################################################### options(useFancyQuotes="UTF-8") ################################################### ### code chunk number 3: GOexpress-UsersGuide.Rnw:104-106 (eval = FALSE) ################################################### ## source("http://bioconductor.org/biocLite.R") ## biocLite("GOexpress") ################################################### ### code chunk number 4: GOexpress-UsersGuide.Rnw:117-118 ################################################### maintainer("GOexpress") ################################################### ### code chunk number 5: GOexpress-UsersGuide.Rnw:149-150 ################################################### citation(package="GOexpress") ################################################### ### code chunk number 6: GOexpress-UsersGuide.Rnw:205-207 ################################################### library(GOexpress) # load the GOexpress package data(AlvMac) # import the training dataset ################################################### ### code chunk number 7: GOexpress-UsersGuide.Rnw:214-216 ################################################### exprs(AlvMac)[1:5,1:5] # Subset of the expression data head(pData(AlvMac)) # Subset of the phenotypic information ################################################### ### code chunk number 8: GOexpress-UsersGuide.Rnw:227-228 ################################################### head(rownames(exprs(AlvMac))) # Subset of gene identifiers ################################################### ### code chunk number 9: GOexpress-UsersGuide.Rnw:250-252 ################################################### is.factor(AlvMac$Treatment) # assertion test AlvMac$Treatment # visual inspection ################################################### ### code chunk number 10: GOexpress-UsersGuide.Rnw:262-263 (eval = FALSE) ################################################### ## AlvMac$Treatment <- factor(AlvMac$Treatment) ################################################### ### code chunk number 11: GOexpress-UsersGuide.Rnw:285-289 ################################################### set.seed(4543) # set random seed for reproducibility AlvMac_results <- GO_analyse( eSet = AlvMac, f = "Treatment", GO_genes=AlvMac_GOgenes, all_GO=AlvMac_allGO, all_genes=AlvMac_allgenes) ################################################### ### code chunk number 12: GOexpress-UsersGuide.Rnw:301-305 ################################################### names(AlvMac_results) # Data slot names head(AlvMac_results$GO[, c(1:5, 7)], n=5) # Ranked table of GO terms (subset) head(AlvMac_results$genes[, c(1:3)], n=5) # Ranked table of genes (subset) head(AlvMac_results$mapping) # Gene to gene ontology mapping table (subset) ################################################### ### code chunk number 13: GOexpress-UsersGuide.Rnw:329-330 (eval = FALSE) ################################################### ## AlvMac_results <- GO_analyse(eSet = AlvMac, f = "Treatment") ################################################### ### code chunk number 14: GOexpress-UsersGuide.Rnw:349-350 (eval = FALSE) ################################################### ## data(microarray2dataset) ################################################### ### code chunk number 15: GOexpress-UsersGuide.Rnw:365-366 (eval = FALSE) ################################################### ## AlvMac_results.pVal = pValue_GO(result=AlvMac_results, N=100) ################################################### ### code chunk number 16: GOexpress-UsersGuide.Rnw:369-370 ################################################### data(AlvMac_results.pVal) ################################################### ### code chunk number 17: GOexpress-UsersGuide.Rnw:423-438 ################################################### BP.5 <- subset_scores( result = AlvMac_results.pVal, namespace = "biological_process", total = 5, # requires 5 or more associated genes p.val=0.05) MF.10 <- subset_scores( result = AlvMac_results.pVal, namespace = "molecular_function", total = 10, p.val=0.05) CC.15 <- subset_scores( result = AlvMac_results.pVal, namespace = "cellular_component", total = 15, p.val=0.05) ################################################### ### code chunk number 18: GOexpress-UsersGuide.Rnw:472-476 (eval = FALSE) ################################################### ## subset( ## AlvMac_results.pVal$GO, ## total_count >= 5 & p.val<0.05 & namespace_1003=='biological_process' ## ) ################################################### ### code chunk number 19: GOexpress-UsersGuide.Rnw:498-499 ################################################### head(BP.5$GO) ################################################### ### code chunk number 20: GOexpress-UsersGuide.Rnw:513-516 ################################################### heatmap_GO( go_id = "GO:0034142", result = BP.5, eSet=AlvMac, cexRow=0.4, cexCol=1, cex.main=1, main.Lsplit=30) ################################################### ### code chunk number 21: GOexpress-UsersGuide.Rnw:528-532 ################################################### heatmap_GO( go_id = "GO:0034142", result = BP.5, eSet=AlvMac, cexRow=0.4, cexCol=1, cex.main=1, main.Lsplit=30, labRow=AlvMac$Group) ################################################### ### code chunk number 22: GOexpress-UsersGuide.Rnw:540-544 ################################################### heatmap_GO( go_id = "GO:0034142", result = BP.5, eSet=AlvMac, cexRow=0.6, cexCol=1, cex.main=1, main.Lsplit=30, labRow='Group', subset=list(Time=c('24H','48H'))) ################################################### ### code chunk number 23: GOexpress-UsersGuide.Rnw:556-560 ################################################### cluster_GO( go_id = "GO:0034142", result = BP.5, eSet=AlvMac, cex.main=1, cex=0.6, main.Lsplit=30, subset=list(Time=c("24H", "48H")), f="Group") ################################################### ### code chunk number 24: GOexpress-UsersGuide.Rnw:576-577 ################################################### table_genes(go_id = "GO:0034142", result = BP.5)[,c(1:3)] ################################################### ### code chunk number 25: GOexpress-UsersGuide.Rnw:595-596 ################################################### list_genes(go_id = "GO:0034142", result = BP.5) ################################################### ### code chunk number 26: GOexpress-UsersGuide.Rnw:617-621 ################################################### expression_plot( gene_id = "ENSBTAG00000047107", result = BP.5, eSet=AlvMac, x_var = "Timepoint", title.size=1.5, legend.title.size=10, legend.text.size=10, legend.key.size=15) ################################################### ### code chunk number 27: GOexpress-UsersGuide.Rnw:645-649 ################################################### expression_plot( gene_id = "ENSBTAG00000047107", result = BP.5, eSet=AlvMac, x_var = "Animal", title.size=1.5, axis.text.angle=90, legend.title.size=10, legend.text.size=10, legend.key.size=15) ################################################### ### code chunk number 28: GOexpress-UsersGuide.Rnw:660-664 (eval = FALSE) ################################################### ## expression_plot_symbol( ## gene_symbol = "BIKBA", result = BP.5, eSet=AlvMac, ## x_var = "Timepoint", title.size=1.5, ## legend.title.size=10, legend.text.size=10, legend.key.size=15) ################################################### ### code chunk number 29: GOexpress-UsersGuide.Rnw:679-683 ################################################### expression_plot_symbol( gene_symbol = "RPL36A", result = AlvMac_results, eSet=AlvMac, x_var = "Timepoint", title.size=1.5, legend.title.size=10, legend.text.size=10, legend.key.size=15) ################################################### ### code chunk number 30: GOexpress-UsersGuide.Rnw:708-715 ################################################### AlvMac$Animal.Treatment <- paste(AlvMac$Animal, AlvMac$Treatment, sep="_") expression_profiles( gene_id = "ENSBTAG00000047107", result = AlvMac_results, eSet=AlvMac, x_var = "Timepoint", line.size=1, seriesF="Animal.Treatment", linetypeF="Animal", legend.title.size=10, legend.text.size=10, legend.key.size=15) ################################################### ### code chunk number 31: GOexpress-UsersGuide.Rnw:730-737 (eval = FALSE) ################################################### ## expression_profiles( ## gene_id = "ENSBTAG00000047107", result = AlvMac_results, ## eSet=AlvMac, x_var = "Timepoint", ## lty=rep(1,10), # use line-type 1 for all 10 groups ## seriesF="Animal.Treatment", linetypeF="Animal", ## legend.title.size=10, legend.text.size=10, ## legend.key.size=15, line.size=1) ################################################### ### code chunk number 32: GOexpress-UsersGuide.Rnw:747-753 (eval = FALSE) ################################################### ## expression_profiles_symbol( ## gene_symbol="TNIP3", result = AlvMac_results, ## x_var = "Timepoint", linetypeF="Animal", line.size=1, ## eSet=AlvMac, lty=rep(1,10), seriesF="Animal.Treatment", ## title.size=1.5, legend.title.size=10, legend.text.size=10, ## legend.key.size=15) ################################################### ### code chunk number 33: GOexpress-UsersGuide.Rnw:771-775 ################################################### plot_design( go_id = "GO:0034134", result = BP.5, eSet=AlvMac, ask = FALSE, factors = c("Animal", "Treatment", "Time", "Group"), main.Lsplit=30) ################################################### ### code chunk number 34: GOexpress-UsersGuide.Rnw:824-852 (eval = FALSE) ################################################### ## # Load the interface to BioMart databases ## library(biomaRt) ## # See available resources in Ensembl release 75 ## listMarts(host='feb2014.archive.ensembl.org') ## # Connect to the Ensembl Genes annotation release 75 for Bos taurus ## ensembl75 = useMart( ## host='feb2014.archive.ensembl.org', ## biomart='ENSEMBL_MART_ENSEMBL', dataset='btaurus_gene_ensembl') ## ## Download all the Ensembl gene annotations (no filtering) ## allgenes.Ensembl = getBM( ## attributes=c('ensembl_gene_id', 'external_gene_id', 'description'), ## mart=ensembl75) ## # Rename the gene identifier column to 'gene_id' ## # This allows GOexpress to treat microarray and RNA-seq data identically ## colnames(allgenes.Ensembl)[1] = 'gene_id' ## ## Download all the gene ontology annotations (no filtering) ## allGO.Ensembl = getBM( ## attributes=c('go_id', 'name_1006', 'namespace_1003'), ## mart=ensembl75) ## ## Download all the mapping between gene and gene ontology identifiers ## GOgenes.Ensembl = getBM( ## attributes=c('ensembl_gene_id', 'go_id'), ## mart=ensembl75) ## # Rename the gene identifier column to 'gene_id' ## colnames(GOgenes.Ensembl)[1] = 'gene_id' ## # Cleanup: remove some blank fields often found in both columns ## GOgenes.Ensembl = GOgenes.Ensembl[GOgenes.Ensembl$go_id != '',] ## GOgenes.Ensembl = GOgenes.Ensembl[GOgenes.Ensembl$gene_id != '',] ################################################### ### code chunk number 35: GOexpress-UsersGuide.Rnw:869-879 (eval = FALSE) ################################################### ## # save each custom annotation to a R data file ## save(GOgenes.Ensembl, file='GOgenes.Ensembl75.rda') ## save(allGO.Ensembl, file='allGO.Ensembl75.rda') ## save(allgenes.Ensembl, file='allgenes.Ensembl75.rda') ## # Run an analysis using those local annotations ## GO_analyse( ## eSet=AlvMac, f='Treatment', ## GO_genes=GOgenes.Ensembl, ## all_GO=allGO.Ensembl, ## all_genes=allgenes.Ensembl) ################################################### ### code chunk number 36: GOexpress-UsersGuide.Rnw:887-890 (eval = FALSE) ################################################### ## data(AlvMac_GOgenes) ## data(AlvMac_allGO) ## data(AlvMac_allgenes) ################################################### ### code chunk number 37: GOexpress-UsersGuide.Rnw:922-935 (eval = FALSE) ################################################### ## AlvMac_results <- GO_analyse( ## eSet = AlvMac, f = "Treatment", ## subset=list( ## Time=c("6H","24H", "48H"), ## Treatment=c("CN","MB")) ## ) ## ## expression_plot( ## gene_id = "ENSBTAG00000047107", result = BP.5, eSet=AlvMac, ## x_var = "Timepoint", title.size=1.5, ## legend.title.size=10, legend.text.size=10, legend.key.size=15, ## subset=list(Treatment=c("TB","MB")) ## ) ################################################### ### code chunk number 38: GOexpress-UsersGuide.Rnw:956-957 ################################################### overlap_GO(go_ids = head(BP.5$GO$go_id, n=5), result = BP.5, filename=NULL) ################################################### ### code chunk number 39: GOexpress-UsersGuide.Rnw:975-976 ################################################### hist_scores(result = BP.5, labels = TRUE) ################################################### ### code chunk number 40: GOexpress-UsersGuide.Rnw:983-984 ################################################### quantiles_scores(result = BP.5) ################################################### ### code chunk number 41: GOexpress-UsersGuide.Rnw:1003-1004 (eval = FALSE) ################################################### ## BP.5.byScore <- rerank(result = BP.5, rank.by = "score") ################################################### ### code chunk number 42: GOexpress-UsersGuide.Rnw:1013-1014 (eval = FALSE) ################################################### ## BP.5.byPval <- rerank(result = BP.5, rank.by = "p.val") ################################################### ### code chunk number 43: GOexpress-UsersGuide.Rnw:1023-1025 (eval = FALSE) ################################################### ## BP.5.pVal_rank <- rerank(result = BP.5, rank.by = "rank") ## BP.5.pVal_rank <- rerank(result = BP.5.pVal_rank, rank.by = "p.val") ################################################### ### code chunk number 44: GOexpress-UsersGuide.Rnw:1046-1047 ################################################### pData(AlvMac) <- droplevels(pData(AlvMac)) ################################################### ### code chunk number 45: GOexpress-UsersGuide.Rnw:1063-1067 (eval = FALSE) ################################################### ## subEset( ## eSet=AlvMac, subset=list( ## Time=c("2H","6H","24H"), ## Treatment=c("CN","MB"))) ################################################### ### code chunk number 46: GOexpress-UsersGuide.Rnw:1223-1224 ################################################### sessionInfo()