RNA-seq数据之差异基因分析¶

R Packages for DGE¶

limma edgeR DESeq clusterProfiler

Bioconductor¶

http://www.bioconductor.org/

数据预处理¶

library(edgeR)
options(stringsAsFactors = F)
library(airway)#气道平滑肌细胞RNA—seq
help(airway)#数据包中的help信息可以提供很多有用的信息，如参数意思
data("airway")
#获取基因counts矩阵
expr<-assay(airway)
?assay
expr[1:5,1:5]
#获取分组信息
group_list<-colData(airway)$dex
group_list

Loading required package: limma


Attaching package: 'limma'


The following object is masked from 'package:BiocGenerics':

    plotMA


Loading required package: SummarizedExperiment

Loading required package: GenomicRanges

Loading required package: GenomeInfoDb

Warning message:
"package 'GenomeInfoDb' was built under R version 3.6.3"
Loading required package: DelayedArray

Warning message:
"package 'DelayedArray' was built under R version 3.6.3"
Loading required package: matrixStats

Warning message:
"package 'matrixStats' was built under R version 3.6.3"

Attaching package: 'matrixStats'


The following objects are masked from 'package:Biobase':

    anyMissing, rowMedians


Loading required package: BiocParallel


Attaching package: 'DelayedArray'


The following objects are masked from 'package:matrixStats':

    colMaxs, colMins, colRanges, rowMaxs, rowMins, rowRanges


The following object is masked from 'package:clusterProfiler':

    simplify


The following objects are masked from 'package:base':

    aperm, apply, rowsum

注释基因¶

library(clusterProfiler)#Y叔开发的包（重点介绍）ID转换
library(org.Hs.eg.db)#人类基因组注释包
keytypes(org.Hs.eg.db)#查看支持ID的转换类型
#转换ID
geneid<-bitr(rownames(expr),fromType = "ENSEMBL",toType = "SYMBOL",
             OrgDb = "org.Hs.eg.db",drop=T)#去除空值
geneid
head(geneid)

'select()' returned 1:many mapping between keys and columns

Warning message in bitr(rownames(expr), fromType = "ENSEMBL", toType = "SYMBOL", :
"59.46% of input gene IDs are fail to map..."

#注释ID
expr<-expr[rownames(expr)%in%geneid[,1],]
dim(expr)
geneid<-geneid[match(rownames(expr),geneid[,1]),]
rownames(expr)<-geneid$SYMBOL
head(expr)
expr[1:5,1:5]

#去重（chong）
table(duplicated(rownames(expr)))#统计重复基因数目
dim(expr)
#对重复基因名取平均表达量
if(sum(duplicated(rownames(expr)))>0)#判断是否重复
  expr1<-avereps(expr,ID=rownames(expr))
dim(expr1)

FALSE  TRUE 
24811  1177

#过滤低表达基因
apply(expr1,2,fivenum)#查看样本表达基因
apply(expr1,2,function(x)sum(x>1))
#过滤方法1---自定义
expr2<-expr1[apply(expr1,1,function(x) sum(x>1)>1),]
dim(expr2)
save(group_list,expr2,file="expr.Rdata")

#过滤方法2
x<-edgeR::DGEList(counts=expr1)#构建DGEList
dim(x)
keep.exprs<-edgeR::filterByExpr(x,group=group_list)#判断基因是否低表达
x<-x[keep.exprs,,keep.lib.sizes=F]
dim(x)
head(keep.exprs)
dim(x)

#可视化过滤方法2中数据
library(RColorBrewer)
x<-edgeR::DGEList(counts=expr1,group=factor(group_list))
dim(x)
L<-mean(x$samples$lib.size)/10^6
M<-median(x$samples$lib.size)/10^6
lcpm<-cpm(x,log=T,prior.count = 2)#log2(CPM+2/L)
head(lcpm)
dim(x)
lcpm.cutoff<-log2(10/M+2/L)#过滤阈值
nsamples<-ncol(x)#提取样本数
col<-brewer.pal(nsamples,"Paired")#颜色
par(mfrow=c(1,2))
#过滤前图形
plot(density(lcpm[,1]),col=col[1],lwd=2,ylim=c(0,0.26),las=2,main="",
     xlab="")
abline(v=lcpm.cutoff,lty=5)#阈值线
for(i in 2:nsamples){
  den<-density(lcpm[,i])
  lines(den$x,den$y,col=col[i],lwd=2)
}
title(main="A.Raw data",xlab="log-cpm")
legend("topright",colnames(x),text.col=col,bty="n",cex=0.5)
#过滤后图形
keep.exprs<-edgeR::filterByExpr(x,group=group_list)
x<-x[keep.exprs,,keep.lib.sizes=F]#过滤
dim(x)
Lcpm<-cpm(x,log=T,prior.count = 2)
head(Lcpm)
plot(density(Lcpm[,1]),col=col[1],lwd=2,ylim=c(0,0.26),las=2,main="",
     xlab="")
abline(v=lcpm.cutoff,lty=5)#阈值线
for(i in 2:nsamples){
  den<-density(Lcpm[,i])
  lines(den$x,den$y,col=col[i],lwd=2)
}
title(main="B.Filter data",xlab="log-cpm")
legend("topright",colnames(x),text.col=col,bty="n",cex=0.5)

#无监督聚类MDS图
par(mfrow=c(1,1))
lcpm<-cpm(x,log=T)
col.group<-group_list
levels(col.group)<-brewer.pal(nlevels(col.group),"Set1")

col.group<-as.character(col.group)
plotMDS(lcpm,col=col.group,labels=group_list)

Warning message in brewer.pal(nlevels(col.group), "Set1"):
"minimal value for n is 3, returning requested palette with 3 different levels
"

差异性分析(Limma)¶

library(limma)
options(stringsAsFactors = F)
load("expr.RData")#过滤方法1下的基因表达矩阵
data<-expr2
dim(data)

# 分组矩阵
group_list = factor(group_list)
design <- model.matrix(~0+group_list)
rownames(design) = colnames(data)
colnames(design) <- levels(group_list)

# 差异比较矩阵
cont.matrix <- makeContrasts(contrasts = c('trt-untrt'), 
                             levels = design)

#建模前归一化
#方法一：通过箱线图查看数据整齐与否后决定是否归一化
library(RColorBrewer)
dge <- DGEList(counts = data)
col <- brewer.pal(ncol(dge$counts), "Paired")
par(mfrow=c(2,2))
boxplot(dge$counts,outline=F, col=col)
title(main="A. Unnormalised ",ylab="raw count")
boxplot(calcNormFactors(dge, method = "TMM")$counts,outline=F,col=col)
title(main="B. TMM ",ylab="raw count")
boxplot(cpm(dge$counts),outline=F, col=col)
title(main="C. CPM ",ylab="cpm")
boxplot(cpm(dge$counts,log=TRUE),outline=F, col=col)
title(main="D. Log-CPM ",ylab="log-cpm")

结论¶

从上面的图形可看出log-cpm归一化效果最好,若直接用log-cpm化效果不佳,可先通过TMM标准化在进行log-cpm化.

#方法2：用limma包中的voom进行进行归一化
dge <- DGEList(counts = data)
dge <- calcNormFactors(dge)
v <- voom(dge, design, plot=T) #会自动计算log(cpm)值

voom图：显示一个均值与方差之间递减的趋势,生物差异高的实验通常会到更平坦的趋势,其方差在高表达处稳定；生物差异低的实验很可能会急剧下降的趋势.

#建模---使用的为voom归一化后的数据
#拟合线性模型
fit<-lmFit(v,design)
#针对给定的对比计算估计系数以及标准误差
fit2<-contrasts.fit(fit,cont.matrix)
#计算t,F,差异表达倍数的对数
fit2<-eBayes(fit2)
plotSA(fit2)

#提取差异基因方法1
#用decideTests
#查看差异基因数目
summary(decideTests(fit2,lfc=1,p.value = 0.05))
#提取
allDEG<-topTable(fit2,coef="trt-untrt",n=Inf)
allDEG<-na.omit(allDEG)
dt<-decideTests(fit2)
summary(dt)
de.common<-which(dt[,1]!=0)
diff<-allDEG[de.common,]
head(dt)
dim(diff)

       trt-untrt
Down         317
NotSig     16117
Up           343

       trt-untrt
Down         811
NotSig     14965
Up          1001

基因集获取：http://bioinf.wehi.edu.au/software/MSigDB/

##检查
#将基因按照校正p值从小到大排列输出所有结果
df <- topTreat(fit2, coef=1, n=Inf) 
head(df)
#基因集检验
library(clusterProfiler)
library(org.Hs.eg.db)
load("human_c2_v5p2.rdata")
#使用voom归一化的数据
geneid<-bitr(rownames(v), fromType='SYMBOL', toType='ENTREZID',
             OrgDb='org.Hs.eg.db', drop = TRUE) 
idx <- ids2indices(Hs.c2,id=geneid$ENTREZID) #匹配基因集
cam<- camera(v,idx,design,contrast=cont.matrix)   
head(idx,3)
head(cam)

'select()' returned 1:many mapping between keys and columns

getwd()

#提取2 自定义阈值
allDEG <- topTable(fit2, coef = 'trt-untrt', n = Inf)
allDEG <- na.omit(allDEG)
padj = 0.05
foldChange= 1
diff_signif = allDEG[(allDEG$adj.P.Val < padj & abs(allDEG$logFC)>foldChange),]                    
diff_signif = diff_signif[order(diff_signif$logFC),]
save(diff_signif, file = 'limma_diff.Rdata')
dim(diff_signif)
head(diff_signif)
a<-diff_signif

数据可视化分析之火山图&热图&富集图¶

#火山图
load(file="limma_diff.Rdata")
library(ggplot2)
diff_signif[which(diff_signif$P.Value<0.05&
              diff_signif$logFC>=2),"diff"]<-"up"
diff_signif[which(diff_signif$P.Value<0.05&
                 diff_signif$logFC<=-2),"diff"]<-"down"
diff_signif[!(diff_signif$diff %in% c("up","down")),"diff"]<-"no"
p1<-ggplot(diff_signif,aes(x=-logFC,y=-log10(P.Value)))+
  geom_point(aes(col=diff),size=1.5)+
  scale_color_manual(limits=c("up","down","no"),
 values=c("blue","red","gray40"),labels=c("enouts","douts","nouts"))
p1

基因表达量热图¶

#allsample_top100sd_count_heatmap
load("expr.Rdata")
library(pheatmap)
head(expr2)
cg<-names(tail(apply(expr2,1,sd),100))#取表达量标准差前100的行名
head(cg)
pheatmap(expr2[cg,])

#中心化、标准化allsample_top100sd_cutree1.pheatmap
table(group_list)
n<-t(scale(t(expr2[cg,])))
n[1:3,1:3]
n[n>2]=2
n[n<-2]=-2
ac<-data.frame(group_list)
#判断ac的行数是否等于n的列数
dim(ac)
dim(n)
rownames(ac)<-colnames(n)
pheatmap(n,show_rownames = F,show_colnames = F,annotation_col = ac)

group_list
  trt untrt 
    4     4

#对表达量标准差前100的基因信息进行聚类
hc<-hclust(dist(t(n)))
plot(hc)

#剪枝
c<-cutree(hc,2)
group_list1<-as.factor(c)#转换成因子
table(group_list1)#统计样本分组信息
table(group_list1,group_list)#得到混淆矩阵
ac1<-data.frame(g=group_list1)
rownames(ac1)<-colnames(n)
pheatmap(n,show_rownames = F,show_colnames = T,annotation_col = ac1)

group_list1
1 2 
5 3

           group_list
group_list1 trt untrt
          1   1     4
          2   3     0

富集分析¶

基因富集分析是分析基因表达信息的一种方法，富集是指将基因按照先验知识，也就是基因组注释信息进行分类。人类有约30,000个基因，总碱基对的数量约32亿。目前约有3.2亿可能的碱基对变异情况，而每两个人之间的差异约为2千万个碱基对，也就是总碱基对的0.6%。换句话说，人与人之间的基因序列相似度高达99%以上。这些细微的差别，导致了我们长得不同，性格也不同。那么怎么更好的理解这些不同呢？可以按照功能、通路等性质将基因做划分，这也是基因富集分析的重要作用之一。

作者：师师链接：https://www.zhihu.com/question/30778984/answer/91262467 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

#富集图
library(clusterProfiler)#用来富集分析的包

load("limma_diff.Rdata")
dim(diff_signif)
library(clusterProfiler)
library(org.Hs.eg.db)
library(topGO)
library(pathview)
c<-diff_signif
#将gene symbol 转换成行名
c$SYMBOL<-rownames(c)
head(c)
rownames(c)<-1:660
head(c)
class(c$SYMBOL)

bitr功能为ID转换¶

bitr(geneID, fromType, toType, OrgDb, drop = TRUE)； geneid ：基因ID输入； fromtype ：输入ID型；toType：输出ID型；orgdb ：注释数据库）

#数据转换
test1 = bitr(unique(c$SYMBOL), fromType="SYMBOL", 
             toType= "ENTREZID", OrgDb="org.Hs.eg.db")
head(test1)
dim(test1)

'select()' returned 1:1 mapping between keys and columns

GO dataset Analysis¶

GO数据库总共有三大类，分别是生物学过程(Biological Process,BP)、细胞定位(Cellular Component,CC)、分子功能(Molecular Function,MF),各自描述了基因产物可能行使的分子功能，所处的细胞环境，以及参与的生物学过程.GO数据库中一个基本的概念是节点,比如"Cell"、"Fibroblast Growth Factor Receptor Binding"或者"Signal Transduction",同时有一个唯一的编号,如"GO:nnnnnnnn ".基于鉴定到的蛋白ID,采用mapping（比对)的方式从Uniprot数据库中得到蛋白质的GO数据库注释信息,对蛋白质进行功能分类注释.

#GO分析
#groupGO富集分析
ggo <- groupGO(gene = test1$ENTREZID, OrgDb = org.Hs.eg.db, 
               ont = "CC",level = 3,readable = TRUE)
head(ggo)

Loading required package: DOSE

DOSE v3.12.0  For help: https://guangchuangyu.github.io/software/DOSE

If you use DOSE in published research, please cite:
Guangchuang Yu, Li-Gen Wang, Guang-Rong Yan, Qing-Yu He. DOSE: an R/Bioconductor package for Disease Ontology Semantic and Enrichment analysis. Bioinformatics 2015, 31(4):608-609

#enrichGO富集分析
ego_ALL <- enrichGO(gene = test1$ENTREZID, 
                    OrgDb = org.Hs.eg.db, 
                    ont = "ALL", 
                    pAdjustMethod = "BH", 
                    pvalueCutoff = 1, 
                    qvalueCutoff = 1,
                    readable = T)
head(ego_ALL,2)

#setReadble函数进行转换
ego_MF <- enrichGO(gene = test1$ENTREZID, 
                    OrgDb = org.Hs.eg.db,ont = "MF", 
                   pAdjustMethod = "BH",pvalueCutoff = 1,
                   qvalueCutoff = 1,readable = FALSE)#ont可以选择"All","MF","BP","CC"
ego_MF1 <- setReadable(ego_MF, OrgDb = org.Hs.eg.db)
head(ego_MF,2)

GO levels 分类统计图¶

#可视化--点图
dotplot(ego_MF,title="EnrichmentGO_MF_dot")#点图，按富集的数从大到小的

#条状图，按p从小到大排，绘制前20个Term
barplot(ego_MF, showCategory=20,title="EnrichmentGO_MF")

plotGOgraph(ego_MF)#差异表达蛋白的topGO分子功能有向无环图

groupGOTerms: 	GOBPTerm, GOMFTerm, GOCCTerm environments built.


Building most specific GOs .....

	( 1129 GO terms found. )


Build GO DAG topology ..........

	( 1129 GO terms and 1465 relations. )


Annotating nodes ...............

	( 17697 genes annotated to the GO terms. )

Loading required package: Rgraphviz

Loading required package: grid


Attaching package: 'grid'


The following object is masked from 'package:topGO':

    depth


Attaching package: 'Rgraphviz'


The following objects are masked from 'package:IRanges':

    from, to


The following objects are masked from 'package:S4Vectors':

    from, to

$dag
A graphNEL graph with directed edges
Number of Nodes = 22 
Number of Edges = 24 

$complete.dag
[1] "A graph with 22 nodes."

#KEGG分析
#候选基因进行通路分析
k<-enrichKEGG(gene=test1$ENTREZID,organism = 'hsa',
              pvalueCutoff = 1)
head(k,2)

#KEGG气泡图
dotplot(k,title="enrich keggdotplot")

#pathview通路可视化
library(pathview)
pathview(test1$ENTREZID,pathway.id = "04933",species = "hsa")

参考文献链接 https://zhuanlan.zhihu.com/p/35510434 https://www.jianshu.com/p/47b5ea646932 https://www.jianshu.com/p/1f820f43b775

细化富集分析处理过程¶

读取差异基因表达矩阵
设定阈值计算基因上调下调数量
ID转换
得出差异基因(得到排序的geneList)

#加载差异表达矩阵
load("limma_diff.Rdata")
head(diff_signif,3)
dim(diff_signif)

#设定阈值计算基因上调下调数目
a=diff_signif
logFC_t=1.5
a$g<-ifelse(a$P.Value>0.05,'stable',ifelse( a$logFC > logFC_t,'UP',
                      ifelse(a$logFC < -logFC_t,'DOWN','stable')))
table(a$g)            
head(a)

  DOWN stable     UP 
   160    326    174

#将gene SYMBOL加入差异表达矩阵
a$symbol<-rownames(a)
head(a)
rownames(a)<-1:660
head(a)

#ID转换
library(ggplot2)
library(clusterProfiler)
library(org.Hs.eg.db)
df <- bitr(unique(a$symbol), fromType = "SYMBOL",
           toType = c( "ENTREZID"),
           OrgDb = org.Hs.eg.db)
dim(df)
head(df,2)

'select()' returned 1:1 mapping between keys and columns

#把数据DEG,df通过，DEG的'symbol'列，df的'SYMBOL'列连接在一起，转化ID
DEG<-a
DEG=merge(DEG,df,by.y='SYMBOL',by.x='symbol')
head(DEG)
save(DEG,file = 'anno_DEG.Rdata')

#得出差异基因
gene_up= DEG[DEG$g == 'UP','ENTREZID'] #选出上调基因ID
gene_down=DEG[DEG$g == 'DOWN','ENTREZID'] #选出下调基因ID
gene_diff=c(gene_up,gene_down)#得出上下调基因ID
gene_all=as.character(DEG[ ,'ENTREZID'] )#得出所有基因ID
head(gene_all,3)

#geneList
data(geneList, package="DOSE")#得出geneList数据
head(geneList,4)#查看

boxplot(geneList)
boxplot(DEG$logFC)

#得到排序后的geneList
geneList<-DEG$logFC#赋值
names(geneList)<-DEG$ENTREZID
geneList<-sort(geneList,decreasing = T)#从大到小排序
head(geneList)

KEGG pathway analysis¶

#KEGG
kk.up <- enrichKEGG(gene = gene_up,
                    organism = 'hsa',
                    universe= gene_all,
                    pvalueCutoff = 1,
                    qvalueCutoff =1)
head(kk.up,3)

dotplot(kk.up )

kk.down<- enrichKEGG(gene         = gene_down,
                    organism     = 'hsa',
                    universe     = gene_all,
                    pvalueCutoff = 1,
                    qvalueCutoff =1)
dotplot(kk.down )

kk.diff<-enrichKEGG(gene=gene_diff,organism = 'hsa',pvalueCutoff = 0.05)
dotplot(kk.diff)

kegg_diff_dt <- as.data.frame(kk.diff)
kegg_down_dt <- as.data.frame(kk.down)
kegg_up_dt <- as.data.frame(kk.up)
down_kegg<-kegg_down_dt[kegg_down_dt$pvalue<0.05,]
down_kegg$group=-1
up_kegg<-kegg_up_dt[kegg_up_dt$pvalue<0.05,]
up_kegg$group=1
b<-rbind(down_kegg,up_kegg)
head(b)

p<-ggplot(b,aes(x=GeneRatio,y=Description))+geom_point(aes(col=pvalue,size=Count))+
  facet_grid(~group)
p+scale_color_gradient2(low="navyblue",mid="blue",high="yellow")

head(kegg_diff_dt,3)
j<-ggplot(kegg_diff_dt,aes(x=GeneRatio,y=Description))+geom_point(aes(col=pvalue,size=Count))
j+scale_color_gradient2(low="navyblue",mid="blue",high="yellow")

GSEA¶

kk_gse <- gseKEGG(geneList     = geneList,
                    organism     = 'hsa',
                    pvalueCutoff = 1,
                    verbose      = FALSE)
  head(kk_gse)[,1:6]

gseaplot(kk_gse, geneSetID = rownames(kk_gse[1,]))

down_kegg<-kk_gse[kk_gse$pvalue<0.05 & kk_gse$enrichmentScore < 0,]
down_kegg$group=-1
  up_kegg<-kk_gse[kk_gse$pvalue<0.05 & kk_gse$enrichmentScore > 0,]
up_kegg$group=1
head(up_kegg)

h<-rbind(down_kegg,up_kegg)
m<-ggplot(h,aes(x=setSize,y=Description))+geom_point(aes(col=pvalue,size=enrichmentScore))+ facet_grid(~group)
m+scale_color_gradient2(low="navyblue",mid="blue",high="yellow")

详细可参考以下帖子 https://www.jianshu.com/p/5ca79763e07e http://www.lab-bj.com/index.php?r=service/detail&serviceid=11352

	SRR1039508	SRR1039509	SRR1039512	SRR1039513	SRR1039516
ENSG00000000003	679	448	873	408	1138
ENSG00000000005	0	0	0	0	0
ENSG00000000419	467	515	621	365	587
ENSG00000000457	260	211	263	164	245
ENSG00000000460	60	55	40	35	78

	ENSEMBL	SYMBOL
	<chr>	<chr>
1	ENSG00000000003	TSPAN6
2	ENSG00000000005	TNMD
3	ENSG00000000419	DPM1
4	ENSG00000000457	SCYL3
5	ENSG00000000460	C1orf112
6	ENSG00000000938	FGR
7	ENSG00000000971	CFH
8	ENSG00000001036	FUCA2
9	ENSG00000001084	GCLC
10	ENSG00000001167	NFYA
11	ENSG00000001460	STPG1
12	ENSG00000001461	NIPAL3
13	ENSG00000001497	LAS1L
14	ENSG00000001561	ENPP4
15	ENSG00000001617	SEMA3F
16	ENSG00000001626	CFTR
17	ENSG00000001629	ANKIB1
18	ENSG00000001630	CYP51A1
19	ENSG00000001631	KRIT1
20	ENSG00000002016	RAD52
22	ENSG00000002330	BAD
23	ENSG00000002549	LAP3
24	ENSG00000002586	CD99
25	ENSG00000002587	HS3ST1
26	ENSG00000002726	AOC1
27	ENSG00000002745	WNT16
28	ENSG00000002746	HECW1
29	ENSG00000002822	MAD1L1
30	ENSG00000002834	LASP1
31	ENSG00000002919	SNX11
...	...	...
63496	ENSG00000273032	DGCR5
63497	ENSG00000273033	LINC02035
63509	ENSG00000273045	C2orf15
63510	ENSG00000273046	HOXC5
63525	ENSG00000273061	CDC37L1-DT
63543	ENSG00000273079	GRIN2B
63549	ENSG00000273085	OR52E1
63550	ENSG00000273086	TAS2R9
63556	ENSG00000273092	TAS2R20
63575	ENSG00000273111	LYPD4
63589	ENSG00000273125	LINC01990
63593	ENSG00000273129	PACERR
63600	ENSG00000273136	NBPF26
63631	ENSG00000273167	SPATA13
63637	ENSG00000273173	SNURF
63677	ENSG00000273213	H3-2
63702	ENSG00000273238	TMEM271
63729	ENSG00000273265	CNNM3-DT
63738	ENSG00000273274	ZBTB8B
63758	ENSG00000273294	C1QTNF3-AMACR
63761	ENSG00000273297	LOC105375519
63775	ENSG00000273311	DGCR11
63777	ENSG00000273313	RBAKDN
63790	ENSG00000273326	TAS2R7
63808	ENSG00000273344	PAXIP1-AS1
63860	ENSG00000273396	LINC01396
63861	ENSG00000273397	NDUFA6
63873	ENSG00000273409	LINC02712
63895	ENSG00000273431	TAS2R50
63921	ENSG00000273457	TAS2R13

	ENSEMBL	SYMBOL
	<chr>	<chr>
1	ENSG00000000003	TSPAN6
2	ENSG00000000005	TNMD
3	ENSG00000000419	DPM1
4	ENSG00000000457	SCYL3
5	ENSG00000000460	C1orf112
6	ENSG00000000938	FGR

	SRR1039508	SRR1039509	SRR1039512	SRR1039513	SRR1039516	SRR1039517	SRR1039520	SRR1039521
TSPAN6	679	448	873	408	1138	1047	770	572
TNMD	0	0	0	0	0	0	0	0
DPM1	467	515	621	365	587	799	417	508
SCYL3	260	211	263	164	245	331	233	229
C1orf112	60	55	40	35	78	63	76	60
FGR	0	0	2	0	1	0	0	0

	SRR1039508	SRR1039509	SRR1039512	SRR1039513	SRR1039516
TSPAN6	679	448	873	408	1138
TNMD	0	0	0	0	0
DPM1	467	515	621	365	587
SCYL3	260	211	263	164	245
C1orf112	60	55	40	35	78

SRR1039508	SRR1039509	SRR1039512	SRR1039513	SRR1039516	SRR1039517	SRR1039520	SRR1039521
0	0	0	0	0	0	0	0
0	0	0	0	0	0	0	0
24	20	32	16	27	31	25	22
473	418	540	312	545	659	427	447
297906	255662	513766	273878	397791	401539	378834	372489

	SRR1039508	SRR1039509	SRR1039512	SRR1039513	SRR1039516	SRR1039517	SRR1039520	SRR1039521
TSPAN6	5.141473	4.672112	5.2001552	4.839259	5.638631	5.172082	5.420317	4.841827
TNMD	-3.367032	-3.367032	-3.3670321	-3.367032	-3.367032	-3.367032	-3.367032	-3.367032
DPM1	4.603281	4.872472	4.7103095	4.679162	4.686195	4.783291	4.538267	4.671255
SCYL3	3.762943	3.592004	3.4780315	3.531635	3.433178	3.519089	3.703294	3.528445
C1orf112	1.681397	1.684784	0.8293573	1.347256	1.809396	1.176655	2.109043	1.629866
FGR	-3.367032	-3.367032	-2.4665716	-3.367032	-2.830181	-3.367032	-3.367032	-3.367032

	SRR1039508	SRR1039509	SRR1039512	SRR1039513	SRR1039516	SRR1039517	SRR1039520	SRR1039521
TSPAN6	5.142449	4.673067	5.2011922	4.840105	5.639665	5.173012	5.421656	4.842878
DPM1	4.604257	4.873427	4.7113465	4.680008	4.687229	4.784222	4.539606	4.672305
SCYL3	3.763919	3.592959	3.4790684	3.532482	3.434212	3.520020	3.704632	3.529495
C1orf112	1.682374	1.685741	0.8303934	1.348108	1.810430	1.177589	2.110376	1.630916
CFH	7.398711	7.705985	8.0207753	8.217182	8.199507	8.566205	8.167782	8.643355
FUCA2	6.217918	5.915106	6.1885216	5.948053	5.962550	5.630760	6.239856	5.795687

	logFC	AveExpr	t	P.Value	adj.P.Val	B
	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>
SPARCL1	4.574965	4.254079	18.78513	1.305430e-08	0.0001320285	9.324703
PHC2	1.382352	6.926086	16.83671	3.459629e-08	0.0001320285	9.394810
STOM	1.442084	8.943205	16.73209	3.656354e-08	0.0001320285	9.177518
PER1	3.187280	4.507597	16.72064	3.678642e-08	0.0001320285	9.038168
MT2A	2.201373	7.111247	16.59420	3.934805e-08	0.0001320285	9.260883
DUSP1	2.950562	6.731630	16.17833	4.927101e-08	0.0001377700	9.059292

	SRR1039508	SRR1039509	SRR1039512
FENDRR	0.3229845	-0.3497569	-0.08615209
LOC644656	1.7677670	-1.0606602	1.29636243
HAVCR1P1	1.1692679	-0.7015608	-0.70156076

	SYMBOL	ENTREZID
	<chr>	<chr>
1	LINC00906	148145
2	MCHR1	2847
3	LRRTM2	26045
4	VCAM1	7412
5	VASH2	79805
6	SMTNL2	342527

	ID	Description	Count	GeneRatio	geneID
	<fct>	<fct>	<int>	<fct>	<chr>
GO:0005886	GO:0005886	plasma membrane	229	229/660	MCHR1/LRRTM2/VCAM1/GRIN2A/SLITRK6/AQP3/ASIC2/GPR68/AIF1L/TNFSF15/NPC1L1/IGSF9/EFR3B/GPR20/GPR20/KCTD12/RGS6/IL1RN/FLRT3/PLPPR4/AMOT/RND2/CAMK2A/SLC6A9/RAB11FIP4/SIGLEC15/GFRA2/SLC6A6/BDKRB2/INPP5D/INPP5D/RASD2/P2RX7/CXCL12/CPNE9/RTKN2/BDKRB1/TNFSF9/ADAM12/CLDN11/OMG/DNM1/TNFSF13B/EPHB2/ADCY4/ADCY4/FAIM2/TNFRSF11B/SLC51B/PRKG2/FNDC5/KIF18A/CDON/CIT/TSPAN32/RRAD/EPHB3/CUBN/GPC2/CNIH3/SEMA6D/S1PR1/ACVR1C/TSPAN11/EPHA5/ACKR4/TENM4/PLXDC1/LYPD3/LDB2/RHOJ/CORO1A/HMOX1/RAP2B/KCNE3/GDF5/PCDHGC5/LHFPL2/SCN1B/BRCA1/SLC39A10/SLC7A5/SEMA3A/PRKCE/TMEM119/TNIK/SGCD/TNFSF10/RAPGEF4/TRIB3/FRK/CD37/NEDD4L/MARCKSL1/ROBO1/OSBPL3/LGR4/RAET1G/RASL12/SPTBN4/EPB41/FRRS1L/COLQ/UNC5B/DRP2/ABCC6/ABCC6/IRAK2/ARHGEF2/ANK2/SLC41A2/IL17RB/OSBPL7/LZTS1/ITGA2/STIM2/PLPP3/DNM3/NRP2/TLCD2/TLCD2/ABCA6/MORF4L2/NF2/IRAK3/CLIC6/RHOBTB3/PPP1CB/CRIM1/CRIM1/KCNS3/NAMPT/ARHGEF28/ANPEP/STK17B/AP1M1/PNPLA2/ADH1C/MFGE8/AGTRAP/CARMIL1/TM4SF1/AMPH/KANK1/ADH1B/TMEM47/CYTH3/ANXA4/CFLAR/SLC5A6/JADE1/ITGA8/CD82/SLC38A2/RHOB/MMP15/C1QTNF1/ING2/ATP10A/SCARF1/SCARF1/ATP2A2/ABCA4/LIMS2/CPM/INPP5A/SLC7A6/EDA/EPHB6/EPHB6/NEGR1/STOM/TGFBR2/RAC3/MYADM/HMMR/CDC42EP3/DNAJB4/PIK3R1/STEAP1/P2RY14/ACSL1/PDLIM5/NEDD9/MYO16/MYO16/MMD/DIO2/GPRC5B/VIPR2/SORBS1/THBS1/CORIN/TJP2/TRPC6/STEAP2/RASGRP2/NEXN/LAMA2/DCXR/KLF9/IRS2/SORT1/FZD5/NKD1/GPR150/KCNQ3/IYD/HSPA2/ERRFI1/HIF3A/FZD8/ERVMER34-1/KCNK6/PLXNA4/DPEP1/GLUL/C7/CACNB2/FPR1/SYN2/SAMHD1/ITGA10/CD163/SLC16A12/ADRA1B/GUCY2D/ZBTB16/ALOX15B
GO:0005628	GO:0005628	prospore membrane	0	0/660
GO:0005789	GO:0005789	endoplasmic reticulum membrane	30	30/660	LCTL/HSD11B2/PLA2G4A/FLRT3/MEST/SCD/CH25H/CNIH3/HMOX1/TMEM119/GRAMD4/OSBPL3/ABCC6/ABCC6/TMCC2/OSBPL7/STIM2/PNPLA2/PREB/PCYT2/AGTRAP/YIF1B/GPAT3/CYP19A1/ATP10A/ATP2A2/EDA/ACSL1/MCTP1/SORT1
GO:0019867	GO:0019867	outer membrane	8	8/660	FOXO3/STARD7/ACSL1/SEPTIN4/SEPTIN4/NAV3/MAOA/GUCY2D
GO:0031090	GO:0031090	organelle membrane	89	89/660	MCHR1/SLC7A14/NPC1L1/DOC2A/PLA2G4A/LFNG/RND2/CAMK2A/SLC6A9/RAB11FIP4/CHDH/P2RX7/SYN3/CBFA2T3/TMEM35A/PRKG2/FNDC5/ST8SIA1/CUBN/CNIH3/CORO1A/RAP2B/LHFPL2/CKMT2/GRAMD4/ROBO1/OSBPL3/ABCC6/ABCC6/IRAK2/GALNT16/SH3BP5/COX11/CTSC/SQOR/RHOBTB3/ANPEP/AP1M1/PREB/AGTRAP/YIF1B/GASK1B/CALCOCO2/ULK2/AMPH/CYTH3/ANXA4/SLC5A6/HIGD1A/RHOB/COL7A1/AHCTF1/FOXO3/STARD7/SCARF1/SCARF1/GCHFR/NR4A1/ATP2A2/ABCA4/STOM/BDH1/BDH1/CHSY3/RAB11FIP1/CHST7/STEAP1/GCH1/ACSL1/GALNT15/MMD/GPRC5B/SUN2/MCTP1/SEPTIN4/SEPTIN4/STEAP2/NAV3/RNF144B/SORT1/FZD5/IYD/FPR1/MAOA/SYN2/CD163/ADRA1B/GUCY2D/PRODH
GO:0034357	GO:0034357	photosynthetic membrane	0	0/660

A data.frame: 6 × 4
	NGenes	Direction	PValue	FDR
	<dbl>	<chr>	<dbl>	<dbl>
BIOCARTA_ACTINY_PATHWAY	19	Up	3.896315e-05	0.1839451
REACTOME_SEMA4D_IN_SEMAPHORIN_SIGNALING	28	Up	5.361421e-04	0.5368448
CHEN_LVAD_SUPPORT_OF_FAILING_HEART_UP	99	Up	6.463547e-04	0.5368448
DAVIES_MULTIPLE_MYELOMA_VS_MGUS_DN	21	Up	7.632493e-04	0.5368448
STEGER_ADIPOGENESIS_UP	15	Up	8.956429e-04	0.5368448
JECHLINGER_EPITHELIAL_TO_MESENCHYMAL_TRANSITION_DN	61	Up	9.174624e-04	0.5368448

A data.frame: 6 × 6
	logFC	AveExpr	t	P.Value	adj.P.Val	B
	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>
LINC00906	-4.387631	-1.15315187	-3.683866	4.918911e-03	0.0472920174	-1.9708390
MCHR1	-4.207932	-2.72930547	-8.633729	1.088733e-05	0.0015639303	0.4953098
LRRTM2	-4.169559	-0.02831165	-8.294587	1.511796e-05	0.0018649561	2.1409081
VCAM1	-3.686535	3.65813483	-10.691994	1.814316e-06	0.0006764174	5.4886506
VASH2	-3.627419	-1.00508844	-8.403856	1.358500e-05	0.0017917458	1.6860112
SMTNL2	-3.522934	0.41710895	-3.695834	4.827700e-03	0.0469016124	-1.7974586

A data.frame: 6 × 7
	logFC	AveExpr	t	P.Value	adj.P.Val	B	SYMBOL
	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<chr>
LINC00906	-4.387631	-1.15315187	-3.683866	4.918911e-03	0.0472920174	-1.9708390	LINC00906
MCHR1	-4.207932	-2.72930547	-8.633729	1.088733e-05	0.0015639303	0.4953098	MCHR1
LRRTM2	-4.169559	-0.02831165	-8.294587	1.511796e-05	0.0018649561	2.1409081	LRRTM2
VCAM1	-3.686535	3.65813483	-10.691994	1.814316e-06	0.0006764174	5.4886506	VCAM1
VASH2	-3.627419	-1.00508844	-8.403856	1.358500e-05	0.0017917458	1.6860112	VASH2
SMTNL2	-3.522934	0.41710895	-3.695834	4.827700e-03	0.0469016124	-1.7974586	SMTNL2

A data.frame: 6 × 7
	logFC	AveExpr	t	P.Value	adj.P.Val	B	SYMBOL
	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<dbl>	<chr>
1	-4.387631	-1.15315187	-3.683866	4.918911e-03	0.0472920174	-1.9708390	LINC00906
2	-4.207932	-2.72930547	-8.633729	1.088733e-05	0.0015639303	0.4953098	MCHR1
3	-4.169559	-0.02831165	-8.294587	1.511796e-05	0.0018649561	2.1409081	LRRTM2
4	-3.686535	3.65813483	-10.691994	1.814316e-06	0.0006764174	5.4886506	VCAM1
5	-3.627419	-1.00508844	-8.403856	1.358500e-05	0.0017917458	1.6860112	VASH2
6	-3.522934	0.41710895	-3.695834	4.827700e-03	0.0469016124	-1.7974586	SMTNL2