jjzjj

【小工具】智能合并测序数据fastq的脚本

介绍:这是一个可以自动合并数据的简易脚本应用场景:有一批数据有三十几个样本,测序公司返回数据时由于数据量不达标,需要加测一次,部分样本数据量还是不够,又加测一次才够,总共三次数据,需要根据样本名称合并成一个fq.gz。这么多数据要一个一个对应太麻烦了.那么如果经常发生这种情况,建议换一家测序公司。脚本使用注意事项:批次之间的文件如何区分:通常是根据lane号区分的,比如:XXX_L3_1.fq.gz(第一批测序回来的)XXX_L2_1.fq.gz(第二批测序回来的)再有就是两批数据完全相同的名称:XXX_L3_1.fq.gz(第一批测序回来的)XXX_L3_1.fq.gz(第二批测序回来的)这

重测序分析(1)软件安装

今天开启重测序分析专题啦!恳请各位观众老爷点点关注!所有分析均在linux系统上完成整个重测序分析流程涉及到的软件非常多,本节介绍重测序常用软件的安装方法。安装R包install.packages("getopt")install.packages("phangorn")install.packages("qqman")install.packages("CMplot")install.packages("LDheatmap")install.packages("gplots")install.packages("multtest")install.packages("scatterplot3

重测序分析(1)软件安装

今天开启重测序分析专题啦!恳请各位观众老爷点点关注!所有分析均在linux系统上完成整个重测序分析流程涉及到的软件非常多,本节介绍重测序常用软件的安装方法。安装R包install.packages("getopt")install.packages("phangorn")install.packages("qqman")install.packages("CMplot")install.packages("LDheatmap")install.packages("gplots")install.packages("multtest")install.packages("scatterplot3

手把手教你做单细胞测序数据分析(七)—— 基因集富集分析

往期回顾B站中只有视频课程,代码部分整理在往期推送之中:手把手教你做单细胞测序数据分析(一)——绪论手把手教你做单细胞测序数据分析(二)——各类输入文件读取手把手教你做单细胞测序数据分析(三)——单样本分析手把手教你做单细胞测序数据分析(四)——多样本整合手把手教你做单细胞测序数据分析(五)——细胞类型注释手把手教你做单细胞测序数据分析(六)——组间差异分析及可视化其他单细胞相关技术贴也在这里:细胞的数量由誰决定?答读者问(三)单细胞测序前景答读者问(四):如何分析细胞亚群答读者问(六)、Seurat中如何让细胞听你指挥单细胞中应该如何做GSVA?如果这期视频看不懂,你可能需要看看这些:上一讲

手把手教你做单细胞测序数据分析(七)—— 基因集富集分析

往期回顾B站中只有视频课程,代码部分整理在往期推送之中:手把手教你做单细胞测序数据分析(一)——绪论手把手教你做单细胞测序数据分析(二)——各类输入文件读取手把手教你做单细胞测序数据分析(三)——单样本分析手把手教你做单细胞测序数据分析(四)——多样本整合手把手教你做单细胞测序数据分析(五)——细胞类型注释手把手教你做单细胞测序数据分析(六)——组间差异分析及可视化其他单细胞相关技术贴也在这里:细胞的数量由誰决定?答读者问(三)单细胞测序前景答读者问(四):如何分析细胞亚群答读者问(六)、Seurat中如何让细胞听你指挥单细胞中应该如何做GSVA?如果这期视频看不懂,你可能需要看看这些:上一讲

GEO单细胞测序数据下载

GEO数据库下载单细胞测序原始数据如果想要分析数据库中的数据,可以从文献中获得数据的GSE号,举个例子:image.png然后到NCBINationalCenterforBiotechnologyInformation(nih.gov)搜索GSE144024,就会得到如下信息:image.png其中,GSM号为样本编号,后面有详细信息。点击SRARUNSelector,就可以看到每个样本的SRR号。image.png选择想要下载的SRR,点击selected-accessionlist,就可得到一个编号的文本文件。但是呢想要下载,还得需要借助其他软件sratools。image.pngsrat

GEO单细胞测序数据下载

GEO数据库下载单细胞测序原始数据如果想要分析数据库中的数据,可以从文献中获得数据的GSE号,举个例子:image.png然后到NCBINationalCenterforBiotechnologyInformation(nih.gov)搜索GSE144024,就会得到如下信息:image.png其中,GSM号为样本编号,后面有详细信息。点击SRARUNSelector,就可以看到每个样本的SRR号。image.png选择想要下载的SRR,点击selected-accessionlist,就可得到一个编号的文本文件。但是呢想要下载,还得需要借助其他软件sratools。image.pngsrat

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后,我们获得了该数据集的所有主成分(PCs)信息,但是如何决定纳入多少个主成分进行下游分析呢?主要参考以下方法:热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示,可以看出前15个主成分可以把细胞分成差异明显的两群,说明前15个主成分中含有的显著的差异基因更多,主成分也就更有意义,所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况,从上图可以看出9~10PC以后逐渐趋于稳定(噪声主

单细胞测序分析之PCA后维度的选择

关于“数据的维度”(dims参数)的选择完成PCA之后,我们获得了该数据集的所有主成分(PCs)信息,但是如何决定纳入多少个主成分进行下游分析呢?主要参考以下方法:热图DimHeatmap(pbmc,dims=1:15,cells=500,balanced=TRUE)image.png如上图所示,可以看出前15个主成分可以把细胞分成差异明显的两群,说明前15个主成分中含有的显著的差异基因更多,主成分也就更有意义,所以下游分析可以纳入前15个PCs。碎石图ElbowplotElbowPlot(pbmc)通过碎石图可以看出每个PC对变异的贡献情况,从上图可以看出9~10PC以后逐渐趋于稳定(噪声主

单细胞测序之差异表达基因获得方法

1.加载数据library(Seurat)library(SeuratData)pbmcpbmcAnobjectofclassSeurat13714featuresacross2638sampleswithin1assayActiveassay:RNA(13714features,2000variablefeatures)2dimensionalreductionscalculated:pca,umap2.执行默认的差异表达测试Seurat的大部分差异表达特征可以通过“FindMarkers()”函数访问。默认情况下,Seurat基于非参数Wilcoxon秩和检验执行差分表达式。这取代了以前的