jjzjj

TCGAbiolinks包下载更新后的TCGA数据

CrimsonUMO 2023-03-28 原文

众所周知,今年TCGA数据库更新了一波,原来的HT-Counts现在变成了STAR-Counts。TCGABiolinks包的下载流程也发生了一些小小的变化。这里重新梳理一下TCGABiolinks的下载流程,供大家参考

一、加载R包

library(TCGAbiolinks)
library(SummarizedExperiment)

主要的R包主要是这么几个,其中SummarizedExperiment是为了提取不同类型(Counts/TPM……)的数据的。

二、下载数据

首先来查看一下TCGAbiolinks可以下载的数据类型

> getGDCprojects()$project_id
 [1] "EXCEPTIONAL_RESPONDERS-ER" "GENIE-GRCC"               
 [3] "GENIE-DFCI"                "GENIE-NKI"                
 [5] "GENIE-VICC"                "GENIE-UHN"                
 [7] "GENIE-MDA"                 "GENIE-MSK"                
 [9] "GENIE-JHU"                 "FM-AD"                    
[11] "OHSU-CNL"                  "MMRF-COMMPASS"            
[13] "ORGANOID-PANCREATIC"       "NCICCR-DLBCL"             
[15] "VAREPOP-APOLLO"            "CGCI-BLGSP"               
[17] "BEATAML1.0-CRENOLANIB"     "TRIO-CRU"                 
[19] "REBC-THYR"                 "TARGET-ALL-P2"            
[21] "TARGET-ALL-P1"             "CPTAC-2"                  
[23] "WCDT-MCRPC"                "CMI-ASC"                  
[25] "TCGA-READ"                 "TCGA-UCS"                 
[27] "CMI-MPC"                   "CMI-MBC"                  
[29] "BEATAML1.0-COHORT"         "TCGA-COAD"                
[31] "TCGA-CESC"                 "TCGA-PAAD"                
[33] "TCGA-ESCA"                 "TCGA-KIRP"                
[35] "TCGA-PCPG"                 "TCGA-HNSC"                
[37] "TCGA-BLCA"                 "TCGA-STAD"                
[39] "CTSP-DLBCL1"               "TCGA-SARC"                
[41] "TCGA-CHOL"                 "TCGA-LAML"                
[43] "TCGA-THYM"                 "TCGA-ACC"                 
[45] "TCGA-SKCM"                 "TCGA-LUAD"                
[47] "TCGA-LIHC"                 "TCGA-KIRC"                
[49] "TCGA-KICH"                 "TCGA-DLBC"                
[51] "TCGA-PRAD"                 "TCGA-OV"                  
[53] "TCGA-MESO"                 "TCGA-LUSC"                
[55] "TCGA-GBM"                  "TCGA-UVM"                 
[57] "TCGA-LGG"                  "HCMI-CMDC"                
[59] "TCGA-BRCA"                 "TARGET-RT"                
[61] "TARGET-CCSK"               "TCGA-TGCT"                
[63] "TARGET-NBL"                "CPTAC-3"                  
[65] "CGCI-HTMCP-CC"             "TARGET-ALL-P3"            
[67] "TARGET-OS"                 "TARGET-AML"               
[69] "TARGET-WT"                 "MP2PRT-WT"                
[71] "TCGA-THCA"                 "TCGA-UCEC"  

这里以结肠癌为例进行演示

COAD <- GDCquery(project = "TCGA-COAD",
         data.category = "Transcriptome Profiling",
         data.type = "Gene Expression Quantification",
         workflow.type = "STAR - Counts")
GDCdownload(COAD,method="api")

workflow.type这个参数,不管要下载的是TPM还是FPKM,都填STAR-Counts。不同类型的数据到后面再说。

经过漫长的等待数据终于下载下来了。文件默认存储在当前的工作目录下的GDCdata文件夹,当然也可以在GDCdownload函数里通过directory参数进行更改。

三、合并数据和提取数据

expr <- GDCprepare(query=COAD)

通过这条命令可以把上面下载到的数据整合成1个summarizedExperiment对象。
如果需要counts数据,可以直接从这个对象里提取

count <- as.data.frame(assay(expr))

如果需要counts格式以外的其他数据,则需要在这一步改一下参数

TPM <- as.data.frame(assay(expr,i = "tpm_unstrand"))

提取不同格式数据需要的参数在下面:

下载Counts i= "unstranded"
下载tpm i="tpm_unstrand"
下载fpkm i=" fpkm_unstrand"

有关TCGAbiolinks包下载更新后的TCGA数据的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

    我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

  3. ruby - 如何使用 Ruby aws/s3 Gem 生成安全 URL 以从 s3 下载文件 - 2

    我正在编写一个小脚本来定位aws存储桶中的特定文件,并创建一个临时验证的url以发送给同事。(理想情况下,这将创建类似于在控制台上右键单击存储桶中的文件并复制链接地址的结果)。我研究过回形针,它似乎不符合这个标准,但我可能只是不知道它的全部功能。我尝试了以下方法:defauthenticated_url(file_name,bucket)AWS::S3::S3Object.url_for(file_name,bucket,:secure=>true,:expires=>20*60)end产生这种类型的结果:...-1.amazonaws.com/file_path/file.zip.A

  4. ruby-on-rails - 使用 rails 4 设计而不更新用户 - 2

    我将应用程序升级到Rails4,一切正常。我可以登录并转到我的编辑页面。也更新了观点。使用标准View时,用户会更新。但是当我添加例如字段:name时,它​​不会在表单中更新。使用devise3.1.1和gem'protected_attributes'我需要在设备或数据库上运行某种更新命令吗?我也搜索过这个地方,找到了许多不同的解决方案,但没有一个会更新我的用户字段。我没有添加任何自定义字段。 最佳答案 如果您想允许额外的参数,您可以在ApplicationController中使用beforefilter,因为Rails4将参数

  5. ruby - 安装 Ruby 时遇到问题(无法下载资源 "readline--patch") - 2

    当我尝试安装Ruby时遇到此错误。我试过查看this和this但无济于事➜~brewinstallrubyWarning:YouareusingOSX10.12.Wedonotprovidesupportforthispre-releaseversion.Youmayencounterbuildfailuresorotherbreakages.Pleasecreatepull-requestsinsteadoffilingissues.==>Installingdependenciesforruby:readline,libyaml,makedepend==>Installingrub

  6. ruby - Ruby 有 `Pair` 数据类型吗? - 2

    有时我需要处理键/值数据。我不喜欢使用数组,因为它们在大小上没有限制(很容易不小心添加超过2个项目,而且您最终需要稍后验证大小)。此外,0和1的索引变成了魔数(MagicNumber),并且在传达含义方面做得很差(“当我说0时,我的意思是head...”)。散列也不合适,因为可能会不小心添加额外的条目。我写了下面的类来解决这个问题:classPairattr_accessor:head,:taildefinitialize(h,t)@head,@tail=h,tendend它工作得很好并且解决了问题,但我很想知道:Ruby标准库是否已经带有这样一个类? 最佳

  7. ruby - 我如何添加二进制数据来遏制 POST - 2

    我正在尝试使用Curbgem执行以下POST以解析云curl-XPOST\-H"X-Parse-Application-Id:PARSE_APP_ID"\-H"X-Parse-REST-API-Key:PARSE_API_KEY"\-H"Content-Type:image/jpeg"\--data-binary'@myPicture.jpg'\https://api.parse.com/1/files/pic.jpg用这个:curl=Curl::Easy.new("https://api.parse.com/1/files/lion.jpg")curl.multipart_form_

  8. 世界前沿3D开发引擎HOOPS全面讲解——集3D数据读取、3D图形渲染、3D数据发布于一体的全新3D应用开发工具 - 2

    无论您是想搭建桌面端、WEB端或者移动端APP应用,HOOPSPlatform组件都可以为您提供弹性的3D集成架构,同时,由工业领域3D技术专家组成的HOOPS技术团队也能为您提供技术支持服务。如果您的客户期望有一种在多个平台(桌面/WEB/APP,而且某些客户端是“瘦”客户端)快速、方便地将数据接入到3D应用系统的解决方案,并且当访问数据时,在各个平台上的性能和用户体验保持一致,HOOPSPlatform将帮助您完成。利用HOOPSPlatform,您可以开发在任何环境下的3D基础应用架构。HOOPSPlatform可以帮您打造3D创新型产品,HOOPSSDK包含的技术有:快速且准确的CAD

  9. Unity 热更新技术 | (三) Lua语言基本介绍及下载安装 - 2

    ?博客主页:https://xiaoy.blog.csdn.net?本文由呆呆敲代码的小Y原创,首发于CSDN??学习专栏推荐:Unity系统学习专栏?游戏制作专栏推荐:游戏制作?Unity实战100例专栏推荐:Unity实战100例教程?欢迎点赞?收藏⭐留言?如有错误敬请指正!?未来很长,值得我们全力奔赴更美好的生活✨------------------❤️分割线❤️-------------------------

  10. FOHEART H1数据手套驱动Optitrack光学动捕双手运动(Unity3D) - 2

    本教程将在Unity3D中混合Optitrack与数据手套的数据流,在人体运动的基础上,添加双手手指部分的运动。双手手背的角度仍由Optitrack提供,数据手套提供双手手指的角度。 01  客户端软件分别安装MotiveBody与MotionVenus并校准人体与数据手套。MotiveBodyMotionVenus数据手套使用、校准流程参照:https://gitee.com/foheart_1/foheart-h1-data-summary.git02  数据转发打开MotiveBody软件的Streaming,开始向Unity3D广播数据;MotionVenus中设置->选项选择Unit

随机推荐