广州网站设计开发招聘,做一个综合商城网站多少钱,新媒体营销实训报告总结,查询个人公司注册公司miRNA#xff08;microRNA#xff09; 是一种小的非编码 RNA 分子#xff0c;通常由 20 到 24 个核苷酸组成。miRNA 主要存在于动植物中#xff0c;并在基因表达调控中起到关键作用。它们通过与特定的信使 RNA#xff08;mRNA#xff09;分子结合来抑制基因表达#xff…miRNAmicroRNA 是一种小的非编码 RNA 分子通常由 20 到 24 个核苷酸组成。miRNA 主要存在于动植物中并在基因表达调控中起到关键作用。它们通过与特定的信使 RNAmRNA分子结合来抑制基因表达通常通过抑制翻译或促进 mRNA 的降解。
miRNA 的特征和功能 基因表达调控miRNA 不直接编码蛋白质而是通过调节蛋白质编码基因的表达来发挥作用。典型的调控方式是通过与靶 mRNA 配对然后抑制其翻译或促使其降解。 产生与加工miRNA 通常由较长的初始转录本称为 pri-miRNA加工而来。pri-miRNA 在细胞核中由 Drosha 酶加工成较短的 pre-miRNA然后被运送到细胞质中。在细胞质中Dicer 酶进一步加工 pre-miRNA将其切割成成熟的双链 miRNA。其中一条链称为“引导链”会与 RNA 诱导沉默复合体RISC 结合另一条链称为“乘客链”通常会被降解。 靶标结合与功能miRNA 通过其引导链的 种子序列位于 miRNA 的 5 端通常为第 2 到第 8 位核苷酸与靶 mRNA 的 3 非翻译区3 UTR 结合。这种结合可以导致 mRNA 的翻译抑制或直接降解从而减少特定蛋白质的产生。
miRNA 的生物学意义 发育调控miRNA 在胚胎发育、细胞分化和器官形成中扮演重要角色。 细胞周期与凋亡miRNA 参与调控细胞的增殖、分化和凋亡维持细胞稳态。 癌症miRNA 在肿瘤发生和发展中起到关键作用。某些 miRNA 可以作为癌基因促进癌症的 miRNA或抑癌基因抑制癌症的 miRNA。 免疫反应miRNA 调节免疫系统的功能影响炎症反应和免疫调节。
miRNA 的应用 生物标志物由于 miRNA 在不同疾病状态下的表达差异它们可以作为疾病诊断和预后的生物标志物。例如在一些癌症中特定 miRNA 的表达上调或下调与疾病进展相关。 治疗靶标miRNA 的调节功能使它们成为潜在的药物靶标。通过抑制有害的 miRNA 或补充缺失的 miRNA可以开发新的治疗方法。一些 miRNA 模拟物和反义 oligonucleotideanti-miRNA 已经在临床试验中。 基因功能研究miRNA 是研究基因功能和信号通路的重要工具帮助揭示复杂的基因调控网络。
笔者能力有限详细的miRNA知识就不再赘述了感兴趣的小伙伴可以去读一读参考资料中的综述~
miRNA数据库
关于miRNA的数据库有很多以下是几个比较重要的
1、miRBase这个数据库是所有想做miRNA分析的研究者一定绕不开的工具 2、MicroRNAdb 3、miRTarBase 4、除此之外还有很多比如psRNATARGETMicroRNAdbmiRWalkTarBasemiRGatorCoGemiRPolymiRTSPicTar等。
TCGA-miRNA数据下载
正式分析之前还需要获取miRNA的数据其中最常用的数据库一定是TCGA了, 因此我们先从这个数据库开始。
对于来自TCGA数据库的数据有一个好用的下载工具就是TCGAbiolinks它可以帮助我们方便的获取到TCGA中的数据。
1.导入
rm(list ls())
library(TCGAbiolinks)
library(qs)
library(BiocParallel)
register(MulticoreParam(workers 8, progressbar TRUE)) # 查看TCGA中33种癌症的简称
library(TCGAbiolinks)projects - TCGAbiolinks::getGDCprojects()$project_id ##获取癌症名字
projects - projects[grepl(^TCGA, projects, perlTRUE)]
projects
# [1] TCGA-PCPG TCGA-THYM TCGA-PAAD TCGA-STAD TCGA-TGCT TCGA-SARC TCGA-PRAD TCGA-READ TCGA-UCS TCGA-UVM
# [11] TCGA-KICH TCGA-HNSC TCGA-LUAD TCGA-LIHC TCGA-LUSC TCGA-MESO TCGA-LAML TCGA-LGG TCGA-KIRP TCGA-KIRC
# [21] TCGA-ACC TCGA-BLCA TCGA-DLBC TCGA-CHOL TCGA-CESC TCGA-COAD TCGA-BRCA TCGA-ESCA TCGA-GBM TCGA-OV
# [31] TCGA-THCA TCGA-SKCM TCGA-UCECTCGAbiolinks:::getProjectSummary(TCGA-HNSC)
# $file_count
# [1] 29489
#
# $data_categories
# file_count case_count data_category
# 1 8330 528 Simple Nucleotide Variation
# 2 4595 528 Sequencing Reads
# 3 2858 528 Biospecimen
# 4 1103 528 Clinical
# 5 5925 526 Copy Number Variation
# 6 2270 528 Transcriptome Profiling
# 7 1740 528 DNA Methylation
# 8 354 354 Proteome Profiling
# 9 50 24 Somatic Structural Variation
# 10 2264 521 Structural Variation
#
# $case_count
# [1] 528
#
# $file_size
# [1] 3.019863e142.TCGA-miRNA数据下载
proj - TCGA-HNSC
# 单独下载
query - GDCquery(project proj,data.category Transcriptome Profiling,data.type miRNA Expression Quantification,workflow.type BCGSC miRNA Profiling
)
GDCdownload(query)
GDCprepare(query,save T,save.filename paste0(project,_miRNA.Rdata))# 批量下载数据
sapply(projects, function(project){query - GDCquery(project project,data.category Transcriptome Profiling,data.type miRNA Expression Quantification)GDCdownload(query)GDCprepare(query, save T,save.filename paste0(project,_miRNA.Rdata))})3.数据处理及保存
load(paste0(proj,_miRNA.Rdata))
head(data)[1:4,1:4]
# miRNA_ID read_count_TCGA-BA-6871-01A-11R-1872-13 reads_per_million_miRNA_mapped_TCGA-BA-6871-01A-11R-1872-13
# 1 hsa-let-7a-1 39430 8590.708
# 2 hsa-let-7a-2 39178 8535.804
# 3 hsa-let-7a-3 39394 8582.864
# 4 hsa-let-7b 65142 14192.642
# cross-mapped_TCGA-BA-6871-01A-11R-1872-13
# 1 N
# 2 Y
# 3 N
# 4 N# 把列名中含有count的数据提取出来
rownames(data) - data$miRNA_ID
col - grepl(count, colnames(data))
miRNA_count - data[,col]
colnames(miRNA_count) - sub(read_count_,,colnames(miRNA_count)) # gsub是去除所有匹配的字符
head(miRNA_count)[1:4,1:4]
# TCGA-BA-6871-01A-11R-1872-13 TCGA-CN-6024-01A-11R-1685-13 TCGA-IQ-7631-01A-11R-2080-13
# hsa-let-7a-1 39430 37356 78370
# hsa-let-7a-2 39178 37111 78621
# hsa-let-7a-3 39394 37080 79843
# hsa-let-7b 65142 65155 193506
# TCGA-CV-7406-01A-11R-2080-13
# hsa-let-7a-1 43002
# hsa-let-7a-2 42954
# hsa-let-7a-3 43141
# hsa-let-7b 78858
save(miRNA_count,file paste0(proj,_miRNA_count.Rdata))参考资料 MicroRNA profiling: approaches and considerations. Nat Rev Genet. 2012 Apr 18;13(5):358-69. microRNA functions. Annu Rev Cell Dev Biol. 2007:23:175-205. miRBase数据库https://www.mirbase.org/ TCGAbiolinks:https://bioconductor.org/packages/devel/bioc/vignettes/TCGAbiolinks/inst/doc/index.html https://bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html GDCquery: https://rdrr.io/bioc/TCGAbiolinks/man/GDCquery.html 生信技能树时间线https://mp.weixin.qq.com/mp/appmsgalbum?actiongetalbum__bizMzAxMDkxODM1Ngscene24album_id2201138830328528899count3uinkeydevicetypeiMacMac14%2C7OSXOSX14.6.1build(23G93)version13080810langzh_CNnettypeWIFIascene0fontScale100 生信技能树B站视频https://www.bilibili.com/video/BV1zK411n7qr/?vd_source3a13860df939bc922ad1fd6099e42c1d 生信技能树https://mp.weixin.qq.com/s/847Zc6QbU44LSL3l_STSpg https://mp.weixin.qq.com/s/USc_aUA_loFLLljXzbmpFg 生信星球https://www.jianshu.com/p/59e179212bdc 佳奥https://www.jianshu.com/p/b7cbf0cb78ae 医学和生信笔记https://zhuanlan.zhihu.com/p/556196846 叶子的数据科技专栏https://cloud.tencent.com/developer/article/2245363
致谢感谢曾老师以及生信技能树团队全体成员。
注若对内容有疑惑或者有发现明确错误的朋友请联系后台(欢迎交流)。更多内容可关注公众号生信方舟
- END -