网站后台程序设计常用语言 技术的分析比较,成全视频免费观看在线看小说原著叫什么,做网站一般多少钱,建设银行官方网站地址生物笔记——暑期学习笔记#xff08;三#xff09; 文章目录 前言一、R篇1. 数据筛选2. 字符串处理3. 练习 二、生信篇1. blast 基因家族鉴定2. hmm鉴定3. 理化性质与亚细胞定位4. 基因重复类型分析5. 家族成员染色体位置分析6. 基因组共线性分析7. 多序列比对#xff0c;构… 生物笔记——暑期学习笔记三 文章目录 前言一、R篇1. 数据筛选2. 字符串处理3. 练习 二、生信篇1. blast 基因家族鉴定2. hmm鉴定3. 理化性质与亚细胞定位4. 基因重复类型分析5. 家族成员染色体位置分析6. 基因组共线性分析7. 多序列比对构树8. Ka/Ks分析9. GO、KEGG富集分析10. 基因家族Motif 分析 总结 前言
这一系列文章主要是对于在暑期老师每周教导的生信方面的课程的课后学习笔记的总结希望用此方法来巩固我的所学。
一、R篇
1. 数据筛选 情景 假设有一个基因表达矩阵x 目标 筛选出在样本A中基因表达值大于10、在样本B中小于8、在样本C中与样本D中表达值相差超过或等于2的基因并返回基因ID。筛选出所有基因表达量都为0的基因 x - data.frame(A c(7:15,0),B c(2:10,0), C c(3:11,0),D c(0:8,0),row.names paste(gene,seq(1,10),sep _))xA B C D
gene_1 7 2 3 0
gene_2 8 3 4 1
gene_3 9 4 5 2
gene_4 10 5 6 3
gene_5 11 6 7 4
gene_6 12 7 8 5
gene_7 13 8 9 6
gene_8 14 9 10 7
gene_9 15 10 11 8
gene_10 0 0 0 0#str(x)tiaojian - x[A]10 x[B]8 abs((x[C]-x[D]))2
x1 - x[tiaojian,] x1A B C D
gene_5 11 6 7 4
gene_6 12 7 8 5#返回满足条件的基因IDrow.names(x1)
[1] gene_5 gene_6#或者直接用which返回索引再根据索引返回满足条件的基因which(tiaojian)
[1] 5 6x[which(tiaojian),]A B C D
gene_5 11 6 7 4
gene_6 12 7 8 5#筛选出所有基因表达量都为0的基因
tiaojian - rowSums(x0) ncol(x)
x2 - x[tiaojian,]row.names(x2)
[1] gene_10
#或者
tiaojian - x$A 0 x$B 0 x$C0 x$D 0
x2 - x[which(tiaojian),]
rownames(x2)2. 字符串处理
#paste函数paste(x,c(1:3),sep*)
[1] x*1 x*2 x*3#nchar函数nchar(星石传说)
[1] 4nchar(sjfakjfa)
[1] 8paste(c(星, 石,传,说), collapse )
[1] 星石传说#字符串替换
x - 1,3;5,6,7;8,9gsub(;,,,x,fixed TRUE)
[1] 1,3,5,6,7,8,9sub(;,,,x,fixed TRUE)
[1] 1,3,5,6,7;8,9chartr(asx,xwb,xingshichuangshuo)
[1] bingwhichuxngwhuo#正则表达式gsub([[:space:]], , a cat in a box,perl TRUE)
[1] a cat in a box
text - hello world
is_match - grepl([A-Z], text) #匹配text中是否包含大写字母is_match
[1] FALSE3. 练习 情景 假设有一个包含DNA序列的字符向量dan_seq 目标 将序列转为大写字母且进行碱基互补再将所有序列按字典顺序排列最后合并为一段长序列。 dan_seq - c(atgcgta,cgtacg,ttgga,gcat)
dan_seq - toupper(dan_seq)dan_seq
[1] ATGCGTA CGTACG TTGGA GCAT chartr(TAGC, ATCG, dan_seq)dan_seq
[1] TACGCAT GCATGC AACCT CGTA dan_seq - sort(dan_seq)dan_seq
[1] AACCT CGTA GCATGC TACGCATnew_seq- paste(dan_seq,collapse )new_seq
[1] AACCTCGTAGCATGCTACGCAT二、生信篇
1. blast 基因家族鉴定
基因家族成员鉴定一
2. hmm鉴定
生物笔记——暑期学习笔记四
3. 理化性质与亚细胞定位
理化性质与亚细胞定位 亚细胞定位 pyhton爬虫学习一
4. 基因重复类型分析
鉴定不同基因的重复模式
5. 家族成员染色体位置分析
家族成员染色体位置分析
6. 基因组共线性分析
基因组共线性分析
7. 多序列比对构树
多序列比对构树
8. Ka/Ks分析
Ka/Ks分析
9. GO、KEGG富集分析
10. 基因家族Motif 分析
基因家族Motif分析 总结
本文的R篇主要讲述了使用which()返回索引来进行数据筛选以及一些字符串处理函数 paste() 、nchar() 、gsub() 、chartr() 等 。 而生信篇则主要讲述了在基因家族分析中的一些分析。
山一程水一程身向榆关那畔行夜深千帐灯。
–2023-8-28 笔记篇