Tag Archives: bioinformatics

Python统计DNA序列中长度为n的子序列频率

ms是我师弟的rotation project:
给定一堆DNA序列,即由字符A, C, G, T组成的字符串,统计所有长度为n的子序列出现的频率。
比如 ACGTACGT,子序列长度为2,于是 AC=2, CG=2, GT=2, TA=1,其余长...

推荐个生物信息学问答社区

欢迎大家来围观我们学校新建的生物信息学问答社区:

BioStar is “A place to ask questions about bioinformatics and life science related data analysis.”
刚建了两天,所以上面的问题很少,希望大家多...

用R进行芯片数据的主成份分析和聚类分析(课程作业备份)

很久以前的作业了,自己都看不懂了,传上来有需要的人自己研究一下吧。
我们的课程主页:http://www.stat.psu.edu/~chiaro/BioinfoII_08/
主成份分析 Principal Components Analysis
课堂讲义 作...

W老教授语录

W是我朋友Q mm 和 G mm的导师,之前不多的接触主要是上他讲的生物信息学课,凡是有人上课问他问题,他就回一句:What do you think? 然后全班静默一分钟,然后move on。
感谢昨天Q和G的爆料...

python: find repeat masked intervals in fasta files

通常fasta文件用N来表示重复序列(用小写的atgc也很常见),下面的代码就是找出fasta文件中用N标记的区域。
首先导入biopython包,然后用SeqIO.to_dict()函数把fasta文件的记录转换成python字典...