Thursday, May 29, 2014

Gencode and Fantom Project

Gencode 是什么

Gencode是Encode Project 框架内的一个旨在对人类和小鼠基因组进行全面注释的项目。目前人类 Gencode 最新更新是V19,此前两个比较大的更新是V7 和 V10。
使用时以具体需要为准,例如Brain Span的data 全部以Gencode 10 为reference 生成。

Gencode 的数据可以以GTF 格式下载,也可以用 MySQL,或者Perl,Biomart 等取得。
关于GTF的说明,可见这里。GTF 是 Generic Feature Format 的缩写。
GTF 文件可以在R 中 用GenomicFeatures package 转换为TranscriptDb 对象。

Fantom Project :

Fantom project 是以RIKEN为核心,全面识别不同组织,细胞株的转录组,增强子,启动子的基因组项目。这个项目中广泛使用了 CAGE 方法,提供了高分辨率的细胞调控元件的序列。