生物信息学教学大纲

红河学院《生物信息学》课程教学大纲

一、课程基本情况与说明

(一)课程代码:

(二)课程英文名称:bioinformatics

(三)课程中文名称:生物信息学

(四)授课对象:生物科学和生物技术专业本科生

(五)开课单位:生命科学与技术学院

(六)教材:

1、生物技术专业:《生物信息学应用技术》,王禄山、高培基编,化学工业出版社,20##年

2、生物科学专业:《生物信息学基础》,孙啸、陆祖宏、谢建明编,清华大学出版社,20##年

(七)参考书目

[1]《生物信息学》,DavidW.Mount著,钟扬等译,高等教育出版社,20##年

[2]《基因组数据分析手册》,胡松年、薛庆中编,浙江大学出版社,20##年

[3]《生物信息学中的计算机技术(Developing Bioinformatics Computer Skills)》,Cynthia Gibas,Per Jambeck著,孙超等译,中国电力出版社,20##年

[4]《生物信息学:基因和蛋白质分析的实用指南》,Andreas D. Baxevanis,Francis Ouellette B F著,李衍达、孙之荣等译,清华大学出版社,20##年

[5]《生物信息学算法导论(An Introduction to Bioinformatics Algorithms )》,琼斯,帕夫纳著,王翼飞等译,化学工业出版社,20##年

(八)课程性质(五号宋体加粗)

生物信息学是生命科学领域一门新兴的边缘学科,综合了生物学、计算机学、信息学、统计学等方面的知识。该学科在学生掌握生物化学、遗传学、分子生物学以及计算机应用、高等数学等相关知识的基础上开设,属于生物类专业的专业课程(必修或选修)。通过学习,学生能够加深对分子生物学和基因工程等课程的理解,并为进一步学习基因组学(genomics)和蛋白质组学(protemics) 奠定基础。

(九)教学目的

1、给学生介绍生物信息学的主要内容以及未来可能的发展方向,为学生构建相关知识体系,开阔学生的视野,为将来进一步学习、科研打下基础。

2、让学生了解生物信息学的基本研究方法,并能掌握应用其中的一些常用方法,以提高学生的科研能力,领会采用信息学技术去分析和探索大量核酸和蛋白质序列所蕴藏的生命意义的基本思路。

3、学习运用计算机软件来分析生物学问题,提高用理论来辅助、提高实验的设计和数据分析水平,加强对分子生物学实验结果的预测与分析等等的能力。

(十)教学基本要求

本课程应用性、实践性和操作性很强、对计算机水平要求较高。生物信息学的发源和领先地区又多在国外,大量的生物信息学数据库已经网络化,主要软件都由国外开发,因此对英语水平也有一定要求。考虑到这些特点,为实现本大纲的要求,应积极采用新教材、多媒体及计算机辅助教学等先进教学手段,同时注意提醒、强化学生的计算机和英语应用水平,提高教学效果。在教学过程中,要注意前修课程和后续课程的联系(包括生物专业英语)。

①本课程是生物类专业高年级的课程,学生在生物领域已经有了相当基础知识,因此教学重点应放在几大学科(生物学、计算机学、信息学、统计学等)知识的综合上,着重讨论学科的交叉运用,注意对分子生物学知识的回顾、联系和应用。

②对于生物信息学中的基本研究方法的学习,应是教师介绍、课堂讨论、课后作业相结合,通过学生的实践,深入掌握这些研究方法,能理解其算法,培养学生分析问题和解决问题的能力。重点、难点要突出。注意理论联系实际。

③结合实际,介绍并提供当前热门的生物信息软件,并布置作业,让学生课下和课后实习。

④对于作为必修课的专业,要在3个学分的课时中,进行不少于18个学时的上机和上网实验,对相应软件和数据库进行操作练习,并作为考核的重要内容。

(十一)学时数、学分数及学时数具体分配

学时数:54学时(必修)或36学时(选修)

分数:3学分(必修)或2学分(选修)

学时数具体分配:

(十二)教学方式

本课程采用多媒体教学与上机实习相结合的方式。主要强调利用各种公用的生物信息学资源进行上机实习过程的学习,集课堂教学、实践教学和网络教学为一体,教学环节包括课堂讲授、学生自学、上机实验以及期末考核。课程大部分内容的讲授需要采用多媒体课件或者网络机房进行教学,并实时演示相关软件操作和网络数据库检索流程等课程的重点内容。学生上机实习操作要保证学时和练习效果,上机前教师预先布置实验题目,上机实验结束学生提交实验报告。并完成教师布置的一定量的作业,加深学生对所学知识的理解、运用,进一步训练学生的实际操作能力。

(十三)考核方式和成绩记载说明

考核方式为考查。严格考核学生出勤情况,达到学籍管理规定的旷课量取消期末考查资格。

总评成绩:

平时成绩:50%(必修)或40%(选修);形式:作业与平时实验成绩;

期末成绩:40%(必修)或50%(选修);形式:论文(专题研究或文献综述等);

考勤提问:10%;形式:不定期点名。

实验成绩主要考查学生的实践动手操作能力和分析能力,平时作业可以分书面作业和电子版作业两种,后者主要是一些在线分析、数据库检索和软件应用的结果文件。期末主要考查学生理论知识的掌握情况和综合运用水平。对于少数在某些方面确有特长(如擅长编程或网页数据库制作维护等)的学生,可指定相关软件编写、数据库建设和生物资源类的网页设计等内容作为其课程设计任务,按时完成并达到预期设计目标的,经审核确认确为其本人独立(或者为主)完成,可以不进行期末考查,以课程设计任务成绩代替。

二 、讲授大纲

第一章  绪论(2学时)   

基本要求:

了解生物信息学兴起的主要原因。历数遗传学和基因组学领域中各里程碑事件及基因组测序技术的发展。理解生物信息学的基本概念和目前生物信息学中的各热点问题。掌握什么是生物信息学的研究对象和研究内容,以及几个重要的生物信息学资源和主要生物信息学工具。理解生物信息学的交叉学科和大科学特点。

重点:

1、生物信息学的定义、基本概念及其发展现状。

2、生物信息学研究的基本内容、基本原理与生物学基础。

3、计算机在生物学研究中的应用。

难点:

1、 信息的内涵。

2、 生物大分子序列和结构的信息功能。

3、  生物信息学的交叉学科和大科学特点。

主要内容:

生物信息学的兴起和发展背景,生物信息学的概念、主要内容、研究意义和学科特点,以及当前生物信息学所面临的巨大挑战等。

第二章  生物数据(2学时)

基本要求:

了解一般意义上的生物数据和现代的生物信息学数据的区别。了解从单克隆技术到全基因组鸟枪法测序技术的发展使得海量的基因组数据产生,以人类基因组为例,了解基因组注释的主要步骤和内容。遗传变异(如SNP)的概念、类型及发现方法。了解核糖核苷酸水平上基因表达的概念和非编码RNA在基因组中的多种类型。掌握表达序列标签的主要特点,学习表达序列标签对掌握基因组内各种特征信息的意义。理解高通量的蛋白质组和相互作用组产生的背景,对这些新兴的概念有比较深入的理解。熟悉生物信息学数据的采集来源。

重点:

1、理解如何对已测序的基因组数据进行注释和正确地进行基因预测。

2、掌握转录组的发现和基因表达谱的概念、单核苷酸多态性(SNPs)。

3、了解蛋白质序列和结构特点及其蕴含的信息。

难点:

1、如何从海量的基因组数据提取有用的信息是基因组序列数据分析的巨大挑战。

2、基因表达数据的分析。

3、蛋白质结构。

主要内容:

核心内容是介绍海量的生物信息学数据是如何产生的,以及这些数据的主要特点(具体包括:具有信息功能的生物大分子,基因组序列数据和基因组测序技术,遗传变异数据,转录组的基本概念及应用,基因表达谱的基本概念以及应用,EST以及EST的重要性,蛋白质组学的意义和对生物信息学提出的要求,蛋白质相互作用识别和预测的多种计算方法,生物通路,蛋白质二级、三级结构的数字化,常见非编码RNA,如tRNA,rRNA和miRNA等。生物信息学数据的实验室采集和网络数据库采集。

第三章  分子生物学数据库(3学时)   

基本要求:

了解几个注释较好的提供基因组浏览器的生物数据库资源(如NCBI,UCSC和EMBL等)其各自的特点及它们之间的联系。理解DNA序列的存储数据库(如GenBank,DDBJ,EMBL等)和蛋白质序列的存储数据库(如UniProt等)中一些关键序列号的意义和数据库内部结构的组织等。了解常用的公共基因表达数据库、表达序列标签数据库dbEST。掌握目前已有的蛋白质相互作用数据库,生物通路数据库和蛋白质结构数据库。能够根据自己问题出发找到感兴趣的蛋白质所涉及的相互作用,参与的生物通路和三维结构。

重点:

1、常用核酸和蛋白质序列和结构数据库的种类和内容。

2、数据库的格式和注释。

难点:

数据库构建、各种数据库包含数据的种类。

主要内容:

1、DNA、RNA与蛋白质序列数据库

2、蛋白质结构数据库、蛋白质分类数据库CATH与SCOP

3、基因与蛋白质表达数据库

4、蛋白质相互作用数据库

5、其他数据库

第四章  序列对齐和数据库检索(3学时)   

基本要求:

了解核酸序列比对的内容和相似序列的获得方法,掌握常用数据库的检索流程,理解序列比对和数据检索的原理和意义。

重点:

双序列比对

难点:

序列比对算法,多序列比对

主要内容:

序列比对相关的基本概念,序列相似性的评价方法,最优比对的确定—动态规划方法,比对结果的显著性分析,相似序列的启发式搜索—BLAST算法原理,BLAST 软件系列的使用,FASTA算法,多序列比对技术。

第五章  DNA序列分析(6学时)   

基本要求:

熟悉核酸序列分析和基因组分析的主要内容,掌握常用序列分析工具的使用,理解基因结构与DNA序列分析的生物学意义。

重点:

核酸序列分析的内容,序列分析工具的使用,以及基因结构与DNA序列分析的生物学意义。

难点:

通过序列对比,推测分子的同源性;全基因组比较结果的可视化,电子PCR。

主要内容:

DNA序列分析的意义,序列的预测与鉴定,核酸序列物理性质的计算,核酸序列的基本分析(分子质量、碱基组成、碱基分布、序列变换、限制酶切分析和克隆测序分析等),密码子指纹与密码子使用偏好性分析,电子基因定位分析,基因组测序与分析,表达序列标签(EST)分析,SNPs识别,可读框分析,真核生物基因的启动子分析及其他调控位点分析,DNA序列分析工具。

第六章  RNA序列分析(1学时)   

基本要求:

    了解RNA的信息功能、种类、序列特征、熟悉常见RNA二级结构和三级结构特征、了解二级结构预测的原理,掌握二级结构预测的方法和相关软件的使用。

重点:

    RNA的种类及其序列和结构特征

难点:

    RNA二级结构预测理论

主要内容:

RNA标纹识别和局部结构配对,RNA二级结构预测的理论和方法(如Zuker最小自由能算法或者遗传算法),RNA结构预测软件(如Unix平台的MFold和Windows平台的RNAStructure、RNAdraw)。

第七章  蛋白质序列分析和结构预测(6学时)   

基本要求:

了解蛋白质序列分析的主要内容,掌握蛋白质序列和结构分析工具的使用,熟悉蛋白质结构分类,理解蛋白质结构同源模建方法,了解蛋白质空间结构的预测手段。会利用工具和网络数据库进行简单的蛋白质二级结构预测,了解蛋白质三级结构预测,了解蛋白质组数据分析方法。

重点:

    蛋白质序列分析,蛋白质二级结构预测

难点:

蛋白质结构同源模建方法

主要内容:

1、多肽理化性质计算与预测(包括多肽分子量、等电点、电荷分布和酶切特征,多肽亲水性/疏水性分析与制图,多肽抗原位点分析等)

2、蛋白质家族与蛋白质分类(蛋白质家族与超家族,蛋白质分类的方法)

3、蛋白质序列模式和结构域模式分析

4、蛋白质结构预测与合理药物分子设计

5、蛋白质组数据分析及相关工具与资源

第八章  核酸和蛋白质序列的进化分析(4学时)   

基本要求:

    了解分子系统学(或分子进化)的有关概念和理论,理解系统发言模型建立的原理和方法,熟悉分子进化树的建立、分析,熟练掌握一种以上的系统发育分析软件的使用。

重点:

系统发育模型的组成、建立与分析,分子进化树的构建

难点:

构建进化树的原理和算法

主要内容:

1.分子系统发育概述

2.系统发育模型的组成、建立与分析

3. 建立分子进化树的方法与评估

4. 系统发育分析软件(MEGA, PAUP*, PHYLIP和Treeview等)

第九章  算法和语言(2学时)

基本要求:

    了解生物信息学与计算机编程的关系,了解一些生物信息学常用的计算方法和编程语言及数据库语言,了解生物信息学中的一些研究模型

重点:

    遗传算法、Perl语言与Bioperl、R语言、BioJava库

难点:

    隐马尔科夫模型(HMM)

主要内容:

生物信息学中的计算机技术,生物信息学中的计算方法,计算方法中的生物思想,遗传算法,Perl语言与Bioperl,R语言,BioJava库,生物信息学序列置标语言(BSML),遗传表达置标语言(GEML),隐马尔科夫模型(HMM),人工智能和人工神经网络,图论与生物信息学。

第十章  生物信息学资源、平台及其综合应用(4学时)   

基本要求:

    对生物信息学常用软件资源、网络在线分析资源、网络数据库资源有一个比较全面的总结,并了解有关资源整合和综合分析平台构建的知识。了解与生物有关的文献信息检索常识和技巧。

重点:

    Windows环境下的生物信息学软件(尤其是前述章节中没有涉及到、但比较重要和常用的软件,如一些分子生物学数据分析用软件、功能比较全面的综合性分析软件、生物学统计软件),生物信息学分析类网络资源,生物信息学学习类网络资源。

难点:

    生物信息学分析类网络资源,自建核酸和蛋白质序列分析平台

主要内容:

Windows环境下的生物信息学软件(前面章节所有软件小结和常用重要综合性生物信息学软件使用方法,如DNAStar、OMIGA, VectorNT suite, DNAMAN等),PCR引物和寡核苷酸探针设计(OLIGO6和PRIMER PREMIER 软件使用),遗传连锁的分析软件使用,Linux/Unix环境下的生物信息学软件,Macintosh环境下的生物信息学软件,一些通用的计算、统计和分析类软件介绍(如Matlab、SPSS等),生物信息学分析类网络资源,生物信息学学习类网络资源,资源的综合利用:自建核酸和蛋白质序列分析平台,相关实例分析。生物类信息检索和整理方法(包括相关常用软件介绍,如EndNote等)

第十一章  其他生物信息学领域和技术简介(3学时)   

基本要求:

了解生物信息学在基因芯片、药物设计和分子模拟等领域的应用和发展前景

重点:

基因差异表达的分析方法

难点:

聚类与分类及基因调控网络分析的方法,计算机辅助药物分子设计方法

主要内容:

1.Microarray基因表达数据分析

1.1基因表达数据分析概述

1.2差异表达分析

1.3聚类与分类

1.4基因调控网络分析

1.5基因表达数据分析相关工具与资源

2. 生物信息学与药物研究

2.1生物信息学在药物研究中的作用

2.2疾病相关基因的预测

2.3药物靶标的发现

2.4计算机辅助药物分子设计

3.分子模拟与分子动力学

红河学院《生物信息学》实验课程教学大纲

(一)课程名称:生物信息学

(二)所属实验室名称:

(三)实验教材及参考书:

生物信息学不仅是一门科学学科,更是一种重要的研究开发工具,《生物信息学》理论课程中很多内容需要进行操作实践才能实质性掌握运用,因此,在目前尚缺乏实验操作教材的前提下,自编操作实验教材和安排上机操作实验十分必要。一下教材仅供参考:

[1]《生物信息学方法与实践》,张成岗、贺福初编,科学出版社,20##年;

[2]《基因组数据分析手册》,胡松年、薛庆中编,浙江大学出版社,20##年;

[3]《基因表达序列标签( EST) 数据分析手册》,胡松年编,浙江大学出版社,2005 年。

(四)实验内容和目的:

结合理论课的学习,使学生熟练使用基因和蛋白质数据库的使用方法,掌握利用相关软件进行核酸序列和蛋白质序列的基本分析,提高学生用计算机进行基因和蛋白质分析的能力。

(五)考核方式:

实验成绩根据平时的实验表现、各个模块的作业成绩以及期末上机综合考查来评定,实验成绩按50%(必修)或40%(选修)比例计入课程总评成绩。实验报告或课后作业可以电子版和纸质版同时提交。

(六)实验环境:

硬件最低要求:PIII微型计算机,主频800MHZ以上,内存256MB以上,硬盘20G。每个学生每次上机实验使用一台计算机。能连接Internet(教育网要能连接国外有关的生物信息学数据库)。

软件:常用生物信息学软件,多媒体控制和网络教学软件。

(七)实验项目及安排

    以下实验项目分为必做和选做两种,必做题目在学期结束时必须完成;选做题目可以根据实际上课时间和学生个人差异进行灵活安排,或作为课程设计题目在假期中完成。总实验上机学时保持不变(18学时)。教学计划中未安排上机学时或者实际条件暂时不能满足时,可以安排学生课下完成相应实验。

实验一 常用分子生物学数据库类型、数据格式及检索

1、 实验目的

(1)掌握序列检索的操作方法;

(2)熟悉GenBank数据库序列格式及其主要字段的含义;

(3) 了解EBML数据库序列格式及其主要字段的含义;

(4) 熟悉GenBank数据库序列格式的FASTA序列格式显示与保存;

(5) 了解Entrez和SRS搜索引擎的异同;

(6)强化培养计算机操作能力和网络搜索能力。

2、 实验要求

(1)认真阅读和掌握和本实验相关的教材(或讲义)内容;

(2)有条理的进行每个步骤,出现问题和收获都要学会记录;教师注意了解学生计算机应用能力的个人差异;

(3)边操作边思考、记忆、比较,完成实验报告;

3、实验内容

(1)首先让学生自主性利用所知道的搜索引擎,搜索和浏览至少10个国外和至少5个国内生物信息学相关网站,并描述网站特征;

(2)下载各网站的代表性数据各10条(组)以上,并说明其生物学意义;

(3)使用Entrez 信息查询系统检索核酸序列BC060830 和NM_000230,连接提取该序列内容,阅读序列格式的解释,理解其含义;

(4)GenBank数据库序列格式的FASTA序列格式显示与保存;

(5)使用SRS信息查询系统检索核酸序列BC060830,连接提取该序列内容,阅读序列格式的解释,理解其含义;

(6)使用搜索引擎搜索下载DNAClub和BioEdit并正确安装。

实验二 生物序列的相似型搜索——Blast及其应用

1、 实验目的

了解BLAST及其子程序的原理和基本参数,熟练地应用网络平台和Linux计算平台进行本地BLAST序列比对(有条件的前提下),熟悉BLAST结果的格式和内容并能描述其主要意义,同时比较网上平台和本地平台的优缺点。

2、 实验要求

利用上一次实验下载的核酸和蛋白质序列,提交到NCBI或者其他拥有BLAST运算平台的网页上,观察其基本参数设定库文件类型,并得到计算结果;(条件许可时)在本地服务器上学会用formatdb格式化库文件,并输入BLAST命令进行计算,获得结果文件。熟悉并记住blast的每个步骤、每个子程序和重要结果参数。完成实验报告。

3、实验内容

(1)向网上BLAST服务器提交序列,进行blastp、blastn、blastx、tblastn、tblastx,得到匹配结果;

(2)本地使用BLAST,格式化库文件,输入命令行得到匹配结果(视条件选作);

(3)对结果文件进行简要描述,阐述生物学意义。

实验三 核酸序列的基本分析

1、 实验目的

(1)掌握已知或未知序列接受号的核酸序列检索的基本步骤;

(2)掌握使用BioEdit 软件进行核酸序列的基本分析;

(3)熟悉基于核酸序列比对分析的真核基因结构分析(内含子/外显子分析);

(4)熟悉密码子偏好性分析;

(5)了解基因的电子表达谱分析。

2、 实验要求

利用第一次实验下载安装的分析软件对前2次实验搜索得到的DNA序列进行一些核酸基本性质的分析,完成实验报告。

3、实验内容

(1)使用Entrez或SRS信息查询系统检索人瘦素 (leptin) 的mRNA、基因组DNA、外显子和5’调控区 (promoter) 等核酸序列,连接提取该序列内容,阅读序列格式的解释,理解其含义;

(2)使用BioEdit 软件对上述核酸序列进行分子质量、碱基组成、碱基分布、序列变换以及限制性酶切分析等基本分析,并从BioEdit 软件的“help”栏了解该软件的其它功能;

(3)使用BioEdit 软件对人瘦素 (leptin) 的mRNA序列进行可读框架(ORF)分析;

(4)应用CodonW对人瘦素 (leptin) 的mRNA序列进行密码子偏好性分析;

(5)使用NCBI查询系统进行人瘦素 (leptin) 的基因组序列分析和基因的电子表达谱分析;

(6)使用Blast2进行人瘦素 (leptin) mRNA序列与其外显子或基因组序列的比对分析。

实验四 蛋白质序列的基本分析

1、 实验目的

(1)掌握蛋白质序列检索的操作方法;

(2)熟悉蛋白质基本性质分析;

(3)熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测;

2、 实验要求

复习巩固对蛋白质序列数据的检索,进一步掌握BioEdit软件的使用,熟悉蛋白质在线分析平台的使用,加深对蛋白质基本性质的了解。

3、实验内容

(1)使用Entrez或SRS信息查询系统检索人脂联素 (adiponectin)蛋白质序列;

(2)使用BioEdit 软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析;

(3)使用在线分析平台ExPASy对上述蛋白质序列进行理化性质和结构域分析;

(3)对人脂联素蛋白质序列进行基于NCBI/Blast 软件的蛋白质同源性分析;

实验五 生物大分子结构分析与结构预测

1、 实验目的

(1)掌握常用大分子空间结构显示软件的使用方法;

(2)熟悉一些重要的结构预测软件的使用;

(3)理解大分子空间结构的数字表征和结构预测的原理;

(4)了解大分子结构数据库的种类、特点和检索方式。

2、 实验要求

复习数据库知识要点,了解生物大分子的结构特征,会用本地软件和在线工具显示分析大分子的三维空间结构;能熟练运用RNA二级结构预测软件,了解蛋白质结构预测的常用方法,通过实验加深理论课知识内容的理解和掌握。

3、实验内容

(1)从PDB上下载大分子结构文件(DNA、RNA、蛋白质、糖类各一种);

(2)分别用Rosmol和ViewLite等软件显示分析下载的分子结构;

(3)下载其中的RNA分子所对应的序列,用RNAStructure、RNAdraw等软件或者MFold在线分析工具对其二级结构进行预测,并与PDB中已有的实验结构进行比较;

(4)利用swiss-model对蛋白质序列进行三维结构预测(蛋白质序列可以选用实验四下载的人脂联素)。

实验六 核酸和蛋白质序列的进化分析

1、 实验目的

(1)熟悉构建分子系统发生树的基本过程,获得使用不同建树方法、建树材料和建树参数对建树结果影响的正确认识;

(2)掌握使用Clustalx进行序列多重比对的操作方法;

(3)掌握使用Phylip 软件构建系统发生树的操作方法。

(4)了解Mega等其他建树软件和TreeView等画树软件的使用。

2、 实验要求

提前需要复习巩固有关多重序列比对的知识内容并理解其原理。每个小组运用不同的建树方法和不同建树软件对同样一组序列进行分析以比较异同。布置课后选作实践题目:查找一些生物学意义明显的序列进行系统发育分析。

3、实验内容

(1)使用CLUSTALX软件对已知八条DNA序列进行多重序列比对;

(2)使用PHYLIP 软件包构建上述DNA分子系统发生树,并以TreeView观察结果,比较不同参数设置得到的结果是否有差异;

(3)用其他建树软件对同样的序列进行分析,比较差异。

实验七 使用Oligo和PrimerPremier软件设计PCR引物

1、 实验目的

(1)掌握引物设计的基本要求,并熟悉使用Primer premier软件进行引物搜索。

(2)掌握使用软件oligo对设计的引物进行评价分析。

2、 实验要求

事先熟悉引物设计原则(属于分子生物学课程内容)。

3、实验内容

(1)使用Primer premier软件进行人瘦素 (leptin) mRNA引物的设计。

(2)使用oligo对引物进行评价分析。

(3)总结引物设计应该注意的关键事项。

实验八 基因组分析——以EST为例

1、 实验目的

熟悉使用一系列生物信息学分析工具对测序得到的ESTs序列数据进行聚类处理,由此对获得表达基因的丰度等相关信息,并且对这些表达基因进行功能的初步诠释,为后续实验通过设计RACE引物获得全长基因,以及进一步的功能注释和代谢途径分析做好准备。

2、 实验要求

事先熟悉引物设计原则(属于分子生物学课程内容)。

3、实验内容

(1)下载200条FASTA格式的EST序列;

(2)使用Staden Package(pregap4)对这些EST序列进行前处理,去除载体和引物成分并拼接;

(3)使用Staden Package(gap4)显示所提取的congtig和singlet。

对比内容(给学有余力的学生选作):

(1)运行crossmatch程序,并用perl程序处理结果获得ESTs序列;

(2)运行phrap程序,并用perl程序提取congtig和singlet;

(3)运行blastn和blastx程序,用perl程序分别获得cluster和初步功能注释结果。

实验九 Microarray基因表达数据分析

1、 实验目的

    了解基因芯片数据分析的软件和网络资源,了解一种分析软件的使用方法。

2、 实验要求

熟悉相关软件和网络资源的使用步骤及结果表示,领会其生物学意义。

3、实验内容

(1)在网络数据库中搜索有关芯片表达的数据

(2)用dChip分析芯片数据;

(3)用R语言和Bioconduct包分析芯片数据;

(3)用Genespring对芯片数据进行聚类分析。

(以上2-4步任选一个进行)

备选内容:

1、了解Emboss工具包中的各软件功能,会用Emboss中的分析工具分析序列的相关特征,熟悉Emboss工具包中常用应用软件的使用,并能用这些软件进行简单的序列分析。

2、了解DNAStar、VectorNT、GCG等综合性生物信息学软件的使用方法和主要功能。

3、国内外有关生物信息学文献的查找和评价;EndNote软件的使用方法。

4、有关软件(SPSS、EXCEL、Origin、MatLab)简介。

5、生物信息学在线服务小结。

相关推荐