如今,大量生物学数据的产生使得我们对提高信息管理和获取其含义提出挑战。越来越先进的技术能够在一个实验中产生百万计的原始数据:新一代测序、微阵列、SNP芯片、MALDI等;更大的挑战是试图结合不同的实验结果,去解决更复杂的问题,提高对基础生物学的认识。
BioNumerics是目前生物数据建库和比较分析中Z完整、大的解决方案,该软件作为生物学研究工具已经得到了全世界的认可,并已被数以万计的研究论文引用,广泛地应用于医院和公共卫生ZX、食品、检验检疫、高校、药品和制药行业。
BioNumerics7.0介绍1. 模块调整:取消单独的数据库共享模块,使其成为标准配置;新增全基因组图谱模块和基因组分析工具模块;矩阵类型模块并入特征类型模块;染色体比对和注释模块并入基因组分析工具模块;分子分析工具模块并入序列类型模块。
2、软件性能升级:新增了类似Google的搜索窗口,可以迅速检索实验。增加了直接从微软Excel文件导入数据的功能。更快地电泳图处理能力,软件分析实验数据时间缩短30%以上。数据库容量达到10GB,使用默认的微软SQL Express 数据库引擎。更加友好的人机界面,更多快捷工具,改进了在线帮助功能。通过向导帮助导入不同类型的数据或数据源,可以更好地控制数据更新。Z重要的,软件的总体性能被极大提高,可以更快速、更灵敏地处理大批量数据。
3、分析功能更加强大:支持导入和分析各种类型的光谱数据,使光谱数据综合处理、总结和分析成为可能(例如:MALDI-TOF, LCMS和ESI图谱)。改进的指纹曲线处理(Fingerprint Curve Processing)窗口,能更快的预处理,更可靠的标准化处理多通道毛细管电泳数据。新的序列读取集(sequence read sets)数据类型为分析Next-Gen测序读取集提供了一个完整的软件环境,新的基因组分析工具模块可以进行更深入的宏基因组研究。新的全基因组图谱模块被用来分析高分辨率有序全基因组限制图谱,能够提供高度细节化的菌株信息,主要应用于(流行病学的)菌株分型和特征描述上。的运算法基于相似值、数字数据、二进制数据或分类数据矩阵,广泛的参数优化和交叉验证。
目前,BioNumerics平台是几乎所有生物数据综合分析的模块化软件,提供5大应用模块和5大分析模块,各模块可以任意组合配置以符合各种研究需求。
APPLICATION MODULES 应用模块 Fingerprint Types 指纹类型可以对凝胶图谱、自动测序仪数据、实验芯片系统的电泳指纹图谱等进行标准化处理和分析,如PFGE、MALDI光谱数据的预处理和分析;同时该模块也被应用于AFLP、RFLP、RAPD、REP-PCR、ARDRA、IEF、DGGE、TGGE等技术方法和实验数据分析中。用户可以创建一个凝胶电泳(PFGE)实验类型,根据实验需求设定biomark,标记分子量,自动搜索条带,进行条带相似度的设置,相似系数和聚类分析等。模块一个重要的创新是可以根据参考系统对条带的位置,图像进行即时的标准化处理,可以自动把参考系统的参考值映射到其它任何图谱上。这样,在不同条件下用不同的参考标记生成的图像,把它们放在一起显示,条带可以地匹配在一起。
Character Types 特征类型用特征字符型数据,用户可以定义任何特征字符;利用矩阵类型数据,可以导入外部的相似矩阵或距离矩阵。在多位点VNTR分析(MLVA)中,该模块提供了自动化的分析流程;特征类型的例子还包括脂肪酸数据矩阵,代谢消化或酶活性检测,包括抗生素耐药谱、API、Biolog、Vitek、形态学和生化特性、微阵列和基因芯片等。BioNumerics里面的特征字符型数据的大小可以是单个特征,也可以是基因芯片试验的成千上万的基因表达值。矩阵可以和BioNumerics里的其它数据库的记录相连,从而关联起来得到用户想要的分类和鉴定,此种数据的典型例子是DNA同源性相似度的表格。
Sequence Types 序列类型用户可以输入核酸和氨基酸序列,组合和分析Sanger序列数据和NGS序列读取,使用各种各样的序列分析、搜索和校准及比较工具;基于核酸序列的测定,该模块常用于多位点序列分型(multilocus sequence typing,MLST)中;Bionumerics可以广泛的识别各种序列格式,包括EMBL、GenBank和Fasta格式。它整合了对成千上万的长度不限的核苷酸或蛋白序列的多序列比对,并能显示同源矩阵。用户能够根据自己的需求设定特定的比对的参数;同时可以对根据多序列比对产生的系统发生树进行人工的修改,或对特定的部分序列构建树。这个模块的功能包含了分子分析工具模块,能够进行开放读码框架分析,预测蛋白序列;限制性酶切分析,引物设计等。
Whole Genome Map Types 全基因组图谱类型聚类全基因图谱用于菌株的鉴定和分类。可以对流行病学菌种分型和特征进行全基因组图谱(OpGen, Inc.)的快速可视化聚类,分析高分辨率有序全基因组限制性图谱,要求全基因限制图谱从单个的微生物DNA分子中获得Argus™全基因图谱系统。由于全基因组图谱提供了非常详细的菌株信息,它很适合区分高度相关的菌株(例如:爆发)。因此,BioNumerics中全基因组图谱数据分析主要用于细菌分型和特征描述。
Trend Data Types 趋势数据类型在代谢及酶活性的动力学分析、生长曲线、实时PCR或者用微阵列做的时间过程实验中,虽然一个实验有多个输入大部分是以时间为方程做的,但是它们也可能基于其它的参数,比如基于不同浓度的方程。该模块提供了十二种不同的曲线拟合模型,基于这些模型,可以推出特异的参数,也可以用于分析及比较。用户也可以加入自己的参数比如统计参数、斜率及在某一固定X的值等。
ANALYSIS MODULES分析模块 Tree and Network Inference 聚类分析和建树自计算技术应用到生物学领域以来,聚类分析被广泛的用在分类、筛选、定型和流行病学中。在BioNumerics中通过组合关系数据库的各种理念,把多种实验关联在一起,并有多种有效的聚类算法。其中组合聚类可以通过选择不同的实验组合来实现,并应用各种不同的方法得到组合的系统树图。基于每个实验得到的信息量,相似度可以采用单个实验得来的值并用用户定义或程序算出的权重进行均分;增量聚类分析,内置的增量聚类算法可以允许在已有的系统树图里粘贴大批量的记录,或者删除大批量的记录,而不用重新计算,这个方法可让我们进行横向的聚类,得到一个同时把数据记录及特征进行聚类的综合视图,以便让用户方便地找到判定并区分几组相关数据库记录的特征。
Dimensioning and Matrix Mining 多维技术和矩阵类型在多维聚类分析技术中,本系统可以把数据库中的记录按两维或多维空间进行聚类分析,而不只是等级的或者像系统树一样的聚类结构。这些技术包括:主成分分析(PCA),多向度度量法(MDS)。BioNumerics的一个创新的特征之一是可以根据系统树图的关系连接到空间分散的记录上去,这样不仅可以轻松的比较两种分组方法,而且可以帮助用户更加深入的理解不同的分类组之间的关系;判别分析,可以帮助发现不同的数据库记录或特征分组结果的关系,而且计算这些分组的统计学的显著性水平。该模块提供了大量生物统计分析工具,可以进行chi-square test、T-test、Wilcoxon signed-ranks test、Kruskal-Wallis test、ANOVA、Pearson correlation test、Spearmann rank-order test,并具有作图功能。
Genome Analysis Tools 基因组分析工具基因组分析工具模块提供基因组和染色体的平行比较分析,分析基因组的组织功能特性,染色体多重比对分析和染色体SNP位点分析。它整合宏基因组分析和染色体对比及注释工具,进行微生物宏基因组多样性分析;基于高通量测序的分类学标记基因,为描绘细菌群落提供了宏基因组工具。BioNumerics使用的是Kodon软件中获取经过严格验证的技术,运用其各种专门的基因组比对和分析功能。同时,染色体对比和注释工具包含在此模块中。
Classifiers and Identification 分类和鉴定运用级的分类鉴定方法对未知物种进行鉴定,如Naive Bayesian, SVM, Shrunken Centroids等。根据不同的实验来鉴定未知的生物体也是BioNumerics的进步之一,这个鉴定方法是建立在文库基础上的,对未知生物体或物种的鉴定是根据其与已知文库中的其它的已有库单位的相似性来决定的,在聚类分析中用到的对相似性范围和距离的定义也可以在这里应用;同时,通过对不同的数据集的已知或者未知数据记录的共评价也将得到一个更加可靠的一致性的鉴定。
Versioning & Audit Trails 审计与跟踪管理记录所有数据库项目的更改、用户登录、导出XML报告、数字化签名等。创建审计数据库(尤其是满足FDA21CFR Part11规范要求)记录所有的变化,并保持所有版本的选定的数据库对象,比较和还原版本,记录用户活动,创建数字签名权限。
资料下载:
brochure_bn.pdf
附件下载 (下载 55 次)
请 [登录] 后再下载!