实验室与团队介绍

ABOUT US

实验室简介

    21世纪是生命科学的世纪,现代医学正迅速走向精准化和智能化时代。大数据分析、生物信息、基因组测序、人工智能等技术结合发展为智能精准医学提供坚实的数据基础和高效的技术手段。生物、医学、临床大数据的整合、注释、分析、挖掘和应用是精准医学研究链条中不可或缺的重要环节。随着PB量级基因组学数据的产生和积累,以生命组学为基础的医学研究同时具有数据密集型和计算密集型特性,必须依托大规模计算和存储平台来实现。我们的研究兴趣正是基于生物医学大数据,用生物信息、大数据和人工智能等手段,开发新型算法,整合、注释、挖掘大数据,构建大数据库群,建立智能软件系统和应用大平台,支撑精准医学的研究和精准医疗的发展。

团队介绍

    李伟忠课题组面向精准医学的需要,利用分布式网络大平台、大型数据库群、大数据深度学习等技术手段,主要研究生物大数据分析大平台、生物信息工具与软件流开发、数据知识库构建、生物医学大数据的快速精确检索与深度智能挖掘等。曾设计和实施欧洲生物信息研究所以大数据高性能计算为基础的核心生物信息分析大平台;建立了全球最完整的生物专利序列数据库;创新性设计开发的蛋白精确迭代检索引擎 PSI-Search,新版软件的精确度超过著名同类软件NCBI PSI-BLAST的近20倍。深度参与国际重大生物信息项目,如国际蛋白数据库 UniProt、国际核酸数据库 ENA/GenBank、基因组数据库 Ensembl Genomes、多序列比对工具 Clustal Omega、大分子功能注释工具InterProScan 等,为世界范围的生物医学大数据建设和共享作出了积极贡献。

研究方向

RESEARCH DIRECTION

研究方向

  • 精准医学大数据的有效挖掘与关键信息技术研发:针对多种重大疾病的精准医学大数据,研究生命组学大数据有效挖掘的方法技术的集成化和标准化,研发面向科研应用的个性化定制式处理流程系统和面向临床诊疗应用的规范化高效可靠分析解读方案,建立科研应用到临床诊疗的全链条一体化技术方法体系。
  • 精准医学大数据的整合与注释:在天河2号超算、高性能计算和云平台上实现PB量级临床和疾病组学数据的标准化整合功能注解,形成面向疾病解读得数据库和软件,开发大型软件流和构建大型数据库群。
  • 人工智能在生命组学数据和医学影像数据的应用研究:面向疾病组学数据和医学影像数据,利用深度学习算法,开发新型的方法和工具,寻找组学数据、影像数据与疾病的关联,基于组学和影像数据智能预测预警疾病。
  • 面向无拼接组装的基因组学大数据的反向检索与精确检索算法与工具:如对包括临床组学大数据的压缩化索引和精确检索及其注解的快速搜索,涉及HADOOP和Spark等大数据技术的应用。
  • 精准医学大数据的可视化高级应用:涉及精准医学数据的可视化描述、工具的网络应用(APIs)、门户(portal)的实现等。

项目资助

  • 主持2016年国家重点研发计划(精准医学重点专项)课题“精准医学大数据的整合与注释”(500万,2016-2020年);
  • 2019年国家重点研发计划(精准医学重点专项)项目“精准医学大数据的有效挖掘与关键信息技术研发”;
  • 主持2018年申请的国家自然科学基金面上项目;
  • 2016年中山大学百人计划;

近期活动

ACHIEVEMENT

近期活动

  • 实验室在GPB杂志发表文章"MicroPhenoDB Associates Metagenomic Data with Pathogenic Microbes, Microbial Core Genes, and Human Disease Phenotypes" (2021) Download...

  • 实验室在JMB杂志发表文章"ncRNAVar: A Manually Curated Database for Identification of Noncoding RNA Variants Associated with Human Diseases" (2020) Download...

  • 实验室在RNA Biology杂志发表"ncRPheno: a comprehensive database platform for identification and validation of disease related noncoding RNAs" (2020 Mar) Download...

  • 实验室在DATABASE杂志发表文章"Combined alignments of sequences and domains characterize unknown proteins with remotely related protein search PSISearch2D" (2019 Jun) Download...

  • details: Yang,M., Zhang,W., Yao,G. et al. Combined alignments of sequences and domains characterize unknown proteins with remotely related protein search PSISearch2D. Database (2019) Vol. 2019:article ID baz092;

  • 实验室在 Briefings in Bioinformatics杂志发表文章“Computational resources associating diseases with genotypes, phenotypes and exposures.”(2018 Aug) Download...

加入我们

JOIN US

最新招聘

最新进展

LATEST DEVELOPMENTS