【佳学基因检测】腋下有味道就是狐臭吗?基因解码是怎样提高狐臭基因检测的正确性的?
采用汇总统计学数据,计算狐臭的微效多基因相互作用
佳学基因采用分析表达式,利用多中心汇总统计学数据进行狐臭相关的基因信息分析,以建立基因型与表型的相关性。下图展示了汇总统计学分析、常规GWAS分析以及个体水平PrediXcan的区别。
GWAS、PrediXcan和S-PrediXcan之间的比较。上半部分是比较GWAS、PrediXcan和Summary PrediXcan。GWAS和PrediXcan均以基因型和表型数据作为输入。GWAS使用模型Y=a+Xlb+ϵ计算Y对Xl的回归系数,其中Y是表型,Xl是个体SNP剂量。狐臭的分析计算结果SNP水平上的结果。相反,PrediXcan首先通过输入对转组的预测/和注释结果。然后计算狐臭表型Y与每个基因表达预测Tg的回归系数。计算的结果是基因表达水平的结果。Summary PrediXcan使用GWAS的输出直接计算基因水平关联结果。本图表的下半部分显示了使用汇总统计计算PrediXcan基因水平关联结果的算法。给出了佳学基因在基因解码过程中采用的不同输入数据。计算分析得到的基因型与表型关系进入狐臭基因检测的报告分析系统,形成不同基因的权重系数来源。佳学基因的深度人工智能算法通常是以千人基因组计划数据作为概念形成和模型模拟出发点,通过已知结论的明确数据来检验和校正算法,获得用于计算预测表达水平所需要的方差和协方差(LD结构)系数。参考集和训练集值都经过预计算整合进人工智能基因解码系统,只需提供基因检测、测序、分型结果数据集,就可以得出基因信息的破解结果。
佳学基因解码研究发现PrediXcan和S-PrediXcan结果之间的高度一致性表明,在大多数情况下,佳学基因及其合作研究机构可以使用汇总结果数据而不损害基因型与表型相关性的检出和描述能力。在下面的例子中,基因解码分析了一种人体细胞及两种人体生理过程(包括狐臭)的PrediXcan和S-PrediXcan Z评分的比较。分析的人群含非洲、东亚和欧洲亚群。在所有情况下,训练集(其中训练预测模型)都是欧洲的(DGN Cohort5)。PrediXcan和S-PrediXcan之间的高度相关性证明了佳学基因所采用的方法对参考数据集和研究数据集之间匹配与不匹配正确性。尽管汇总法和个体水平法之间的一致性较好,但仍有少数假阳性结果,S-PrediXcan比PrediXcan更显著。这说明了采用S-PrediXcan达到了提高正确度的目的,而尽可能使用紧密匹配的LD信息会进一步提升智能分析结果。
佳学基因比较PrediXcan和S-PrediXcan采用模拟数据和真实难数据的结果。该图显示了在不考虑遗传因素、无假设下模拟表型任务要求下的采用PrediXcan算法与S-PrediXcan的比较;细胞内在生长力、双相情感障碍、人体味影响因子的人工智能多因子算法。基因表达预测模型基于已发表的DGN数据集。在模拟分析中,采用了探索研究组(GWAS集)和参考集(LD计算集),原始数据由来自千人基因组1000基因组项目中的非洲(661)、东亚(504)和欧洲(503)个体基因型分型数据组成。当同一研究集用作参考集时,佳学基因可以获得获得了高相关性(确定系数):r2 > 0.99999. 对于细胞内在生长力,研究集是来自1000基因组项目的非洲、亚洲和欧洲各群体的140个个体的子集。参考集与模拟表型相同。对于疾病表型,研究集由英国个体组成,LD计算集是1000基因组项目的欧洲人群子集。
(责任编辑:佳学基因)