【佳学基因检测】存在显性的情况下,相较于加法模型,显性模型在评估平均效应的优势
人体疾病与表征遗传方式导读:
数量遗传学是佳学基因解码的方法之一。在数量遗传学中,单个基因座的平均效应可以通过 (A)加性模型或加性加显性 (AD) 模型来估计。在存在显性的情况下,AD 模型预计会更正确,因为 A 模型错误地假设残差是独立且同分布的。佳学基因解码的目的是在存在显性遗传的情况下,使用单个基因座 A 模型或 AD 模型,评估平均效应 (
基因解码遗传模式的建模方式
在佳学基因开发的基因解码的系列分析方法中,数量遗传学是其基本工具之一。在数量遗传学中,显性是杂合子的基因型值偏离两个纯合子的平均基因型值的现象。显性遗传已被证明存在于人体、牲畜物种和植物作物的性状、表征和生理特征的遗传方式中。并且在分析人体的疾病的致病基因中发挥了重要作用。然而,在家畜遗传改良中,研究一直集中在平均效应的估计上,因为平均效应涵盖了所有可遗传的变异。单个基因的平均效应 ( α ),也称为等位基因替代效应,是指基因型值对等位基因计数的线性回归系数。在 Hardy-Weinberg 平衡 (HWE) 下,双等位基因座处的α是基因效应的加法 ( a ) 和显性 ( d ) 部分以及种群等位基因频率p的函数:
其中a是两个纯合子之间基因型值差异的一半,d是杂合子的基因型值与两个纯合子的平均基因型值之间的差异。使用基因组数据,加性 (A) 模型通过等位基因计数(即基因型)的表型线性回归来估计α 。加性加显性 (AD) 模型分别估计加性和显性基因效应,之后
当使用 A 模型时,优势偏差没有被建模,因此成为残差的一部分。因此,残差不是独立同分布 (IID),因为不同基因型的显性偏差不同。因此,A 模型可能会给出不正确的α估计值,因为它错误地假设残差是 IID。当使用 AD 模型时,优势偏差被显式建模,残差更可能是 IID。因此,在存在显性遗传的情况下,AD 模型可能会比A型产生更正确的α估计值。然而,与 A 模型相比,AD 模型需要估计两种效应而不是一种效应(对于单个位点),这可能会降低估计这些效应的正确性。此外,显性效应通常比加性效应更小,因此更难估计。由于这些原因,与 A 模型相比,AD 模型可能需要对更多个体进行采样才能正确估计α。此外,在显性很少或没有显性的情况下估计显性效应可能会导致过度拟合。因此,虽然 AD 模型可能在存在显性的情况下更好地拟合数据,但当样本量相对较小且优势可以忽略不计时,A 模型可能是先进。然而,尚不清楚样本大小和显性效应在优势效应大小使用 A 模型与AD 模型如何影响
因此,佳学基因设立该研究课题的目的是在存在或不存在显性遗传效应的情况下、在单个位点使用 A 模型或 AD 模型调查估计的均方根误差 (RMSE)
与此内容相近的 业内研究文献:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5633389/