GEWS指标。动物数据中,对于大部分性状,一个个体只有一个观测值,直接用表型值进行后续的分析即可,对于纵向数据比如不同胎次的产仔数,不同时期的剪毛量,对于一般的GLM模型,MLM模型,需要用平均值或者BLUE值作为表型值。
整体而言,BLUP值会想均值收缩shrinkage, 虽然结果是最佳预测, 但是校正值的方差变小, 当你做GWAS时, 不容易找到显著性位点,增加了噪音noise,而且在GWAS中,品种是作为随机因子,如果你使用BLUP值,相当于进行了两次收缩shrinkage。
因此, 比较好的方式是,在one-stage中,将地点,年份,区组作为随机因子,将品种作为固定因子,计算BLUE值。
这些可以通过判断数据的类型,R中的str函数,如果一列数据判断为了字符,那就需要注意下是否有数字编码错误。
另外,就是进行汇总统计,看一下最大值,最小值,平均值,中位数,看一下数据的分布是否正常,对于小数点标错,可以更正的更正一下,对于数据异常,可以找一下原始的数据记录,确认一下数据是否录入错误。