前段時間,有用戶咨詢過配合力試驗數據缺區怎么處理的問題,在此簡單梳理一下思路,備忘。
上圖中是一個NCⅡ配合力試驗,父本5個,母本4個,區組3個,每區組1個觀測值。A1B1組合在區組3的觀測值缺失1個。
缺區估計法、平均值填入法,都是“補齊”數據的策略,由于對后續數據分析有影響,因此不建議采用。
線性混合模型用于配合力缺區分析,本質上跟本文給出的方法是一樣的,但是,由于矩陣求逆等計算的中間誤差或者迭代誤差,計算結果準確性會略差,甚至方程組無解。往白里說就是,一些平均數可以直接計算得出,而不是非要去解線性方程組,結果可能反而算不出來了。
下面是針對方差分析缺區情況博思公司給出的應對參考建議,對配合力試驗缺區情況同樣適用(配合力試驗也需要進行方差分析)。
博思公司提出的方差分析缺區情況應對參考建議
1、缺區,并沒有影響試驗材料的客觀試驗表現,需要進行相應的平方和和自由度計算調整。
2、缺幾個自由度就減幾個,平方和采用累加的思路,缺了就不加,跟未缺區的時候一樣分析,試驗分析參數進行對應調整。
3、如果缺區導致試驗中某效應的平均數無法計算,那就不能進行方差分析,這可以作為缺區情況下是否能夠進行方差分析的一個判斷依據。
4、F分布要求遵循正態分布,個別數據缺失,可以理解為對分布沒有影響。如果數據缺失嚴重,就不要進行方差分析,F測驗了,直接進行品種平均數大小排序即可。
5、如果考慮采用缺區估計方式填值處理,應在試驗數據缺區未影響到效應的平均數計算的情況下進行,否則不宜采用估計方式。
6、后續進行的多重比較,采用試驗中真實獲得的品種平均數。
數據具體分析:
缺失的數據,對如下平均數的計算有影響。
- 總平均
- A1B1的平均數
- A1的平均數
- B1的平均數
- 區組3的平均數
所以在計算這5個平均數的時候進行調整即可。就是分母多減去1.
線性混合模型構建計算矩陣,采用0和1來標注是否有觀測值。所以其對缺區的處理道理是一樣的。
圖中給出的計算結果,
A1B1的平均數是30=(31+29)÷2
A1B2的平均數是26=(27+25+26)÷3
專業的育種信息化研發團隊,提供給客戶的不僅是產品,更有強大而專業的技術服務保障。如你在育種數據分析、育種標簽打印方面有困惑,或有育種數據管理、育種標簽需求,歡迎聯系我們。
免責聲明
- 凡本網注明“來源:化工儀器網”的所有作品,均為浙江興旺寶明通網絡有限公司-化工儀器網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:化工儀器網”。違反上述聲明者,本網將追究其相關法律責任。
- 本網轉載并注明自其他來源(非化工儀器網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
- 如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。