参考論文
論文内でのIBSおよびIBDの定義
- identity-by-state (IBS)は、均一の集団の中で個体同士を比較し、最も似ていない個体を同定するために用いる。
- identity-by-descent (IBD)は、個体同士を比較し、最も似ている個体を同定するために用いる。
PLINKではidentity-by-state (IBS) の距離に基づいて凝集型完全連結クラスタリングを実行する。
1. IBS クラスタリング
- コマンド
plink --file mydata --pheno pheno.txt --geno 0.05 --maf 0.05 --hwe 0.001 --cluster
- アウトプット
- plink.cluster0:クラスタリングプロセスの情報を含むファイル。無視して良い。
- plink.cluster1:1行につき1クラスターに含まれるサンプルを表示。
- plink.cluster2:1行につき1サンプルのクラスタリング結果を表示。
- plink.cluster3:1行につき1サンプルと全サンプルとの対応結果を表示。
2. IBS/IBD推定
- http://pngu.mgh.harvard.edu/~purcell/plink/ibdibs.shtml#genome
とても似ているサンプル同士を明らかにするため、ランダムサンプルのペアから推定されるIBDより高いペアを同定する。
- コマンド
plink --file mydata --genome
- アウトプット
- plink.genome
- フォーマット
#1 FID1 Family ID for first individual #2 IID1 Individual ID for first individual #3 FID2 Family ID for second individual #4 IID2 Individual ID for second individual #5 RT Relationship type given PED file #6 EZ Expected IBD sharing given PED file #7 Z0 P(IBD=0) #8 Z1 P(IBD=1) #9 Z2 P(IBD=2) #10 PI_HAT P(IBD=2)+0.5*P(IBD=1) ( proportion IBD ) #11 PHE Pairwise phenotypic code (1,0,-1 = AA, AU and UU pairs) #12 DST IBS distance (IBS2 + 0.5*IBS1) / ( N SNP pairs ) #13 PPC IBS binomial test #14 RATIO Of HETHET : IBS 0 SNPs (expected value is 2)
- 集団のPI_HATの平均を別途求めて比較する。
- 評価の仕方(追記:Proportion IBDのこと)
- PI_HAT=1:同一人物か一卵性双生児
- PI_HAT=0.5:第一度近親者(親、子、兄弟、姉妹)
- PI_HAT=0.25:第二度近親者(おじ、おば、おい、めい、祖父、祖母、孫)
- PI_HAT=0.125:第三度近親者(いとこ等)
- 一般的にはPI_HAT > 0.1875を示すペアのうち1サンプルを取り除く。
cat plink.genome | awk '{if($10>0.1875) print $0}'
3. 近交係数の推定
集団内で祖先ジェノタイプを多く持つ(血が濃い)個体がいるかを検討する。
ホモ接合ジェノタイプの予測値と実測値から近交係数を算出する。
ホモ接合ジェノタイプの予測値と実測値から近交係数を算出する。
- コマンド
plink --file mydata --het
- アウトプット
- plink.het
0 コメント:
コメントを投稿