2011-09-01から1ヶ月間の記事一覧

遺伝率について

遺伝率ごとの検出力。0.68まではポジコンとしていけるのかもしれない。ポジコンとしていけるということはつまり、ある条件下なら、遺伝率が0.7以上のフェノタイプについて常に解析ができるということ。しかし、ポジコンの条件を決める際は、遺伝率は0.9で固…

ポジコン・ネガコン

・ポジコンはリスク=±exp(-アレル頻度)にしてみる。 ・意味としては、頻度が低いほどリスクが高い。 ・今、アレル頻度によってリスクを決めているので、アレル頻度の分布自体は結果にあまりかかわらない。アレル頻度が高いものが増えると、リスク0のものが…

(400,rexp(N,60),rnorm(N,0,1),10〜2)

0/1× MST[0,0,7,6,8](400,rexp(N,60),abs(rnorm)) 0/1× MST[18,2,0,0,0](400,rexp(N,60),exp(-40*af)*sign(rnorm(N, mean=0, sd=1))) 0/1× MST[0,0,2,5,13] afはアレル頻度(400,rexp(N,60),rnorm(N,0,exp(-40*af))) 0/1× MST[0,0,10,6,4]

(400,rexp(N,60),sign(rnorm),10〜2)

0/1×(有意な結果は得られなかった。) MST[0,0,10,4,6] 上のほうに数値が出なかったら、5段階でかく。(400,rexp(N,60),+1) 0/1× MST[20,0,0,0,0] 常に高い。 ここまで極端だと何かおかしい気がする。考えてみる。アレル頻度をrexp(N,60)としているのは、こ…

結果の書き方

0/1のほうは、 パラメータ(バリアントの数,アレル頻度,リスク,閾値) 結果は[有意に上、間、有意に下]遺伝率は常に0.5で。それに環境要因(適当な正規分布)をランダムに加える。という感じで結果を書いておくことにする。 閾値は上位10〜2%について0.5%刻…

0/1、MST

P2<-sr*sdfrac+rnorm(Npt,sd=sqrt(var(P))*(1-sdfrac)) というところがあって、多分これは遺伝率を考えるためのものだと思うので、加えてみる。 N<-200 #バリアントの数 i HN<-100000 #人数 j #アレル頻度 al<-matrix(0,HN,N) #持っているアレル aa<-60.0 #…

これからやること

最小全域木の考え方のほうのプログラムを、いままで作ってきたほうと一緒に動くようにする。 主要ハプロタイプのところはリスク0で考えているので、とりあえず除いて考える。MSTのほうはぼんやりとしかイメージをもてていないが、なるべくそのままがんば…

集中検定2

リスクをアレルと独立にしてみたら、ケースとコントロールの重みの分散の差は、1000だったり0だったりー1000だったり、ばらばらというかランダムな数が出た。時々、分散の差が(適当に選んだ100人と100人の差)、すべてほとんど0になるときがある。…

パーミュテーションテスト

パーミュテーションテストには、全部調べる方法と、ランダムに選んで分布を推定する方法があり、シミュレーションではランダムパーミュテーションを使おうと思う。集中検定だと、アレル頻度の逆数を重みとして、その分散の、ケースとコントロールとの差が、…

集中検定

N<-100 #バリアントの数 i HN<-10000 #人数 j #アレル頻度 al<-matrix(0,HN,N) #持っているアレル aa<-5.0 #アレル頻度パラメータ af<-rexp(N,aa) #アレル頻度を与える #リスク sr<-numeric(HN) #リスクの合計点 ir<-matrix(0,HN,N) #個人の各アレルのリスク…

アレル頻度発生ソース

N<-40 p<-0.001 #変異率 T<-80 #時間 Npt<-80 #試行回数 K<-10 #最初の変異アレルの本数 jun<-array(0,c(2,N,2)) for(i in 1:2) for (j in 1:N) jun[i,j,]<-c(i,j) sme<-matrix(0,T,Npt) #時間t、nパターン目におけるアレル頻度 for (we in 1:Npt){ Gpa<-mat…

N人2N本の中に変異を1本入れたときの変異の頻度の推移のシミュレーション

N<-100 p<-0.0001 #変異率 T<-20 #時間 Npt<-100 #試行回数 sme<-matrix(0,T,Npt) #時間t、nパターン目におけるアレル頻度 for (we in 1:Npt){ Gpa<-matrix(0,2,N) #親ゲノム Gpa[1,1]<-1 Gch<-matrix(0,2,N) #子ゲノム Gse<-matrix(0,2,N) #子がどの親から…

ここから何をするか

中立の場合について、時間がたつとどんな感じになるかシュミレーションして、あるtで切って頻度の分布を作って、それが人数によってどう代わるか調べて、expで近似してみる。アレル頻度が何なのかわからなくなってきた。。。 というかなんとなくSNPについて…

アレル頻度について

http://www.ncbi.nlm.nih.gov/pubmed/11404818 アレル頻度をもっともらしいものにしたいと思ったので調べていると、この論文の127PのWright's formulaが使えるかもしれない。ただ、2つのアレルについてしか考えていないので、3つ以上のときどうしよう…

09/05夕方 これに遺伝率を加えるべきかも

先生からいただいたソースを読み解いていった。USBを忘れたのでメモ書き。 Ns<-100 #アレルの数 Fs<-runif(Ns)*0.05 #頻度 Rs<-runif(Ns) #リスク #Fs<-sort(Fs) #Rs<-sort(Rs,decreasing=TRUE)^1*sample(c(-1,1),Ns,replace=TRUE) plot(Fs,Rs) Npt<-100000 …

09/05

N<-100 #バリアントの数 i HN<-100 #人数 j ir<-matrix(numeric(HN*N),HN,N) #個人の各アレルのリスク(2本分足した値) al<-matrix(numeric(HN*N),HN,N) #持っているアレル(複数のtypeなら0,1,2,4を足す感じで) alt<-1 #アレルの種類 aa<-5.0 #ア…

メモ 検定

尤度比検定、カイ自乗検定、正確確率検定などがあるが、サンプルが少ないときは正確確率検定がいいらしい。 p値が大きめに出ることを保守的という。正確確率検定は保守的。 遺伝形式が優性、劣性の場合は2×2表でいいけれど、相加的な場合は2×3なので、フ…

テスト

N<-1000 #バリアントの数 i HN<-1000 #人数 j aa<-5.0 #アレル頻度パラメータ al<-matrix(numeric(HN*N),HN,N) #アレルの有無0〜2 アレルがいろいろあるときはそれぞれ1,2,4を足すかもしれない sr<-numeric(HN) #リスクの合計点 af<-exp(-aa*runif(N,0,)) …

疾患の有無とアレルの有無で場合分け

cc<-quantile(sr,probs=seq(0.95,0.95,1)) #上位5%点 byo<-numeric(HN) for (j in 1:HN) if(sr[j]>cc) byo[j]<-1 tt<-matrix(numeric(N*6),6,N) #各アレルについて、caseMM,,,contmm for (j in 1:HN){ for (i in 1:N){ if (byo[j]==1){ if (al[j,i]==2) tt…

シミュレーション

N<-1000 #バリアントの数 i HN<-1000 #人数 j aa<-5.0 #アレル頻度パラメータ al<-matrix(numeric(HN*N),HN,N) #アレルの有無0〜2 アレルがいろいろあるときはそれぞれ1,2,4を足すかもしれない sr<-numeric(HN) #リスクの合計点 af<-exp(-aa*runif(N,0,)) …