2011-09-01から1ヶ月間の記事一覧

十分な人数、十分なバリアントでリスクの与え方を変えたいのだが、人数を2倍にすると4倍くらいの時間がかかる気がする。どのくらいにするか難しいところ。1000人、RV150個で、大体72秒。あるkrについて100回試行して2時間。

距離のはかり方について

距離のはかり方をなんとなくmanhattanからeuclidにしてみたら上手くいきそうな感じ。。。。manhattanでCVをちょっと増やすとかより、こっちの違いについて考えるのが重要な感じがする。euclidで色々な条件で試してみて、それで上手くいくならそれでいいし、…

サンプルを200人とってきて、こういったRVセットについて考える、としたとき、どんなRVを選んで調べて見てもいいのだから、アレル頻度のところは実際は融通がききそうな気がしてきた。といっても、みつかるRVのアレル頻度は指数分布に従うだろうから、10-50%…

サンプル数がある程度少ないとき、世界全体でのアレル頻度分布と、少ないサンプル数でのアレル頻度分布は変わるかもしれない。実際のプログラミングについて考えると、最初100個RVを設定していても、多分100種類も観察されていなくて、重要なのはどちらかと…

http://www.hsph.harvard.edu/~xlin/SKAT-paper-and-supplement.pdf のアレル頻度モデルのもととなった実際のデータ。RV93個。 アレル頻度かなり低い。これだけ低いと、RVをもってて1,2個だから、上手く結果がでないかもしれない。大体ka=300くらい。kaとkr…

レアバリアントが高リスクのとき、フェノタイプと関係性があるとでて、レアバリアントが低リスクのとき、フェノタイプと関係性がないという結果が出したい。 この高リスク、低リスクは、CVに比べて、というものなので、CVについてもう少し考えて組み込んで、…

メモ

CVはリスク0で、アレル頻度20~50%。4個。 RVは高リスクで、アレル頻度0~10%。40個。CVはリスク0だから、フェノタイプにまったく寄与せず、遺伝要因に占める割合は0。RVは、持っているとフェノタイプに大きく寄与する。というモデルにおいて、MST検定を行う…

CV4個で固定してRVの数を変えてみるとこうなった。こうなる理由がつかめない。モデルとしては、4個、と固定するより、RVの数によって変わる方が説明しやすそう。たとえば、 グラフの変化が小さい順にka=20,40,60,80 上のモデルのような確率分布に従う時、検…

#バリアントの数が60のときの、CNを変える Date<-"09261" source("MST.R") Np<-100 #MST何回か HN<-50000 df<-200 cnnu<-c(20,30,40,50,60,70) Rnu<-length(cnnu) syu<-matrix(0,Np,Rnu) #boxplot用 colnames(syu)<-cnnu for (nnp in 1:Rnu){ CN<-cnnu[nnp] …

リスク0のCVを入れてみる RV40,60個のとき

RV40個 CVの数を変えてみる。 0のときを加えて、CVの数が小さいときを調べてみる。CVについて、今アレル頻度を一様分布で与えているが、数が少ないから適当に設定すべきだ。RV60個

N=60のとき、アレル頻度の刻み幅を変える

レアバリアントの数を60以下にしたとき検出力がよくなかったのはなぜかについて。段の高さの違いは、afの与え方のパラメタka(af=rexp(N,ka))で変わるので、段の幅のとりかたによるのではないかと考えた。RVの数が少ないとき、アレル頻度の設定の仕方を、1/…

euclid,manhattan

オレンジと緑のところで、木のでき方が違うことになる。 木のでき方がちがっても、距離は常にマンハッタン距離の方が長かった。差がプラスかマイナスかしか調べていないが。

p3を円上で動かしたときの、p1,p2,p3の全域木の長さを調べる。 [:] eはユークリッド距離、mはマンハタン距離 123だったら、p1-p2-p3と結んだときの長さ 最小全域木の長さ あまり特徴がない。 今度は楕円でやってみる。これを円でやると、p3-p1-p2と結んだと…

バリアントの数を変えたとき2

100個で調べたときに少し平均と分散があがっているのは、試行回数が少ないからだと考えられる。120個あったら十分で、80個でも使えるかもしれない。

バリアントの数が少ないとき、リスク0のコモンバリアントを考えるとMSTがうまくいくのではないか、という予想。

バリアントの数を変えたとき

source("MST.R") Np<-100 #MST何回か HN<-10000 syu<-matrix(0,Np,7) #boxplot用 nnu<-c(20,40,60,80,100,120,160) for (nnp in 1:7){ N<-nnu[nnp] ir<-al<-matrix(0,HN,N) #各ローカスにおけるリスク、持っているアレル wei<-wei2<-P<-sr<-rep(0,HN) #重み…

rexpについて

rexp(,rate)は、rate=kaとして、 確率密度関数ka*e^(-ka*x)となるような分布に従う。これからバリアントの数を変えるとき、ka=40とするなら、0.01増えると2/3になるくらいだから、 af=0.001 40個 0.01 27 0.02 18 0.03 12 0.04 8 0.05 5 0.06 3 0.07 2 0.10 …

等高線

横軸はlog(kr) contour(x,y,z,nlevels=50)アレル頻度が低いほどリスクが高くなるが、その高くなり具合を上げると、低リスクの物が増えて、RV方向に点をひっぱるようなRVが減り、上手くいかない。 アレル頻度が高いものもリスクが高めにすると、多くのサンプ…

取り出す人数を変えたとき

人数を増やすほどいいようだ。 200人で、平均がほぼ0になっているので、バリアントの数を変えるとき、200人で調べる。

人数を変えたとき

ka=kr=40,サンプル集団の人数を変えたとき。母集団からランダムに200人取り出して検定を行っている。母集団120人の時は200人選べないので100人選んだ。ランダムに何人取り出すかを変えないとあまり意味がない、と反省。特に、母集団が少ないと、あたえるアレ…

アレル頻度とリスク

白いほど検出力が高い。それぞれ100回ずつ。今週やること: ・アレル頻度とリスクのプロットなど、グラフを分かりやすく使うための勉強 −軸を対数に ・ユークリッド距離とマンハッタン距離の違いをトポロジーから ・尤もらしいモデルで人数取り出す人数をか…

ユークリッド距離、マンハッタン距離

ka=60,kr=0 横軸ユークリッド距離、縦軸マンハッタン距離。 正の相関。マンハッタン距離の方が数値がかなり大きい。正の相関なので、どちらを使っても結果は似ると思われる。ka↑、あるいはkr↑で、距離はどちらも短くなる。kr↑で短くなる理由はなんだろう。リ…

・ユークリッド距離とマンハッタン距離について、違いをプロット・ka[0-90],kr[0-180]位でまわす。・アレル頻度、リスク、遺伝率、マーカーの数をそれなりのものに固定したとき、サンプルの数による検出力の挙動・人数固定してマーカーの数を変えてみるマー…

af(0-90),risk(0-90),by10

アレル頻度とリスクの係数を10刻みで調べてみた 横軸がアレル頻度の係数、奥行きがリスクの係数、高さが値。 左手前の四角の隅っこが(0,0,0)。平均値 分散 どちらも低いといい。分散が低いのが検出力が高いといえるかもしれない。常にある値らへんが出るわけ…

フェノタイプとジェノタイプに関係があるかを、遺伝率で調整してもいいのだけど、リスクとアレル頻度に絞って考えることにする。たとえばリスク=0では絶対にフェノタイプとジェノタイプに関係性がなくなるので。リスクを、risk=exp(-10000*af)にしてみると、…

par(ask=TRUE) N<-200 #バリアントの数 i HN<-100000 #人数 j ir<-al<-matrix(0,HN,N) #各ローカスにおけるリスク、持っているアレル wei<-wei2<-P<-sr<-rep(0,HN) #重み、フェノタイプ、リスクの総和 risk<-af<-iaf<-rep(0,N) #真のアレル頻度 Np<-50 #MST…

ユークリッド距離かマンハッタン距離かで悩むところなのだけれど、どちらも検出力がものすごく変わるわけではなさそうなので、マンハッタン距離でやる。2つやると処理にものすごく時間がかかるので。k1=60,80あたりで、遺伝率がどのくらいならどれくらい検…

結果メモ

マンハッタン距離で。 下のことに気づいたので途中やめしたけれど、リスク=±1のときが一番いいなぁ。。。パーミテーションテストでランダムに作った値をソートしたとき、下から何番目の枠に入るか、で調べているけど、分布関数を予測してn分位点で切るほ…

結果メモ

横軸はrisk=±exp(-k1*af)のk1で 1,2,3,4・・・にk1=0,10,20,30・・・が対応 縦軸はパーミテーションテストでランダムに作った値をソートしたとき、下から何番目の枠に入るか、の分布軸の書き方が必要。。。パーミテーションの回数か、取るサンプル数か、試行…

ポジコンを決めるために

risk=±exp(-k1*af),af=rexp(N,k2) ・まず適当なk2についk1を動かしてみる。 ・k1、k2をいろいろ動かしてみて、関係性があるかどうかk1について、k1作ってなかったので1だ、と思っていたけど、パラメータわりあてて40にしていた。10刻みで0〜80まで調べてみ…