bcftoolsでvcfファイルの編集(個人メモ・追記予定)

※2023年7月19日 一部修正 VCF形式 詳しい説明は省略。GATK公式による解説がおそらく一番分かりやすい。 VCFファイルを整形したり、ほしい多型情報を抽出するツールとしてはbcftoolsとVCFtoolsが定番となっている。個人的にはbcftoolの方が、 biocondaで配布…

TrimmomaticでBGIシーケンサーのアダプターを指定する

ここ数年、中国のゲノム関連企業であるBGIの次世代シーケンサーがゲノム解読に使われることが増えてきた。配列の増幅にローリングサークル複製機構を使っているなど、illumina社のシーケンサーとはだいぶシステムが異なるらしい。1当然、使われているアダプ…

集団構造解析ソフトAdmixtureの使い方

形態などのデータからそれなりに多様性があることがわかっている個体群について、各個体の全ゲノム的な多型データが得られているとする。 このとき、 1. その集団を遺伝的に同じ起源を持つグループ(=祖先集団)に分けた場合、どのように分けられるか? 2. …

プロダクションマッチフェス走り方考察

(2020年3月22日:誤字を色々修正) 担当の白菊ほたる上位フェスやら副業やらで忙しくて気がついたら総選挙結果発表も終わっていた。 ちゃんみお、加蓮、りあむちゃん、おめでとうございます。 さて、前回のフェスではかつての雪辱を晴らすため、自分なりに本…

Rのデータフレームで検索と置換をする方法

(2019年12月26日追記) 普段からエクセルを使い慣れている人にとっては、「検索と置換」はよく使う機能だと思う。 Rのデータフレームで同様の処理をする機会があり、素人なりに方法を調べたのでまとめてみた。 データフレームの準備 適当なデータでデータフ…

アイドルチャレンジ大運動会編(2017年10月上位報酬白菊ほたる)参加記録

アイドルチャレンジ白菊ほたるイベのまとめ アイチャレ史に残る激しい戦いだった。最終2000位ボーダーは34,169,844pt。一番最近の8R制アイチャレ(ベーカリー編)が2200万ptぐらいだったことを考えると、1.5倍以上に跳ね上がった。 理由は…白菊ほたる担当Pと…

igraphでシンデレラガールズのアイドル紹介相関図

アイドルマスターシンデレラガールズ第6回総選挙が終わりましたね。楓さんおめでとうございます。 さて、今回の総選挙では、登場アイドルがお題に沿って他のアイドルを紹介する特設ページ開設され、話題になった。 www.nicovideo.jp 全アイドルを網羅する内…

Rのigraphで相関図

最近、「Rパッケージのigraph*1って相関図描くのに便利そうだな-」と思っているので、練習も兼ねて簡単な作図と計算をしてみた。たとえば、イロハ、すもも、梨子、てゐの4人に以下のような関係があったとする。 イロハはすもも、てゐを知っている すももは…

初投稿

このブログでは、 生物学関係 漫画やゲーム 時事ネタ などについて、統計初心者のブログ主が試行錯誤しながら何とか解析を試みる…という内容になる予定です。 どうぞよろしくお願いします。