PEDを用いた多型検出

解析例へのショートカット [SARS-CoV-2(COVID-19)] [B型肝炎ウイルス(HBV)] [大腸菌] [枯草菌] [コレラ菌] [高度好熱菌] [麹菌] [酵母] [ヒト] [イネ] [ミヤコグサ] [アラビドプシス] [イチゴ] [トマト]
[VirtualBoxでの利用例] [クラウド(AWS)での利用例] [fastq-dumpの設定] [よくある質問、お役立ち情報]

トピックス

1ヶ月でL452R変異を持つデルタ株と入れ替わりました。 異質8倍体のイチゴの構造変異の検出 トマトの構造変異の検出 コシヒカリSBL1のSBL1特異的領域の検出

PEDとは

Polymorphic Edge Detection (PED)は、次世代シーケンサーを用いて得られた塩基配列(ショートリード)より、配列の多型のキワ(エッジ)に着目して効率よく多型を検出する方法です。

非常に正確にゲノム全体に渡るSNPとindel等構造変異を得ることができます。

次世代シーケンサーの配列を解析する場合、まず配列をリファレンスゲノム配列にマップして、不一致の部分を抽出するのが一般的ですが、大部分のショートリードは多型を含まないため効率はあまりよくありません。

PEDでは、ショートリードから多型のエッジになる部分を早い段階で抽出するアルゴリズムで、これまでにない新しい手法です。

エッジを検出する方法として、ショートリードを長さk(k=20)の細かい断片に分解してターゲットとコントロールのショートリードを直接比較して多型を検出する方法(k-mer法)と、ショートリードに対してリファレンスゲノム配列を5'側からと3'側から双方向に整列してエッジを検出する双方向整列法(Bidirectional Alignment法)の2つのアルゴリズムを実装しています。

k-mer法はリファレンス配列がなくても、3'末端に多型を持つk-merを抽出することができ、連鎖解析に利用できます。

双方向整列法は、SNPに加えて、挿入、欠失、逆位、転座などの構造変異が同時に検出されます。また、従来法に比べて正確かつ高速に処理することができ、特に数100kbを超えるような大きな欠失も正確に検出できる特徴があります。

シンプルなアルゴリズムなので、ヒトの5倍の大きさで6倍体ゲノムのコムギのような複雑なゲノム構成の生物の多型も検出できます。また、小規模なコンピュータリソースで動作が可能です。

ped.plでの多型検出

結果のフォーマット

サポートしているリファレンスゲノム

Dockerを用いた解析

Dockerを用いると、dockerhubに登録済みの実行環境をダウンロードして一連の解析を行うことができます。解析が完了すると実行環境はクリアされて結果のみが残ります。
手動でfastq-dumpをインストールして、設定がうまくいかずダウンロードできないような場合は、動作確認済みのDockerの系をお勧めします。

CentOSやUbuntuにインストールする場合

解析事例

PEDに関する資料

その他のお役立ち情報

現在取扱いをしている企業について

ご自分で解析が困難な場合は、このソフトウェアを用いた解析を受託会社に依頼することもできます。 研究目的での利用はご自由に利用してもらって大丈夫ですが、企業の方で営利目的の場合は、農研機構知的財産部特許ライセンスチーム (電話 029-838-6465 メール naro-kyodaku@naro.affrc.go.jp)にご連絡ください。

お問い合わせ先

〒305-8518
茨城県つくば市観音台2-1-2
農研機構作物研究部門
宮尾安藝雄 (miyao@affrc.go.jp)