Illumina sequencing technologyは、cluster generation and sequencing by synthesis(SBS)chemistryを使用して、シーケンスプラットフォームに応じて、フローセル上の数百万または数十億のクラスターをシーケンス SBS化学の間に、各集りのために、基礎呼出しは器械の実時間分析(RTA)ソフトウェアによって配列のあらゆる周期のためになされ、貯えられる。 RTAは、ベースコールデータを個々のベースコール(またはBCL)ファイルの形式で保存します。 シーケンスが完了すると、BCLファイル内のベースコールをシーケンスデータに変換する必要があります。 このプロセスは、BCLからFASTQへの変換と呼ばれます。
FASTQファイルは、フローセルのフィルターを通過するクラスターからのシーケンスデータを含むテキストファイルです(フィルターを通過するクラスターの詳細については、このセキュリティ情報の”追加情報”のセクションを参照してください)。 サンプルが多重化されている場合、FASTQファイル生成の最初のステップは多重分離です。 多重分離は、クラスターのインデックスシーケンスに基づいて、サンプルにクラスターを割り当てます。 多重分離後、アセンブルされたシーケンスはサンプルごとにFASTQファイルに書き込まれます。 サンプルが多重化されていない場合、多重分離ステップは発生せず、各フローセルレーンについて、すべてのクラスターが単一のサンプルに割り当てられ
単一読み取り実行の場合、フローセルレーンごとにサンプルごとに1つの読み取り1(R1)FASTQファイルが作成されます。 ペアエンドの実行では、各レーンのサンプルごとに1つのR1と1つのRead2(R2)FASTQファイルが作成されます。 FASTQファイルは圧縮され、拡張子*で作成されます。fastq.gz。
FASTQファイルはどのように見えますか?
フィルタを通過する各クラスターについて、単一のシーケンスが対応するサンプルのR1FASTQファイルに書き込まれ、ペアの終了実行の場合は、単一のシーケ FASTQファイル内の各エントリは、4行で構成されています:
- シーケンス実行とクラスターに関する情報を含むシーケンス識別子。 この行の正確な内容は、使用されるBCLからFASTQへの変換ソフトウェアに基づいて異なります。
- シーケンス(ベースコール;A,C,T,G,N)。
- 区切り文字で、単純にプラス(+)記号です。
- ベース通話品質スコア。 これらはPhred+33エンコードされ、ASCII文字を使用して数値品質スコアを表します。
R1FASTQファイル内の単一のエントリの例を次に示します:
FASTQ形式の詳細については、こちらを参照してください。
FASTQファイルの表示方法
FASTQファイルには最大数百万のエントリを含めることができ、サイズは数メガバイトまたはギガバイトになることがあります。 一般に、FASTQファイルは、参照やde novoアセンブリへの配置など、下流の分析を実行するツールの入力として使用される中間出力ファイルであるため、表示す
トラブルシューティングの目的で、または好奇心からFASTQファイルを表示する必要がある場合は、非常に大きなファイルを処理できるテキストエディタ、ま
FASTQファイルの生成方法
FASTQファイルの生成は、MiSeqのMiSeq ReporterおよびMiniSeqのローカル実行マネージャーで使用されるすべての分析ワークフローの最初のステップです。 分析が完了すると、FASTQファイルはMiSeqの<runフォルダー>\Data\Intensities\BaseCallsおよびMiniSeqの<outputフォルダー>\Alignment_#\<サブフォルダー>\Fastqに配置されます。
BaseSpace Sequence Hubにアップロードされたすべての実行について、実行が完全にアップロードされた後にfastqファイルが自動的に生成され、FastqファイルはBaseSpace Sequence Hubのさまざ BaseSpace Sequence Hubでは、実行に関連するプロジェクト内のFASTQファイルを見つけることができます。
bcl2fastq変換ソフトウェアを使用して、現在のすべてのIllumina sequencingシステムで生成されたデータからFASTQファイルを生成できます。
FASTQファイル生成時に適用できるさまざまな設定については、以下のソフトウェアユーザガイドを参照してください。
- MiSeq Reporter
Local Run Manager
bcl2fastq
追加情報
- クラスターがフィルタを通過するための説明と要件は、MiSeq:Imaging and Base Calling online training courseのセクション1.5.8に記載されています。
- NovaSeq、NextSeq500/550、およびMiniSeqシステムでのベースコールの詳細については、2チャネルSBSテクノロジを参照してください。
- MiSeqおよびHiSeqシステムでのベースコールの詳細については、Illumina Sequencing Technologyを参照してください。