Fastq fájlok magyarázata

az Illumina szekvenálási technológia klasztergenerálást és szekvenálást használ szintézis (SBS) kémia segítségével, hogy több millió vagy milliárd klasztert szekvenáljon egy áramlási cellán, a szekvenálási platformtól függően. Az SBS kémia során minden klaszter esetében az alaphívásokat a szekvenálás minden ciklusához a műszer valós idejű analízis (RTA) szoftvere végzi. Az RTA az alaphívás adatait egyedi alaphívás (vagy BCL) fájlok formájában tárolja. Amikor a szekvenálás befejeződik, a BCL fájlokban lévő alaphívásokat szekvencia adatokká kell konvertálni. Ezt a folyamatot hívják BCL nak nek FASTQ konverzió.

a FASTQ-fájl olyan szövegfájl, amely az áramlási cellán áthaladó fürtökből származó szekvenciaadatokat tartalmazza (a szűrőn áthaladó fürtökről további információt a közlemény “további információk” szakaszában talál). Ha a mintákat multiplexeltük, a FASTQ fájl generálásának első lépése a demultiplexelés. A demultiplexelés klasztereket rendel egy mintához, a klaszter indexszekvenciája(I) alapján. Demultiplexelés után az összeszerelt szekvenciákat mintánként FASTQ fájlokba írják. Ha a mintákat nem multiplexelték, akkor a demultiplexelési lépés nem következik be, és minden egyes áramlási cellasávhoz az összes klaszter egyetlen mintához van rendelve.

egyetlen olvasási futtatáshoz egy olvasási 1 (R1) FASTQ fájl jön létre minden egyes mintához áramlási cellasávonként. Párosított futtatás esetén egy R1 és egy Read 2 (R2) FASTQ fájl jön létre minden egyes sávhoz tartozó mintához. A FASTQ fájlok tömörítése és létrehozása a * kiterjesztéssel történik.fastq.gz.

hogyan néz ki egy FASTQ fájl?

minden egyes fürt, amely átmegy a szűrőn, egyetlen szekvenciát ír a megfelelő minta R1 FASTQ fájljába, és egy párosított végű futtatáshoz egyetlen szekvenciát is ír a minta R2 FASTQ fájljába. A FASTQ fájlok minden bejegyzése 4 sorból áll:

  1. egy szekvencia azonosító, amely tartalmazza a szekvenálás futtatását és a fürtöt. Ennek a sornak a pontos tartalma a használt BCL-től a FASTQ konverziós szoftverig terjed.
  2. a szekvencia (az alaphívások; A, C, T, G és N).
  3. elválasztó, amely egyszerűen egy plusz (+) jel.
  4. az alaphívás minőségi pontszáma. Ezek Phred +33 kódolásúak, ASCII karaktereket használva a numerikus minőségi pontszámok ábrázolására.

íme egy példa egy R1 FASTQ fájl egyetlen bejegyzésére:

a FASTQ formátumról részletesebb információk itt találhatók.

a FASTQ fájlok megtekintése

a FASTQ fájlok akár több millió bejegyzést is tartalmazhatnak, és több megabájt vagy gigabájt méretűek lehetnek, ami gyakran túl nagy ahhoz, hogy normál szövegszerkesztőben megnyissák őket. Általában nem szükséges megtekinteni a FASTQ fájlokat, mert ezek közbenső kimeneti fájlok, amelyeket bemenetként használnak olyan eszközökhöz, amelyek későbbi elemzést végeznek, például egy referenciához vagy de novo szerelvényhez való igazítás.

ha hibaelhárítás céljából vagy kíváncsiságból meg kell tekintenie egy FASTQ fájlt, akkor szüksége lesz egy szövegszerkesztőre, amely képes kezelni a nagyon nagy fájlokat, vagy hozzáférni egy Unix vagy Linux rendszerhez, ahol a nagy fájlok megtekinthetők a parancssoron keresztül.

FASTQ fájlok generálása

a Fastq fájlgenerálás az első lépés a MiSeq Reporter által a MiSeq-en és a Local Run Manager által a MiniSeq-en használt összes elemzési munkafolyamathoz. Az elemzés befejezése után a FASTQ fájlok a <Futtatás mappa>\Data\Intensities\BaseCalls mappában találhatók a MiSeq-n, a <kimeneti mappa>\Alignment_#\<almappában>\Fastq a MiniSeq-n.

a BaseSpace Sequence Hub-ra feltöltött összes futásnál a fastq fájl létrehozása automatikusan megtörténik a Futtatás teljes feltöltése után, és a FASTQ fájlokat a BaseSpace Sequence Hub különböző elemző alkalmazásainak bemeneteként használják. A BaseSpace Sequence Hub, megtalálja a FASTQ fájlokat a projekt(ek) társított Futtatás.

a bcl2fastq konverziós szoftver használható FASTQ fájlok generálására az összes jelenlegi Illumina szekvenáló rendszeren generált adatokból.

a FASTQ fájlgenerálás során alkalmazható különböző beállításokról az alábbi szoftver használati útmutatóban olvashat.

    MiSeq Reporter
    Local Run Manager
    bcl2fastq

további információk

  • a miseq: Imaging and Base Calling online tanfolyam 1.5.8.szakaszában található a klaszterek szűrőn való áthaladására vonatkozó leírás és követelmények.
  • lásd a 2 csatornás SBS technológiát a NovaSeq, a NextSeq 500/550 és a MiniSeq rendszerek bázishívásairól.
  • lásd Illumina szekvenálás technológia további információt bázis hívó MiSeq és HiSeq rendszerek.



+