Il topo domestico (Mus musculus) è un piccolo mammifero dell’ordine Rodentia, caratterizzato da un muso appuntito, piccole orecchie arrotondate e una lunga coda nuda o quasi glabra. È una delle specie più abbondanti del genere Mus. Sebbene sia un animale selvatico, il topo domestico vive principalmente in associazione con gli umani.Il topo domestico è stato addomesticato come animale domestico o topo di fantasia e come topo da laboratorio, che è uno degli organismi modello più importanti in biologia e medicina.
Assemblaggio
Il GRCm38.l’assemblea p6 è stata presentata da Genome Reference Consortium a settembre 2017. L’assemblaggio è a livello cromosomico, costituito da 885 contigui assemblati in 336 scaffold. Da queste sequenze sono stati costruiti 21 cromosomi. La dimensione N50 è la lunghezza tale che il 50% del genoma assemblato si trova in blocchi della dimensione N50 o più a lungo. La lunghezza N50 per i contig è 32.273.079 mentre l’impalcatura N50 è 52.589.046.
Annotazione genica
Il processo di annotazione genica è stato effettuato utilizzando una combinazione di allineamenti proteina-genoma, mappatura di annotazione da una specie di riferimento adatta e allineamenti RNA-seq (dove i dati RNA-seq con metadati appropriati erano disponibili al pubblico). Per ogni regione del gene candidato, è stato applicato un processo di selezione per scegliere l’insieme più appropriato di trascrizioni in base alla distanza evolutiva, alle prove sperimentali per i dati di origine e alla qualità degli allineamenti.Piccoli NCRNA sono stati ottenuti utilizzando una combinazione di BLAST e Infernal / RNAfold. Gli pseudogeni sono stati calcolati osservando geni con una grande percentuale di introni non biologici (introni di <10bp), dove il gene era coperto da ripetizioni, o dove il gene era un singolo esone e la prova di un paralog multi-esone funzionale è stata trovata altrove nel genoma. I LINCRNA sono stati generati tramite dati RNA-seq in cui non è stata trovata alcuna evidenza di omologia proteica o domini proteici nella trascrizione.
In conformità con l’accordo di Fort Lauderdale, si prega di verificare lo stato di pubblicazione del genoma/assemblaggio prima di pubblicare qualsiasi analisi genome-wide utilizzando questi dati.