El ratón doméstico (Mus musculus) es un pequeño mamífero del orden Rodentia, característicamente con un hocico puntiagudo, pequeñas orejas redondeadas y una cola larga desnuda o casi sin pelo. Es una de las especies más abundantes del género Mus. Aunque es un animal salvaje, el ratón doméstico vive principalmente en asociación con humanos.El ratón doméstico ha sido domesticado como mascota o ratón de fantasía, y como ratón de laboratorio, que es uno de los organismos modelo más importantes en biología y medicina.
Montaje
El GRCm38.el ensamblaje p6 fue presentado por Genome Reference Consortium en septiembre de 2017. El conjunto está a nivel cromosómico, y consta de 885 contiguos ensamblados en 336 andamios. A partir de estas secuencias, se han construido 21 cromosomas. El tamaño N50 es la longitud tal que el 50% del genoma ensamblado se encuentra en bloques del tamaño N50 o más largos. La longitud N50 de los contiguos es de 32.273.079, mientras que el andamio N50 es de 52.589.046.
Anotación génica
El proceso de anotación génica se llevó a cabo utilizando una combinación de alineaciones proteína-genoma, mapeo de anotación a partir de una especie de referencia adecuada y alineaciones ARN-seq (donde los datos ARN-seq con los metadatos apropiados estaban disponibles públicamente). Para cada región del gen candidato, se aplicó un proceso de selección para elegir el conjunto de transcripciones más apropiado en función de la distancia evolutiva, la evidencia experimental de los datos de origen y la calidad de los alineamientos.Se obtuvieron ARNN pequeños utilizando una combinación de BLASTOS e Infernales / RNAfold. Los pseudogenes se calcularon observando genes con un gran porcentaje de intrones no biológicos (intrones de <10 pb), donde el gen estaba cubierto de repeticiones, o donde el gen era un exón único y se encontró evidencia de un paralog funcional de múltiples exones en otras partes del genoma. Los lincRNAs se generaron a través de datos de ARN-seq en los que no se pudo encontrar evidencia de homología de proteínas o dominios proteicos en la transcripción.
De acuerdo con el Acuerdo de Fort Lauderdale, verifique el estado de publicación del genoma/ensamblaje antes de publicar cualquier análisis de todo el genoma utilizando estos datos.