the house mouse (Mus musculus) é um pequeno mamífero da ordem Rodentia, caracteristicamente com um focinho pontiagudo, orelhas pequenas arredondadas, e uma cauda longa ou quase sem pêlos. É uma das espécies mais abundantes do gênero Mus. Embora seja um animal selvagem, o rato da casa vive principalmente em associação com os humanos.O rato doméstico tem sido domesticado como o animal de estimação ou rato chique, e como o rato de laboratório, que é um dos organismos modelo mais importantes na biologia e medicina.
Montagem
O GRCm38.P6 assembly was submitted by Genome Reference Consortium on September 2017. O conjunto está no nível cromossomo, consistindo de 885 contigs montados em 336 Andaimes. A partir destas sequências, 21 cromossomas foram construídos. O tamanho N50 é o comprimento tal que 50% do genoma montado está em blocos do tamanho N50 ou mais. O comprimento N50 para os contigs é de 32,273,079, enquanto o N50 do andaime é de 52,589,046.
anotação de genes
o processo de anotação de genes foi realizado utilizando uma combinação de alinhamentos proteína-genoma, mapeamento de anotações a partir de uma espécie de referência adequada e alinhamentos RNA-seq (onde os dados RNA-seq com meta-dados adequados estavam disponíveis ao público). Para cada região do gene candidato, um processo de seleção foi aplicado para escolher o conjunto mais apropriado de transcrições com base na distância evolutiva, evidência experimental para os dados fonte e qualidade dos alinhamentos.Foram obtidas pequenas ncRNAs utilizando uma combinação de BLAST e Infernal/RNAfold. Pseudogenes foram calculados observando genes com uma grande percentagem de não-biológicos íntrons (intrões de <10bp), onde o gene foi abordado na repete, ou onde o gene era o único exão e a evidência de um funcional de multi-exão paralog foi encontrada em outras partes do genoma. lincRNAs foram gerados através de dados RNA-seq onde nenhuma evidência de homologia proteica ou domínios proteicos pode ser encontrada na transcrição.De acordo com o Acordo de Fort Lauderdale, verifique o estado de publicação do genoma/conjunto antes de publicar quaisquer análises ao nível do genoma utilizando estes dados.