Google: der er 129.864.880 bøger i hele verden

hvor mange bøger er der nogensinde blevet udgivet i hele moderne historie? Ifølge Googles avancerede algoritmer er svaret næsten 130 millioner bøger, eller 129.864.880, for at være præcis.

vi indrømmer, at det er praktisk taget umuligt at tælle hver bog, der nogensinde er skrevet, men for at Google Bøger med succes kan katalogisere verdens udbud af trykt viden, har virksomheden brug for et skøn over mængden af bøger, den har brug for at scanne. Derfor satte Google sig på opgaven for at gøre netop det.

i et detaljeret blogindlæg skitserede programmelingeniør Leonid Taycher, hvor komplekse tællebøger faktisk kan blive. Det første skridt er at definere præcis, hvad en bog er. Virksomheden besluttede at Rabat noget, der ikke var en idealiseret bundet volumen:

“en definition af en bog, som vi finder nyttig i Google, når vi håndterer bogmetadata, er en ‘tome’, et idealiseret bundet volumen. En tome kan have millioner af eksemplarer (f. eks. en bestemt udgave af engle og dæmoner af Dan brun) eller kan eksistere i kun en eller to eksemplarer (såsom en uklar kandidatafhandling, der forsvinder i et universitetsbibliotek).”

Google indrømmer, at deres definition er ufuldkommen, men den er brugbar og ligner, hvad ISBN ‘ er skal repræsentere. ISBN, eller internationale Standardbognumre, er designet til at være unikke identifikatorer for bøger. Fordi de kun har eksisteret i 30-40 år og bruges i de fleste vestlige lande, kan de ikke bruges af sig selv. Derfor tog Google data fra Library of Congress, Verdenscat og andre for at finde så mange bøger som muligt — en milliard rå optegnelser efter virksomhedens optælling.

her er hvor Googles tekniske talent kommer i spil. Virksomheden brugte utallige algoritmer til at bestemme og kassere duplikater i en indsats, der krævede mere end 150 metadata relateret til verdens bøger for at evaluere, om hver bogrekord var unik eller en duplikat af en anden. Analyse af disse data resulterede i 210 millioner unikke bøger.

dernæst trak Google millioner af mikroformer, lydoptagelser, kort, t-shirts, kalkunprober (Ja, kalkunprober) og videoer med IBSNs og ankom til et meget mere rimeligt antal på 146 millioner. Endelig fjernede virksomheden 16 millioner regeringsdokumentmængder fra deres skøn og kom til det antal på 129, 8 millioner, de annoncerede i dag. Selvfølgelig udgiver udgivere nye bøger, selvom dette indlæg bliver skrevet, så virksomheden genberegner konstant bogtællingen.

selvom vi ikke har en hær af programmelingeniører og algoritmer til at bakke os op, siger min tarm, at dette tal er for lavt, og virksomheden har mange flere bøger at tælle fra historiens annaler. Alligevel er dette projekt for at finde ud af verdens bogforsyning simpelthen fascinerende og kan være nyttigt til forskning og historiske formål i de kommende år.

Googles næste udfordring: at stoppe med at blive sagsøgt over Google Bøger.



+