Google: det Er 129.864.880 Bøker I Hele Verden

Hvor mange bøker har noen gang blitt publisert i hele moderne historie? Ifølge googles avanserte algoritmer er svaret nesten 130 millioner bøker, eller 129.864.880, for å være nøyaktig.

Vi innrømmer at det er praktisk talt umulig å telle hver bok som noen gang har blitt skrevet, men For At Google Bøker skal kunne katalogisere verdens forsyning av trykt kunnskap, trenger selskapet et estimat av mengden bøker det trenger å skanne. Derfor bestemte Google seg for å gjøre nettopp det.

i et detaljert blogginnlegg skisserte Programvareingeniør Leonid Taycher hvor komplekse tellebøker faktisk kan bli. Det første trinnet er å definere nøyaktig hva en bok er. Selskapet besluttet å rabatt noe som ikke var en idealisert bundet volum:

«en definisjon av en bok vi finner nyttig I Google når du håndterer bokmetadata, er en tome, et idealisert bundet volum. En tome kan ha millioner av kopier (f. eks. Angels and Demons Av Dan Brown) eller kan eksistere i bare ett eller to eksemplarer (for eksempel en obskur masteroppgave smektende i et universitetsbibliotek).»

Google innrømmer at deres definisjon er ufullkommen, Men den er brukbar og ligner På Hva Isbn skal representere. ISBN, Eller International Standard Book Numbers, er utformet for å være unike identifikatorer for bøker. Fordi de bare har eksistert i 30-40 år og brukes i det Meste Vestlige land, kan de ikke brukes av seg selv. Derfor tok Google data fra Library Of Congress, WorldCat og andre for å finne så mange bøker som mulig – en milliard rå poster av selskapets telle.

Her er Hvor Googles tekniske talent kommer inn i spill. Selskapet brukte utallige algoritmer for å bestemme og kaste bort duplikater i et forsøk som krevde mer enn 150 metadata relatert til verdens bøker for å vurdere om hver bokoppføring var unik eller en duplikat av en annen. Analyse av disse dataene resulterte i 210 millioner unike bøker.

Deretter trakk Google millioner av mikroformer, lydopptak, kart, t-skjorter, kalkunprobler (ja, kalkunprober) og videoer Med IBSNs, som kommer til et mye mer fornuftig antall 146 millioner. Til slutt fjernet selskapet 16 millioner offentlige dokumentvolumer fra deres estimat, og kom til 129,8 millioner tellingen de annonserte i dag. Selvfølgelig utsteder utgivere nye bøker, selv om dette innlegget blir skrevet, slik at selskapet hele tiden omberegner bokantallet.

mens Vi ikke har en hær av programvareingeniører og algoritmer for å sikkerhetskopiere oss, sier min tarm dette nummeret er for lavt, og selskapet har mange flere bøker å telle fra historiens annaler. Likevel er dette prosjektet for å finne ut verdens bokforsyning ganske enkelt fascinerende og kan være nyttig for forskning og historiske formål i årene som kommer.

Googles neste utfordring: å slutte å bli saksøkt Over Google Bøker.



+