Google: det finns 129 864 880 böcker i hela världen

hur många böcker har någonsin publicerats i hela modern historia? Enligt Googles avancerade algoritmer är svaret nästan 130 miljoner böcker, eller 129 864 880, för att vara exakt.

vi erkänner att det är praktiskt taget omöjligt att räkna varje bok som någonsin har skrivits, men för att Google Books ska kunna katalogisera världens utbud av tryckt kunskap behöver företaget en uppskattning av mängden böcker som den behöver skanna. Det är därför Google satte upp uppgiften att göra just det.

i ett detaljerat blogginlägg skisserade mjukvaruingenjören Leonid Taycher hur komplexa räkningsböcker faktiskt kan bli. Det första steget är att definiera exakt vad en bok är. Företaget bestämde sig för att diskontera allt som inte var en idealiserad bunden volym:

”en definition av en bok som vi tycker är användbar i Google när vi hanterar bokmetadata är en ’tome’, en idealiserad bunden volym. En tome kan ha miljontals kopior (t. ex. av änglar och demoner av Dan Brown) eller kan existera i bara en eller två exemplar (till exempel en obskyr magisteruppsats som försvinner i ett universitetsbibliotek).”

Google medger att deras definition är ofullkomlig, men den är användbar och liknar vad ISBN: er ska representera. ISBN, eller internationella Standardboknummer, är utformade för att vara unika identifierare för böcker. Eftersom de bara har funnits i 30-40 år och används i mestadels västländer, kan de inte användas av sig själva. Därför tog Google data från Library of Congress, WorldCat och andra för att hitta så många böcker som möjligt — en miljard råa poster av företagets räkning.

Här spelar Googles tekniska talang in. Företaget använde otaliga algoritmer för att bestämma och kassera dubbletter i ett försök som krävde mer än 150 bitar metadata relaterade till världens böcker för att utvärdera om varje bokpost var unik eller en kopia av en annan. Analys av dessa data resulterade i 210 miljoner unika böcker.

därefter subtraherade Google miljontals mikroformer, ljudinspelningar, kartor, T-shirts, kalkonprober (ja, kalkonprober) och videor med IBSNs och anlände till ett mycket mer rimligt antal 146 miljoner. Slutligen tog företaget bort 16 miljoner regeringsdokumentvolymer från sin uppskattning och kom till 129.8 miljoner räkningen som de meddelade idag. Naturligtvis utfärdar utgivare nya böcker även när det här inlägget skrivs, så företaget räknar ständigt om bokräkningen.

medan vi inte har en arm av mjukvaruingenjörer och algoritmer för att säkerhetskopiera oss, säger min tarm att detta nummer är för lågt och företaget har många fler böcker att räkna från historiens annaler. Ändå är detta projekt för att räkna ut världens bokförsörjning helt enkelt fascinerande och kan vara användbart för forskning och historiska ändamål under de kommande åren.

Googles nästa utmaning: att sluta bli stämd över Google Böcker.



+