Google: 129 864 880 könyv van az egész világon

hány könyv jelent meg valaha az egész modern történelemben? A Google fejlett algoritmusai szerint a válasz közel 130 millió könyv, Vagyis 129 864 880, hogy pontos legyek.

elismerjük, hogy gyakorlatilag lehetetlen megszámolni minden valaha írt könyvet, de ahhoz, hogy a Google Könyvek sikeresen katalogizálják a világ nyomtatott tudását, a vállalatnak becslésre van szüksége a beolvasandó könyvek mennyiségéről. Ezért a Google tűzte ki a feladatot, hogy nem csak ezt.

egy részletes blogbejegyzésben Leonid Taycher szoftvermérnök felvázolta, hogy a könyvek valójában milyen összetettekké válhatnak. Az első lépés pontosan meghatározni, hogy mi a könyv. A társaság úgy döntött, hogy mindent enged, ami nem idealizált kötött kötet:

“a könyv egyik meghatározása, amelyet hasznosnak találunk a Google-on belül a könyv metaadatainak kezelésekor ,egy’ kötet, ‘ idealizált kötött kötet. Egy kötetnek több millió példánya lehet (pl. Dan Brown Angyalok és démonok egy adott kiadása), vagy csak egy vagy két példányban létezhet (például egy homályos diplomamunka, amely egy egyetemi könyvtárban sínylődik).”

a Google elismeri, hogy a definíciójuk nem tökéletes, de működőképes és hasonló ahhoz, amit az ISBN-eknek kellene képviselniük. Az ISBN-t vagy a nemzetközi szabványos Könyvszámokat úgy tervezték, hogy a könyvek egyedi azonosítói legyenek. Mivel csak 30-40 éve léteznek, és többnyire nyugati országokban használják őket, önmagukban nem használhatók. Ez az oka annak, hogy a Google adatokat gyűjtött a Kongresszusi könyvtárból, a WorldCat — ből és másokból, hogy a lehető legtöbb könyvet megtalálja-egy milliárd nyers rekordot a vállalat számlál.

itt jön képbe a Google mérnöki tehetsége. A vállalat számtalan algoritmust használt a másolatok meghatározására és eldobására annak érdekében, hogy több mint 150 darab metaadat szükséges a világ könyveihez, hogy értékelje, hogy az egyes könyvrekordok egyediek-e vagy egy másik másolata. Ezen adatok elemzése 210 millió egyedi könyvet eredményezett.

ezután a Google kivonta a mikroformák millióit, hangfelvételeket, térképeket, pólókat, pulykaszondákat (igen, pulykaszondákat) és videókat Ibsn-ekkel, és sokkal ésszerűbb, 146 millió számot kapott. Végül a Társaság 16 millió kormányzati dokumentummennyiséget távolított el becsléséből, elérve a ma bejelentett 129, 8 millió számot. Természetesen a kiadók új könyveket adnak ki, még akkor is, ha ezt a bejegyzést beírják, így a vállalat folyamatosan újraszámolja a könyvszámot.

bár nincs egy sereg szoftvermérnökünk és algoritmusunk, hogy támogassanak minket, az ösztöneim szerint ez a szám túl alacsony, és a cégnek még sok könyve van, amit a történelem évkönyveiből számolhatnának. Mégis, ez a projekt, hogy kitaláljuk a világ könyvkínálatát, egyszerűen lenyűgöző, és hasznos lehet kutatási és történelmi célokra az elkövetkező években.

a Google következő kihívása: hogy ne pereljenek be a Google Könyvek miatt.



+