mboost-dp1

Google Inc.

Googles Caffeine søgeindeks går live

- Via Google - , redigeret af Net_Srak , indsendt af kastrup

Siden august sidste år har det været kendt, at Google vil gennemføre en større ændring i deres måde at indeksere hjemmesider, hvilket skulle ske med et nyt indekseringssystem kaldet Caffeine.

Nu har Google meddelt, at de efter længere tids test og implementering har lanceret det nye indekseringssystem. Caffeine byder på en lang række ændringer i forhold til deres tidligere system, hvilket, ifølge Google, vil føre til, at søgninger vil fremvise 50 % friskere resultater.

Årsagen er en ny måde at crawle sider på, hvor Google nu undersøger sider i små bider og meget oftere end før. Dette gøres fra deres mange datacentre, der tilsammen bearbejder hundredetusinde sider parallelt hvert sekund.

Samlet fylder Caffeine-databasen næsten 100 millioner gigabytes, hvortil der tilføjes hundredetusinde gigabytes data om dagen.





Gå til bund
Gravatar #1 - Hack4Crack
9. jun. 2010 09:19
ja det er skisme smart... har oplevet at skrive på et debat forum, og 10 minutter efter, kunne jeg finde det på Google.

kan god lide deres indeksering af forum resultater, så man kan se tid og datoer... wuhuu
Gravatar #2 - lerbech
9. jun. 2010 09:31
hmm det var godt nok noget af en datamængde de har, jeg vidste den var stor men ikke så stor.

og det er nok en en access database der er i brug
Gravatar #3 - GibStorm
9. jun. 2010 09:38
100 millioner gigabyte? Come on, konverter dog til en mere brugbar/håndgribelig enhed.

100.000.000 gigabyte -> 100.000 terabyte -> 100 petabyte.
Gravatar #4 - Hald
9. jun. 2010 09:49
GibStorm (3) skrev:
100 millioner gigabyte? Come on, konverter dog til en mere brugbar/håndgribelig enhed.

100.000.000 gigabyte -> 100.000 terabyte -> 100 petabyte.


Enig, havde præcis samme tanke.. 0,1 Exabyte.. pfff småting ;-) hehe..
Gravatar #5 - Testa
9. jun. 2010 09:52
#3 er da ikke flame... det er da relevant nok... det er sku kun politikere der skal holde sig til at sige tal på den måde så det lyder meget bedre end det er...

OT: Meget nice at der også sker udvikling på den front, kan da huske at der var snak om at nogle nye hjemmesider gik ned fordi alle og enhver crawler skulle ind og have den nye side med. Man kan håbe at den her måde at gøre det på vil være mere gavmild for andres servere.
Gravatar #6 - kr00z0r
9. jun. 2010 09:57
#3 fix'd

100.000.000 gigabyte -> 97.656 terabyte -> 95 petabyte.
Gravatar #7 - el_barto
9. jun. 2010 10:01
kr00z0r (6) skrev:
#3 fix'd

100.000.000 gigabyte -> 97.656 terabyte -> 95 petabyte.


Close, but no cigar:

100 000 000 gigabyte = 95.3674316 petabytes

;)
Gravatar #8 - wiiny
9. jun. 2010 10:04
hahahah.. geek ;)
Gravatar #9 - cordion
9. jun. 2010 10:08
el_barto (7) skrev:
kr00z0r (6) skrev:
#3 fix'd

100.000.000 gigabyte -> 97.656 terabyte -> 95 petabyte.


Close, but no cigar:

100 000 000 gigabyte = 95.3674316 petabytes

;)


nu står der tilfældigvis gigabyte og ikke gibibyte
1.000 byte = 1 kilobyte
1.024 byte = 1 kibibyte osv
Gravatar #10 - fastwrite1
9. jun. 2010 10:08
Jeg har en hjemmeside - en blog - som jeg kalder "lille univers" - og ja, det er da ikke særlig stort. Men Google er vist ret vild med det univers.

Jeg havde skrevet et indlæg.. publiceret det, og mindre end 2 minutter efter, var det indekseret hos Google.

Tal lige om overvågenhed...
Gravatar #11 - el_barto
9. jun. 2010 10:10
cordion (9) skrev:
el_barto (7) skrev:
kr00z0r (6) skrev:
#3 fix'd

100.000.000 gigabyte -> 97.656 terabyte -> 95 petabyte.


Close, but no cigar:

100 000 000 gigabyte = 95.3674316 petabytes

;)


nu står der tilfældigvis gigabyte og ikke gibibyte
1.000 byte = 1 kilobyte
1.024 byte = 1 kibibyte osv


Den er regnet ud af Google Calc, så ret din kritik mod dem ;)
Gravatar #12 - cordion
9. jun. 2010 10:15
#11
dvs du er ikke kritisk over for det du læse på det "troværdige" internet? ;)
Gravatar #13 - Giggity
9. jun. 2010 10:16
Var jeg den eneste der så overskriften og gik direkte til kilden for at se et skema over de mest kaffein indholdige drikke?

Edit: Ja jeg ved godt de sider findes i forvejen.
Gravatar #14 - MEGAMASTER4000
9. jun. 2010 10:17
#3

"Flot X fra de FEDE trin, du har tabt dig, hvad der svarer til 24 fodboldbaner!"

Elsker mediernes måde at gøre "uoverskulige" datarepræsentationer, lettere at forstå -.-
Gravatar #15 - el_barto
9. jun. 2010 10:23
cordion (12) skrev:
#11
dvs du er ikke kritisk over for det du læse på det "troværdige" internet? ;)


Er vi enige om at Google opgør det til 100 millioner gigabytes?
Er vi enige om at Google Calc opgør 100 millioner gigabytes som 95.3674316 petabytes?

Er vi enige om at det er Google der pwns the internetz?
Gravatar #16 - mollerz
9. jun. 2010 10:27
Er vi enige om, at det kan være pisse ligemeget? Indekset fylder sindsygt ekstremt meget og i den sammenhæng kan 5 petabyte være underordnet. Det er en 5% +/- afvigelse - og det kan jeg altså godt leve med.

Igen, hvad er forskellen i jeres verden? Jeg kunne forstå det, hvis det var afgørende for om Google slog en eller anden rekord, men det er afaik ikke tilfældet.
Skal vi ikke bare blive enige om, at Googles datacentre er enorme og at de har mere plads end de fleste ;-)
Gravatar #17 - Sirius7dk
9. jun. 2010 10:34
#16 XKCD forklarer hvad det er der er sket i denne traad :)

http://xkcd.com/386/
Gravatar #18 - Daniel-Dane
9. jun. 2010 10:35
Sirius7dk (17) skrev:
#16 XKCD forklarer hvad det er der er sket i denne traad :)

http://xkcd.com/386/
Det er nok nærmere den her:
http://xkcd.com/394/
Gravatar #19 - Sirius7dk
9. jun. 2010 10:47
Kendte slet ikke nummer 394 :)
Gravatar #20 - kr00z0r
9. jun. 2010 11:01
#7: Det er vel tillladt at runde af?

#18: Skal vi ikke bare vælge kompromisløsningen på 1012 bytes? Så må alle da være glade.
Gravatar #21 - Møller
9. jun. 2010 11:01
Sirius7dk (19) skrev:
Kendte slet ikke nummer 394 :)


Føj, kan du vaske din mund med sæbe, og så vil jeg ikke se ét indlæg mere fra dig før du har været alle 751 igennem!
Gravatar #22 - squize
9. jun. 2010 11:10
Gad vide om de kører en daglig backup af deres data ? :)
Gravatar #23 - LordMike
9. jun. 2010 11:16
#22
Nej, jeg tror at googles filosofi er at det hele skal være live, altid. Så der vil på den måde altid være x (x>1) antal maskiner med en given data på samtidigt, skulle én af dem gå ned - så sørger skyen for at replicere dataene andetsteds.

Backup er ikke nødvendig - alle datacentre er spejlede på en eller anden vis. Hvis der så er major-power-down-nuclear-bomb-loss, så er google på røven.

Som jeg har forstået det :P
Gravatar #24 - f3rret
9. jun. 2010 11:18
Huh....Så er det klart, Google har hemmelige planer om at overtage verdenen.

Ah well, i det mindste bliver det en velorganiseret verden.
Gravatar #25 - Scapegoat
9. jun. 2010 11:24
#23 og i værste tilfælde så starter de vel bare maskinerne op forfra og begynder at suge data forfra?
Det data som google indekserer er jo nu engang ikke meget mere end backup af anden data på internettet?
Gravatar #26 - cordion
9. jun. 2010 11:50
#23
krydser fingre for at verden ikke bliver ramt af en alt ødelæggende asteroid ;)
Gravatar #27 - Zhadu
9. jun. 2010 12:18
Nu har vi da fundet ud af, hvem der har en backup af Internettet :O
Gravatar #28 - Lomholt
11. jun. 2010 10:00
De må da have brugt det i noget tid, jeg har oplevet at finde mine blogindlæg på google KORT tid efter jeg har skrevet dem på min blog - men jeg har os rimelig SEO jo ;)
Gå til top

Opret dig som bruger i dag

Det er gratis, og du binder dig ikke til noget.

Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.

Opret Bruger Login