unknown

Modellering af spam som et spil

26 jul. 2005 11:46 - Via NewScientist - af hfp , redigeret af Net_Srak

Når man laver et spamfilter er det en balancegang. Hvis man “strammer” reglerne i et forsøg på at fange flere spammails, vil det måske også fange almindelige mails og hvis man “løsner” på reglerne, vil der måske komme flere spammails igennem filteret.

Forskere fra Athen mener, at måden at finde denne balance på, er at modellere interaktionen mellem spammere og email-brugere som et spil mellem to personer. Med denne model kan de beregne både brugerens og spammerens omkostninger og fordele ved brug af et bestemt filter.

I modellen laver spammeren det første træk ved at afgøre, om vedkommende vil sende spam eller ej. Spamfilteret klassificerer mailen som spam eller legitim, og brugeren laver så et træk ved at bestemme, om vedkommende vil læse mailen eller ej.

Man beregner så ved hjælp af en mængde ligninger omkostninger og fordele for hvert filter. I den beregning indgår bl.a. antallet af spammails, der kommer gennem filteret og antallet af legitime mails, der bliver fanget. Som resultat af ligningerne får man nogle udtryk, som repræsenterer omkostninger og fordele for brugeren og spammeren for hvert filter.

Denne model kan bruges til at indrette spamfiltre, så brugerens omkostninger minimeres og fordele maksimeres. Man kan også indrette dem, så spammerens omkostninger maksimeres og fordele minimeres.

Forside
⟨
Forum
⟨
Nyheder

Gå til bund

#1 - knasknaz
26. jul. 2005 12:01

Spam er fremtidens skakspil.

#2 - Beorn
26. jul. 2005 12:03

%1 hvordan hulen laver man en kongerokade med spam?

men ja jeg tænkte også på skak da jeg læste nyheden :-)

#3 - Regus
26. jul. 2005 12:12

#2
Godt spørgsmål, men der blev i hvert fald blevet dømt skak mat i rusland her for forleden :-)

#4 - little-gun-42
26. jul. 2005 12:59

#1 Haha - lol

det er her, man næsten skulle have indsendt denne "nyhed" (var på /. for et stykke tid siden);

"Kan et spamfilter spille skak?"

http://dbacl.sourceforge.net/spam_chess.html

#5 - BeLLe
26. jul. 2005 13:16

Denne model kan bruges til at indrette spamfiltre, så brugerens omkostninger minimeres og fordele maksimeres. Man kan også indrette dem, så spammerens omkostninger maksimeres og fordele minimeres.

Kan disse modeller ikke osse bruges af spammere til at tilpass deres mails til at omgå filterne og derved maksimere deres fordele

#6 - knasknaz
26. jul. 2005 13:35

#4: Jeg er flad af grin!

#7 - Soze
26. jul. 2005 13:55

Er de ikke rimelige teoretiske? De fleste problemer i livet kan løses ved at sætte dem op i en formel som denne :)

#8 - terrak
26. jul. 2005 14:59

Lige en tanke:

Jeg vil umiddelbart tro at det punkt hvor spam skiller sig mest ud, er hvor mange personer personer det bliver sendt til. Min tanke er så om man ikke kunne sammenligne indholdet af mailen, med indholdet af andre brugeres mails, rundt i verdenen.
Hvis der er mange matches, er det muligvis et nyhedsbrev, er der rigtig mange, ja så er der større sandsynlighed for det er spam.

Q- Jamen, så skal man jo balancere punktet mellem spam og nyhedsbreve?
A- Jeg tror der bliver sendt væsentlig flere spam mails, end der bliver sendt nyhedsbreve, men ellers må de nyhedsbreve man modtager komme på whitelisten.

Q- Der er jo milliarder af mails og hvis du skal søge på computere over hele verden, kommer det jo til at tage en krig.
A- Saml det i én database.
Q- Det fylder da alt for meget, og nu tager det bare 2 krige i stedet for. Og hvad med privatliv? Det er nok de færreste der har lyst til at få sendt indholdet af sine private mails til hele verden, bare så de kan sammenligne.
A- Det er ikke størrelsen, men gørelsen - Vi md5 hasher indholdet.
Q- Så hvis vi har 1 milliard 32-byte strenge gemt, kræver det (10^9*32)/2^30 ~= 29,8 GB. Alt dette skal sendes gennem én forbindelse?
A- Det er stadig ikke størrelsen :) Vi behøver ikke gemme på dem, men simpelthen bare, populært sagt, lave en i++, så det bare er et nummer der tæller op. Man kunne så også fordele belastningen lidt over flere servere, da de også skal kunne køre nogle kanon tunge queries og servere dem til en masse brugere.

---

Et par kommentarer ville være dejligt, specielt til hvilken del der er uladesiggørligt, en falskehals etc.

#9 - mazing
26. jul. 2005 15:16

Altså et dynamisk filter? Lidt nemmere at forstå end den lange forklaring ;)

#10 - knasknaz
26. jul. 2005 15:19

#8: Hash-ideen har en svaghed: Hvis man randomiserer bare en enkelt karakter i spammailen, vil den få en ny hash værdi. Jeg kan desværre ikke lige hitte på en løsning...

#11 - terrak
26. jul. 2005 16:04

#10 Det er så rigtigt. Dog vil det tvinge spammere til at tage et skridt, som muligvis gør afsendelsen-processen en smule længere, men det er måske lige lovligt meget at registrere alverdens mails, når det kan omgås så let.

#9 Dynamisk filter? Hvad er filteret i #0 så, hvis det ikke, bl.a., er dynamisk?

#12 - mkrist
26. jul. 2005 18:49

#11: Det vil blot kræve at spammeren har et script eller noget til at tilføje et enkelt bogstav et tilfældigt sted i mailen, og det er ikke særligt resource- eller tidskrævende. Din idé er klart overkill, fordi man, som du også selv siger, forholdsvist nemt kan omgå den.. Men ellers en interessant tanke.

Forside
⟨
Forum
⟨
Nyheder

Gå til top

Opret dig som bruger i dag

Det er gratis, og du binder dig ikke til noget.

Når du er oprettet som bruger, får du adgang til en lang række af sidens andre muligheder, såsom at udforme siden efter eget ønske og deltage i diskussionerne.

Opret Bruger Login

mboost-dp1

Nyheder

Seneste kommentarer i nyheder

Seneste kommentarer i forum

Modellering af spam som et spil