Mark Klamberg och jag har haft en diskussion angående mitt inlägg om FRAs spaning och falska träffar. Bakgrunden är det som kallas ”false positive paradox” eller ”base rate fallacy” som matematiskt visar att om man söker efter ett litet antal intressanta objekt bland en stor mängd ointressanta objekt med en metod som inte har 100% träffsäkerhet så kommer den största delen av träffarna vara ”falska positiva” dvs ointressanta objekt som felaktigt blivit markerade som intressanta. Läs gärna mer om det i mina inlägg ”Underrättelser och FRA-lagen”, ”Statistik och varför FRA-lagen är en dålig idé” och ”Varför FRA-lagen är en dålig idé III” (den sista med illustrativ grafik).
Idag förklarar Mark, med anledning av SVTs nyhet om att EU-nämnden bara fick 30 minuter på sig att fatta ett beslut om överlämnande av bankinformation till USA (mer info finns hos Emma Opassande), att han anser att ”data mining” dvs informationsutvinning kan vara effektivt förutsatt att den är riktad. Här har han helt rätt. Med en riktad informationsutvinning så har man minskat ner mängden ointressanta objekt i förhållande till andelen intressanta varvid andelen falska träffas minskas. Om vi relaterar detta till FRAs verksamhet så var det precis så FRA ursprungligen jobbade. Man spanade på radiosignaler på militära frekvenser samt signalmönster hos radaranläggningar och andra militära installationer. Mängden relevant information var således hög och risken för kränkningar av civilas personliga integritet var låg.
Senare började FRA avlyssna även annan radiotrafik som t ex telefonkommunikation via satellit och förmodligen också monitera spionsatelliters kommunikation med sina baser på jorden. Fortfarande är andelen intressanta trafik relativt hög och trafikvolymerna relativt låga. Med tiden och i takt med att allt mer långväga kommunikation flyttade till kablar i marken och att kapaciteten på fiberkablar växte så börjde FRA få problem. Mycket information som tidigare gått via satellit flyttar nu ner i kommunikationskablarna och det är här FRA-lagen kommer in i bilden. För att fortfarande kunna få tillgång till den information som flyttat från radio till kabel så anser FRA att dom måste få tillgång även till kablarna. Problemet är bara att i kablarna flödar enorma mängder information som FRA inte är intresserade av. Det är IP-telefonisamtal, vår e-post, facebook, fildelning, nyheter, chatt, porr, tidsynkningar, fjärrinloggningar, USENET-meddelanden, bankärenden, näthandel osv, din och min vardagskommunikation, viss information är personlig eller känslig annan är helt okänslig. I dagsläget handlar det om ca 160 gigabit per sekund (80 Gbit/s åt vadera hållet) som passerar genom knutpunkterna i Sverige enligt Netnod! Det är totalt 1.5 petabyte information per dag (eller 1.7 petabyte om man använder SI-prefix). Prefixet peta är en 1:a med 15 nollor efter sig! Ur denna informationsflod ska FRA med stor precision vaska fram relevant information. Vi räknar lite på detta…
Om vi antar att det skickas 1 Gbyte för FRA intressant information genom Sverige på en dag. Jag misstänker att detta är grovt överdrivet men det gör inget för siffrorna blir helt absurda i alla fall. Med 90% precision på FRAs filter (vilket förmodligen är extremt bra) så fastnar 900 Mbyte intressant data och 173 Tbyte ointressant (192000 ggr mer)! Andrar vi till att filtret istället har en precision på 99% så fastnar 17 Tbyte varav 990 Mbyte är intressant (över 17000 ggr mer ointressant än intressant). Om vi antar att FRAs filter har en precision på 99.99% så skulle totalt 174 Gbyte intressant data fastna och av detta skulle 999.9 Mbyte vara intressant. Andelen felaktigt identifierad trafik är fortfarande 173 ggr större! det mesta som fastnar i FRAs filter är således irrelevant information, din och min vardagskommunikation!
Hör gör man då datainsamlingen mer riktad? Det mest uppenbara är att söka närmare den källa som man vill ha information om. Misstänker man spioneri utfört av tjänstemän från ett Y-ländskt företag så avlyssnar man trafiken på kommunikationskablarna till bolaget, ett jobb för SÄPO och hemlig teleavlyssning. Försök att fånga intressant information vid landsgränsen fungerar inte utan kommer att orsaka en ohygglig massa falska träffas vilket i sin tur kan orsaka personliga tragedier om någon t ex blir uppförd på en terror-lista av misstag eller utpekad som spion. Än värre är att systemet kan missbrukas eller oavsiktligt läcka känslig information.
DÄRFÖR SKA INTE KABLARNA KOPPLAS IN TILL FRA.
Andra bloggar om: FRA, avlyssning, övervakning, Mark Klamberg, SÄPO, integritet, bankuppgifter, Piratpartiet
[…] studie kan dock generaliseras. Den nya FRA-lagen kommer ofelbart att leda till ett ökat antal falska träffar. Dessa falska träffar måste följas upp och med tiden kommer uppföljningen bli slappare och […]