Datenaufkommen
Berechnung des Datenaufkommen aufgrund der Vorratsdatenspeicherung
Festnetz Telefonie
Kurzfassung der Formel mit Vereinfachung (ausgefüllte Variablen):
Datenaufkommen [in Bit] = (TelNrQuelle + TelNrZiel + Zeitpunkbeginn +
ZeitpunktEnde ) * Kunden * Gespräche pro Tag * Speicherdauer
TelNr = 32 Bit
TelNrZiel = 32 Bit
Zeitpunkbeginn = 64 Bit
ZeitpunktEnde = 64 Bit
Datenaufkommen [in Bit] = (32 + 32 + 64 + 64 ) * Kunden * Gespräche pro Tag * 185 Tage
Datenaufkommen [in Bit] = (192) * Kunden * Gespräche pro Tag * 185 Tage
Kunden = unbekannte, weiviel Telefonanschlüsse gibt es Bundesweit?
Gespräche pro Tag = unbekannte, gibt es dazu eine Statistik
Weitere Eckdaten:
Unternehmen Kundenanzahl
NetCologne 500.000
HansaNet 200.000
Arcor 1.600.000
Mobilfunk
TelNrQuelle QuelleIMEI OrtQuell TelNrZiel ZielIMEI OrtZiel Zeit_t0 Zeit_t1 x1 Kunden
221–1234567 15 Stellen ZelleIDy 221–9876543 15-Stellig ZelleID 16.11.07:16.00 16.11.07:16.22
Mögliche Datentypen
Int 32bit, uns Varchar (20) Int 32bit, uns Inte 32bit, uns Varchar (20) Int 32bit, un Time + date Time + date
20*8 20*8
Bitanzahl 32 160
Ort = Standort
Quellen: http://www.rui.de/mobil/codes.html
Internet-Verbindungen
Quell-IP Ziel-IP Zeitpunkt t0 Aufruf x1 Kunden
Mögliche Datentypen
Varchar (15) Varchar (15) Time + date 64 bit (8byte)
Bit Anzahl 120 120 64
- IPs sind nur max. 15 Zeichen lang, man kann sie aber auch als Zahlencode Speichern.
- Date-Time kann man als String oder auch als UNIX-Timestamp speichern.
- afaik werden aber nicht nur die IP-s, sondern Hostnames, wenn nicht sogar URLs gespeichert, was erheblich mehr auffwand ist. --CeBe 02:50, 3. Jan 2008 (CET)
==> Frage, werden auch die Portadresse gepeischert, dass wären dann 6 Stellen mehr! (Doppelpunkt als Trennzeichen) x1= Verbindungen pro Kunde
==> Ich habe an meinem heutigen Arbeitstag laut Firewall ~ 9.500 Verbindungen innerhalb von 24h gehabt.
Messenger, Emails, Updates, 50 offene Firefox Sitzungne mit jeweils 5 Tabs ganz normaler Büroalltag
Absender Empfänger VonIP Betreff x1 Kunden
Mögliche Datentypen
Varchar (50) Varchar (50) Varchar (50) Varchar (50)
Bitanzahl
400 Bit 400 Bit 400 Bit 400 Bit
x1= Anzahl Emails pro Kunde
Anzahl Kommunikationsteilnehmer
laut Bundesnetzagentur (früher RegTP) gab es 2007:
53,7 Mio Festnetzanschlüsse (Kanäle),
96 Mio Mobilfunkanschlüsse,
3,9 Mio. VoIP Anschlüsse über DSL sowie
1,23 Mio. Sprachanschlüsse über TV-Kabel (Breitbandkabel).
Macht also insgesamt:
154,83 Mio. Telefonanschlüsse in Deutschland.
Telefonnummern werden üblicherweise als ASCII-String gespeichert, d.h. man benötigt pro Nummer mindestens 18 bytes.
Datum und Uhrzeit üblicherweise in der Form YYYYMMDDhhmmss, also (ebenfalls in ASCII) 14 bytes. Statt der Endezeit wird üblicherweise die Dauer (in Sek.) gespeichert, ebenfalls als ASCII-String.
Meist werden die Daten als CSV-Datei gespeichert, d.h. pro Feld kommt noch ein Trennzeichen (Komma oder Semikolon) hinzu.
In Deutschland gibt es ca. 40 Mio. Festnetzanschlüsse. Hier rechnet man (im Privatkundenmarkt) üblicherweise mit durchschnittlich 3 Gesprächen pro Anschluss und Tag.
Im Mobilfunk (Post-paid, also mit monatlicher Rechnung)rechnet man mit durchschnittlich 5 Gesprächen pro Anschluss und Tag, im pre-paid Markt ist es wesentlich weniger, aber ich kenne keine aktuellen Zahlen.
Hier müssen auch die Informationen zur Identifikation der Funkzelle berücksichtigt werden, das sind nochmals mindestens 14 bytes.
Das, was hier beschrieben wurde, sind die minimalen Daten, die gespeichert werden sollen, i.d.R. wird noch etwas mehr gespeichert, wie Call Id, Vermittlungsstelle, etc. Hierfür kann man getrost einen Aufschlag von 50 - 100% berechnen.
Viele Grüße Bernhard.
Berichtigung:
Die Angaben bei der Bundesnetzagentur sind *nicht* die Telefonanschlüsse sondern die Kanäle!
Demzufolge gibt es nicht, wie ich irrtümlich schrieb 154,83 Mio. Anschlüsse sondern 154,83 Kanäle.
Ein Anschluss kann auch mehrere Kanäle beinhalten. Ein ISDN-Basisanschluss hat 2 Kanäle. Ein sog.
ISDN-Primärmultiplexanschluss (ISDN PMX)hat 30 Kanäle. Es wird angegeben, dass für die Kabel-TV-Telefonie
durchschnittlich etwa 1,5 Kanäle pro Zugang ermittelt wurden.
Bei http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 27 in der pdf, Abbildung 7 wird die
Gesamtanzahl der Telefonanschlüsse (OHNE Mobilfunk!) mit 38,12 Mio. angegeben.
Wenn man noch den Mobilfunk dazurechnet gibt es:
38,12 Mio. Telefonanschlüsse - OHNE Mobilfunk
96 Mio. Mobilfunkanschlüsse
=> 134,12 Mio. Telefonanschlüsse gesamt
Ich habe mal versuch die Daten in ein Python Script zu packen und das ganze mal ganz grob für Festnetzanschlüsse auszurechnen.
Mit meinen verwendeten Werten wäre das ungefähr 290 TByte/Jahr, aber das hängt erstens stark von den verwendeten Gesprächen pro Tag und zweitens von der Größe der Datenfelder ab. Die Datenfelder haben bei einer minimalen Betrachtung sicherlich eine realistische Größe, aber hat da jemand konkrete Vorgaben?
Ergänzungen zum Script sind willkommen.
==> Immer auf 185 / Halbes Jah rechnen. Sonst explodieren die Daten.
Wie führe ich das Skript aus?
Quellen:
http://www.bundesnetzagentur.de/media/archive/12186.pdf Seite 25