Data Mining / Kryptographie

Diese Frage mag sich für jemanden der sich damit auskennt ziemlich dämlich anhören (wie gesagt ich kenn mich mit sowas leider noch so gut wie gar nicht aus…) v.a. wenn es denn keinen Zusammenhang gibt, aber ich hab mich gefragt ob die Gebiete Data Mining und Kryptographie irgendwie miteinander zusammenhängen. Ich nehme an, dass es zwar beides irgendwie verwandt ist (Data Mining -> u.a. Spam und Spambekämpfung, Kryptographie -> u.a. Viren und Antivirensysteme…wenn ich mich nicht täusche), aber an sich keine besonderen fachlichen Überschneidungen gibt, richtig oder falsch?

(finde beide Gebiete hören sich richtig interessant an, wobei bei Data Mining die Spambekämpfung wohl nicht unbedingt die ‚Hauptrolle‘ spielt, da gibt’s noch andere Bereiche die mich interessieren)

Gruß

Moin,

data mining ist eine Technik, mit der Strukturinformationen über Daten aus den Daten selbst gewonnen werden können. Um Spam zu erkennen, müssen keinerlei Informationen über Strukturen vorliegen (wüsste auch nicht, was da strukturiert wäre), insofern ist der Begriff data mining hier weit überzogen oder auf neudeutsch oversized.

Kryptographie hat mit data mining schon gar nichts zu tun. Ob data mining beim Code-Knacken hilft, weiß ich nicht, bezweifle ich aber sehr. Data mining versucht Zusammenhänge über gleiche Inhalte herzustellen; verschlüsselt wird ja gerade, um die Inhalte zu verbergen.

Gruß Ralf

[snip] aber ich hab mich gefragt ob die Gebiete Data Mining
und Kryptographie irgendwie miteinander zusammenhängen.

Hm… eher nicht. Vielleicht nur ein ganz wenig.

Ich nehme an, dass es zwar beides irgendwie
verwandt ist (Data Mining -> u.a. Spam und Spambekämpfung,

Uhm, weniger. Data Mining ist das Strukturieren von unstrukturierten Daten. Es ist zwar ungemein hilfreich, diskrete Merkmale von Spam (bzw. Ham) zu suchen, um darauf basierend unbekannte Mails in Spam/Ham einzuteilen, aber das ist wirklich nur ein Teilgebiet. Der Kniff dabei ist eigentlich, zu entscheide, welche der gefundenen Merkmale denn nun Spam bzw. Ham auszeichnen. Das ist dann zwar auch eine Art „Data Mining“ (auf den Merkmalen), aber da sind dann eher Methoden des Maschinellen Lernens oder der Kuenstlichen Intelligenz gefragt.

Kryptographie -> u.a. Viren und Antivirensysteme…

Aehm, auch nein. Kryptographie ist die Wissenschaft von der Verschluesselung von Informationen und hat _ueberhaupt_ nichts mit Viren zu tun.

Links: http://de.wikipedia.org/wiki/Data_Mininghttp://de.wikipedia.org/wiki/Kryptographie
HTH,
Gruss vom Frank.

Hallo.

Diese beiden Begriffe können durchaus zusammenhängen. WENN man das Knacken von Codes (gegen Kryptographie) mit dem Sammeln und Bewerten von Informationen (Data Mining) angeht. Ansonsten ist die Verschlüsselung von Informationen aus einem Data Warehouse dann interessant um die falschen Zeitgenossen aussen vor zu lassen. Ansonsten gehen sich die beiden Gebiete eher aus dem Weg.

HTH
mfg M.L.

***coole Sache***
Business Information Warehouse @ SAP Web Application Server 6.40 RC1 - vorausgesetzt, man muss keine Metadaten definieren…

ja, es gibt einen Zusammenhang
Hallo Fragezeichen,

mit Data-Mining kenne ich mich nicht aus, aber ich stütze mich jetzt vor allem auf die erste Definition im Wikipedia-Artikel.
Grundlage des Zusammenhangs ist die Informationstheore (Shannon et al.). Man kann weiterhin beobachten, daß Buchstabenhäufigkeiten, insbesondere in Abhängigkeit zu Vorgängern nicht gleichhoch sind. (etwa wird „V“ im deutschen als zweiter Buchstabe eines Wortes seltener vorkommen). Daran sieht man, daß Text, Information und damit auch verschlüsselte Nachrichten durchaus eine Struktur haben (i.A. sollten sich Daten von einer reinen Zufallsfolge unterscheiden).
Die perfekte Verschlüsselung sieht wie eine Zufallsfolge aus (und bedient sich einer): das One-Time-Pad. Daher ist ein guter Kryptograph auch ein guter Data-Miner. Beispiel: Enigma: die Nachrichten der Deutschen hatten deswegen bestimmte Strukturen, weil sie u.a. feste Anreden benutzten. Diese Strukturen spiegelten sich in den verschlüsselten Nachrichten wieder, was eine weitere strukturelle Analyse erfolgversprechend werden lies (und letztlich zum Erfolg führte). Der Zusammenhang ist ganz offensichtlich da.
Noch ein Beispiel: Reise zum Mittelpunkt der Erde von Jules Verne.

Grüssle,
Markus

Hi,

krass, zwei Markuse, ein Gedanke und beide daneben.

Daran sieht man, daß Text, Information und damit auch
verschlüsselte Nachrichten durchaus eine Struktur haben.

Mit dem, was Du hier beschreibst, beschaeftigt sich die Kryptoanalyse, nicht die Kryptographie. Beide Wissenschaften werden vereint durch die Kryptologie. Es stimmt wahrscheinlich, dass sich Kyptographen zwangslaeufig auch mit Kryptoanalyse beschaeftigen werden. Und der Zusammenhang duerfte weitaus enger als zwischen Data-Mining und Kryptographie sein.

Enigma: die Nachrichten der Deutschen hatten deswegen bestimmte
Strukturen, weil sie u.a. feste Anreden benutzten.

Kryptoanalyse.

Noch ein Beispiel: Reise zum Mittelpunkt der Erde von Jules
Verne.

Das versteh ich nicht.

Gruss vom Frank.

Noch ein Beispiel: Reise zum Mittelpunkt der Erde von Jules
Verne.

Das versteh ich nicht.

Analyse verschlüsselter mittelalterlicher Runentexte: http://www.staff.uni-mainz.de/pommeren/Kryptologie99…

Gruss
Schorsch

Hallo Frank,

krass, zwei Markuse, ein Gedanke und beide daneben.

Das verstehe ich nicht. Ist aber vielleicht auch unwichtig, sofern DU es nicht erläutern kannst.

Daran sieht man, daß Text, Information und damit auch
verschlüsselte Nachrichten durchaus eine Struktur haben.

Mit dem, was Du hier beschreibst, beschaeftigt sich die
Kryptoanalyse, nicht die Kryptographie.

Oh mea culpa, mea maxima culpa. Ich weise zwar selber ab und an auf diese Unterscheidung hin, aber selten als ein Argument. das stimmt zwar, aber viele benutzen „Kryptographie“ als Synonym zu „Kryptologie“. Von daher steht das, was ich sagte, auf sehr festem Boden („Die Bedeutung eines Wortes ist sein Gebrauch in der Sprache“ Wittgenstein, Philosophische Untersuchungen).

Beide Wissenschaften
werden vereint durch die Kryptologie. Es stimmt
wahrscheinlich, dass sich Kyptographen zwangslaeufig auch mit
Kryptoanalyse beschaeftigen werden.

Es stimmt nicht nur, es ist notwendig. Man kann keine sicheren Verschlüsselungen entwerfen ohne sie zu analysieren. Auch deswegen ist die Unterscheidung zwischen K-graphie und K-analyse richtig, aber in Bezug auf das Thema unnütz.

Enigma: die Nachrichten der Deutschen hatten deswegen bestimmte
Strukturen, weil sie u.a. feste Anreden benutzten.

Kryptoanalyse.

Enigma: Kryptographie.
Damit sieht man wie unnötig diese leere Begriffsreiterei ist.

Noch ein Beispiel: Reise zum Mittelpunkt der Erde von Jules
Verne.

Das versteh ich nicht.

Ich freue mich über Schorschs Hinweis!
Grüssle,
Markus

Hi Markus,
danke für deine Beiträge. Ich muss aber nochmal was fragen, nicht, dass ich mich da selbst von vorneherein vertan habe. Gibt es signifikante Unterschiede zwischen den Gebieten Data Mining, Text Mining & Information Retrieval/Extraction oder haben die alle mehr oder weniger die selbe Bedeutung? Also mehr oder weniger das Aufspüren bestimmter (Text-)Muster und somit Informationen…? Im Prinzip sind das doch alles verwandte bzw. Teilgebiete der Computerlinguistik oder täusch ich mich da? Ich interessier mich nämlich u.a. für Computerlinguistik als Studienfach und hab gelesen, dass viele Computerlinguisten auch in diesen Bereichen arbeiten. Ich hab das jetzt (fälschlicherweise?) alles über einen Kamm geschert und dachte, dass man das Entwickeln von Suchalgorithmen für Suchmaschinen einerseits als Data Mining/Text Mining (Daten- /Text"abbau") bzw. auch als Information Retrieval/Extraction (Informationserschließung/-extrahierung/gewinnung…wie auch immer) bezeichnen könnte. Hab ich das ein bisschen zu engstirnig betrachtet, da die Begriffe nicht als Synonyme für einander verwendet werden oder stimmt das so in etwa?

Text Mining ist wahrscheinlich ein Teilgebiet von Data Mining, sprich es geht beim Ersteren nur um Text und beim Letzteren um alle möglichen Daten, aber im Prinzip werden die gleichen Methoden verwendet?

Du bist anscheinend der Meinung, dass es einen nicht zu geringen Zusammenhang zwischen Data Mining und Kryptographie(-logie,etc.) gibt, aber wenn ich das jetzt so verstehe, dass „Hacken“ also das Entschlüsseln von Codes (bzw. das Entwickeln) aus Data Mining besteht (da sich Data Mining auch mit dem Aufspüren bestimmter Muster etc. beschäftigt oder irr ich mich da jetzt?bin inzwischen leicht durcheinander) und Hacker in erster Linie „Data Miner“ sind, aber Kryptographie bzw. Kryptologie ein noch weiteres Gebiet ist, dann ist das wahrscheinlich ein totaler Trugschluss oder? (so würde ich das jetzt aus den Informationen erschließen, aber andererseits denk ich mir, dass das nicht stimmen kann, da ich sonst schonmal den Begriff Hacker mit dem Begriff Data Mining zusammen gelesen hätte…)

Du kennst dich mit Computerlinguistik nicht zufällig aus? Studierst ja laut Profil Philosophie u. auch Mathe und scheinst Ahnung von informatiktechnischen Sachen zu haben…

Thx + Gruß

[Bei dieser Antwort wurde das Vollzitat nachträglich automatisiert entfernt]

Hallo,

Du bist anscheinend der Meinung, dass es einen nicht zu
geringen Zusammenhang zwischen Data Mining und
Kryptographie(-logie,etc.) gibt,

In der Kryptanalyse kommen manchmal, aber bei weitem nicht nur, Techniken zum Einsatz, die man auch als „Data Mining“ bezeichnen könnte.

„Data Mining“ bedeutet ja erstmal nur „das systematische (in der Regel automatisierte oder halbautomatische) Entdecken und Extrahieren unbekannter Informationen aus großen Mengen von Daten.“ (wikipedia)

Die Kryptanalyse heutiger Verschlüsselungsalgorithmen erfordert jedoch zusätzlich einen ganze Reihe anderer Techniken, die nichts mit „Data Mining“ zu tun haben.

aber wenn ich das jetzt so
verstehe, dass „Hacken“ also das Entschlüsseln von Codes (bzw.
das Entwickeln) aus Data Mining besteht und
Hacker in erster Linie „Data Miner“ sind, aber Kryptographie
bzw. Kryptologie ein noch weiteres Gebiet ist, dann ist das
wahrscheinlich ein totaler Trugschluss oder?

Ja. Siehe oben - Mustererkennungstechniken sind nur ein kleiner Teil bei einem „Angriff“ auf einen Algorithmus.

Der Begriff „Data Mining“ wird im Allgemeinen übrigens eher auf höheren Abstraktionsebenen verwendet - Kryptanalyse bewegt sich ja eher im Bereich von Bits und Bytes.

Nochmal zu den Begriffen: Auch ich halte da eine korrekte Wortwahl für wichtig - ein Kryptanalytiker muß nicht zugleich Kryptograph sein und umgekehrt genausowenig. Wissen aus dem jeweils anderen Bereich wird stets hilfreich sein und durch die verwendeten Methoden überschneiden sich die Wissensgebiete der jeweiligen Personen ohnehin, aber die Wissenschaften Kryptanalyse und Kryptographie haben gegensätzliche Zielsetzungen und verschiedene Methoden.

Gruß,

Malte.

Hallo Fragezeichen,

leider kann ich Dir zu Data Mining keineauskunft geben, ist nicht mein Gebiet.

Du bist anscheinend der Meinung, dass es einen nicht zu
geringen Zusammenhang zwischen Data Mining und
Kryptographie(-logie,etc.) gibt,

Richtig.

aber wenn ich das jetzt so
verstehe, dass „Hacken“ also das Entschlüsseln von Codes (bzw.
das Entwickeln) aus Data Mining besteht

Nein, „hacken“ und „cracken“ haben so gut wie nichts mit Data Mining zu tun. Hacken hat nur am Rande mit Kryptologie und so mit Data Mining zu tun.

Du kennst dich mit Computerlinguistik nicht zufällig aus?

sorry, ne. (auch wenn ich mal paar Vorträge dazu gehört habe). wird manchmal auch als teilgebiet der kognitionswissenschaft behandelt.

Studierst ja laut Profil Philosophie u. auch Mathe und
scheinst Ahnung von informatiktechnischen Sachen zu haben…

ja, habe mich in Mathe u.a. mit theoretsicher Informatik beschäftigt und arbeite u.a. als Datenverarbeituungssystemtechniker.

Grüssle,
Markus

Hallo Malte,

aber die Wissenschaften
Kryptanalyse und Kryptographie haben gegensätzliche
Zielsetzungen und verschiedene Methoden.

Würdest Du mir dennoch zustimmen, daß niemand auf dem Gebiet der Kryptogrpahie wissenschaftlich arbeiten kann, wenn er nicht wesentlich und regelmässig Kryptanalyse anwendet?

Gruß,
Markus

Hi,

aber die Wissenschaften
Kryptanalyse und Kryptographie haben gegensätzliche
Zielsetzungen und verschiedene Methoden.

Würdest Du mir dennoch zustimmen, daß niemand auf dem Gebiet
der Kryptogrpahie wissenschaftlich arbeiten kann, wenn er
nicht wesentlich und regelmässig Kryptanalyse anwendet?

hm, ich denke, das kann man so sagen. Trotzdem sind es zwei Paar Schuhe, auch wenn die Personen, die die eine Wissenschaft ausüben, mitunter auch die andere betreiben.

Gruß,

Malte.