Das Big Data Problem

Für die meisten Normalos – mich eingeschlossen – ist der Begriff „big data“ erstmal mit Fragezeichen versehen. Was genau meint man damit? Was machen die denn mit den ganzen Daten? Ist das schlimm oder gut? Kommt drauf an. Die Datensammelei begegnet uns ja täglich, ob es klassische Preisausschreiben sind oder Click-bait-Headlines, denen wir folgen und mal schnell die Cookies akzeptieren. „Ich hab doch nichts zu verbergen“. Deshalb fragt man auch nicht, warum die News-Seite unser Geburtsdatum wissen will. „Ich will aber jetzt diese unglaublichen Vorher-Nachher-Fotos von den Celebrities sehen“. Außerdem ist doch echt so bequem, alle seine Katzenfotos bei Facebook zu speichern. Und die ganzen lustigen Memes bei Google Drive. Und so weiter …

  1. Ich habe ein Problem damit, weil es die Autonomie über meine persönlichen Informationen zerstört. Nicht, weil wir in einer Diktatur leben. Wir zeigen mit dem Finger auf diktatorische System wie China, die jeden Schritt seiner Milliarden Untertanen verfolgen und Sozialpunkte vergeben. Der Westen überlässt diese Überwachung seinen Milliarden-schweren Werbekonzernen.
  2. Diese Konzerne sammeln meine Daten nicht, um die Welt zu retten, sondern um mir Werbung zu zeigen – das ist der einzige Zweck. Werbung! Und Produkte zu verkaufen, die wir ohne die Werbung nicht kennen oder brauchen würden.
  3. Die Big-Data-Sammelwut benötigt unglaubliche Mengen an Platz für Server, Festplatten etc. Außer dem Grund und Boden auch eine Halle. Dann die Hardware, um Phantastillionen an Dateien speichern und wiederfinden zu können. Dann Spezialisten, die die Daten maschinell Auswertbarkeit machen und die Hardware pflegen. Was das wohl alles kostet? Sicher ist: Die Kosten dafür trägt natürlich jeder Kunde beim Kauf eines jeden Produkts. Das macht ja keiner umsonst.
  4. Ähnlich wie die völlig nutzlose Prozessor-Vollauslastung zum Schürfen von Kryptowährung verballern die weltweit betriebenen Big-Data-Serverfarmen Unmengen an Energie zum Betrieb der Computer sowie zu deren Kühlung. Nochmals: Wofür? Um uns Werbung zu zeigen. Es ist zum ausflippen … die Umwelt geht zugrunde, aber wir bekommen personalisierte Werbung am Sanifair-Pissoir eingeblendet.
  5. Die Anhäufung von Daten geschieht immer mehr im Selbstbedienungs-Verfahren. Daten-Eigentümer werden gar nicht gefragt. Persönlich kennen wir das schon lange, im Bezug zu den jüngsten Entwicklungen im Bereich AI gibt es allerdings viele neue, offene Fragen dazu:

Künstliche Intelligenzen, im Grunde Computer-Programme, die auf riesige Datenmengen zurückgreifen können, um die wahrscheinlichste Antwort oder den wahrscheinlichsten Zusammenhang herzustellen, müssen gefüttert werden. Ob es um Text wie bei ChatGPT oder um Bilder wie etwa bei Stable Diffusion geht. Woher stammt dieses Futter? Wir alle erzeugen es, indem wir täglich Worte und Zeilen und Fotos ins Internet stellen. Oder ReCaptcha-Bilderrätsel lösen. In diesem Zusammenhang las ich schon mehrfach davon, dass Künstler oder Vereinigungen Klagen ausarbeiten, weil sie befürchten, dass ihre urheberrechtlich geschützten Werke ohne Rückfrage und ohne Lohn zur Fütterung einer AI herangezogen würden.

Besonders unverschämt scheint nun Stability AI vorgegangen zu sein. Deren AI Stable Diffusion spuckt nämlich künstlich erzeugte Bilder inklusive Getty-Images-Logo aus! Wie das wohl kommt? Getty, eine der größten Bilddatenbanken der Welt, vermutet, dass die AI mit bis zu 12 Millionen Fotos aus dem Gettys-Fundus gefüttert wurde – ohne Wissen und Zustimmung der Bildagentur. Wie in den USA so üblich, wurden nun in einer Klage astronomische Summen als Entschädigung formuliert. Dabei spielt nicht allein die Verletzung von Nutzungsrechten oder fehlende Lizenzen eine Rolle, sondern auch die potenziell rufschädigende Wirkung, die künstlich erzeugte Bilder bewirken könnten. Enthält ein solches Bild explizite Motive, wird es für bewusst gestreute Fake-News-Falschmeldungen eingesetzt oder ist es einfach nur unglaublich schlecht errechnet, wird aber aufgrund des mit hineinerfundenen Getty-Logos mit der Agentur in Verbindung gebracht, kann dies dem Ruf der Agentur extrem schaden und sich auf deren Umsätze auswirken.

Ich bin zwar nicht verbandelt mit Gettys, glaube aber, dass alle Urheber, Fotografen, Autoren und Künstler von der Klärung dieser Fragen profitieren können. Schließlich sieht sich Stability AI mit diesen Vorwürfen nicht konfrontiert, weil sie im Namen der Wissenschaft neue Dinge erfinden wollten, sondern weil sie handfeste wirtschaftliche Interessen verfolgen. Das geht aber nicht auf Kosten anderer. Jedenfalls nicht fortgesetzt. Genauso wenig, wie Starbucks bis in alle Ewigkeit Dumme finden wird, die freiwillig mehr dafür bezahlen, ihren mittelmäßigen Kaffee in falsch-beschrifteten Bechern selber abzuholen und hinterher noch das Geschirr zusammen zu räumen.

Diese Zeilen sind übrigens nicht mittels einer AI entstanden, sondern meinem aufgebrachten Gemüt entsprungen. Ich bitte dies zu entschuldigen. Zur Beruhigung zeige ich abschließend ein Schwarz-Weiss-Dia (Agfa Scala) aus den 1980er Jahren, welches ich als Teenager belichtet und kürzlich probehalber mit meinem neuen Filmscanner digitalisiert habe. Wohin der Weg wohl führt?

Kategorien Kultur, Privat, Recht, SoftwareSchlagwörter , , , , ,
%d Bloggern gefällt das:
search previous next tag category expand menu location phone mail time cart zoom edit close