Google Imagen ist die neue künstliche Intelligenz, ein Projekt auf halbem Weg zwischen aufregend und besorgniserregend. Erfahren Sie mehr
Sie schreiben den Text, auch einen komplexen, und Google Imagen erstellt das entsprechende Bild. Nein, wir reden hier nicht von einem Kinderspiel mit voreingestellten Formen, auch nicht von einem etwas, das aus einem Science-Fiction-Film stammt.
Wir sprechen von etwas absolut Realem, das bereits funktioniert, wenn auch mit eingeschränktem Zugang, und über das man im Internet viele Informationen und Details finden kann.
Was Google Imagen macht
Google Imagen ist die neueste und fortschrittlichste KI (Künstliche Intelligenz), die von den großen Namen der Technologie entwickelt wurde. Es handelt sich um ein fortschrittliches System, das einen vom Benutzer eingegebenen Text in ein Farbbild umwandelt, das detailliert und qualitativ beeindruckend ist der Fantasie der Verwirklichung.
Aber fangen wir etwas weiter weg an: Was bedeutet KI für Text-to-Image?
Text-zu-Bild
Der Mangel an Vorstellungskraft ist bei einem Großteil der Bevölkerung eine Konstante, ein Mangel, den Google, aber auch Microsoft und viele andere durch den massiven Einsatz künstlicher Intelligenz zu kompensieren versucht haben.
Text-To-Image AI befasst sich mit der Generierung komplexer Bilder ausgehend von vom Benutzer eingegebenem Text.
Achtung, kein einfacher Text wie „Apfel“, „Auto“ oder „Person auf einem Fahrrad“, sondern viel komplexere Texte, wie solche, deren generierte Bilder im Internet für Aufsehen sorgten:
Und viele andere, die inzwischen so sehr zum Standard geworden sind, dass sie zum typischen Test zur Überprüfung der Qualität und Beherrschung von KI-Systemen geworden sind.
Etwas Aufregendes, aber gleichzeitig auch sehr Besorgniserregendes und Riskantes, wie die Journalistin und Wissenschaftskommunikatorin Celia Guimaraes brillant erklärt:
„Imagen“ nutzt künstliche Intelligenz für überraschende Text-zu-Bild-Ergebnisse, was jedoch erhebliche ethische Implikationen hat, so dass das Unternehmen selbst es nicht der Öffentlichkeit zugänglich gemacht hat
Celia Guimaraes
Google Imagen und seine Brüder sind daher Systeme, die es Ihnen ermöglichen, von einer Reihe bedeutungsvoller Wörter auszugehen, die vom maschinellen Lernsystem verarbeitet und in einem Werk dargestellt werden, das in verschiedenen Bild- und Zeichenstilen (von Öl bis Kohle, von …) erstellt werden kann Skizze zum Kubismus).
Der Google-Vorschlag
Auch der Mountain View-Riese konnte diesem Trend der künstlichen Intelligenz folgen.
Das Ergebnis dieser Studie, die maschinelles Lernen, Verarbeitungsfähigkeiten und maschinelles Lernen kombiniert, ist Google Imagen , eine Technologie, die gleichzeitig verblüfft, überzeugt und beunruhigt.
Es ist erstaunlich
Das Ergebnis ist wirklich sehr realistisch und wird durch eine Vielzahl von Stilen, Kombinationen und Farben erreicht, die einen buchstäblich sprachlos machen.
Überzeugt
Wir sprechen von einem hochwertigen, schönen und wertvollen Ergebnis für ein Produkt, das, wenn es der Öffentlichkeit zugänglich gemacht würde, den Grafik- und Bearbeitungssektor wirklich revolutionieren könnte.
Es ist besorgniserregend
Der Grund, warum dieses Produkt auch in der Beta-Phase ist, die einigen ausgewählten Benutzern vorbehalten ist, ist sehr klar. Es gibt hauptsächlich zwei Bedenken:
Nächste Schritte
Laut dem Team namens Google Brain, das Google Imagen entwickelt hat, ist das Potenzial dieser Technologie praktisch unbegrenzt.
Jeff Dean, in diesem Abschnitt für Künstliche Intelligenz verantwortlich, glaubt, dass eine Lösung wie Google Imagen wirklich alle Funktionen unterstützen könnte, die Kreativität und Vorstellungskraft im Grafikbereich erfordern.
Nötig ist also „nur“ die gründliche Erprobung der Künstlichen Intelligenz, die in diesem Moment wie ein brillantes Kind betrachtet werden kann, das jedoch Ethik und Verhaltensregeln noch nicht vollständig versteht.
Eine Entwicklung, die bereits im Gange ist, dank eines Programms, das auf ausgewählten Betatestern basiert, deren Anfragen an Google Imagen von Google überwacht werden.
Das Google Imagen Brain Team fasst in einem hervorragenden Satz den Grund zusammen, warum es noch nicht für die Öffentlichkeit zugänglich ist:
„Es basiert auf Textkodierern, die auf Web-Rohdaten trainiert wurden, und übernimmt daher die sozialen Vorurteile und Einschränkungen großer Sprachmodelle. Dadurch besteht das Risiko, dass Imagen schädliche Stereotypen und Darstellungen kodiert hat, was unsere Entscheidung erklärt, Imagen nicht ohne weitere Sicherheitsvorkehrungen zur öffentlichen Nutzung freizugeben.“
Andere Risiken
Weitere mögliche Risiken, die sich aus der Implementierung von Google Imagen ergeben, betreffen, wie bei allen Verbesserungen durch Technologien, die Auswirkungen, die es auf die Arbeitswelt haben könnte.
Von Grafikstudios bis hin zu Manga-Erstellern gibt es viele Kategorien, die zumindest teilweise durch Google Imagen ersetzt werden könnten.
Natürlich handelt es sich dabei um einen Fortschritt, den wir auf die eine oder andere Weise nicht aufhalten können und müssen, aber vor einer möglichen Veröffentlichung müssen viele Auswirkungen bewertet werden.
Die Kritik
Dann gibt es noch einen weiteren Aspekt, der berücksichtigt werden muss und der in vielen Foren und Debatten im Internet auftaucht. Bisher haben nur sehr wenige Menschen Google Imagen bei der Arbeit gesehen. Die Kritiker von Google Imagen, die in gewisser Weise „übertrieben“ sind, aber zu Recht logisch verstehen, fragen sich, ob Google Imagen wirklich die großartigen Bilder ausgehend vom Text generiert hat oder ob ein „Mensch“ die Beschreibungen dessen, was von Google Imagen verlangt wurde, auf der Grundlage dessen, was ist, korrigiert hat generiert durch Künstliche Intelligenz.
Zwischen Zweifeln, Gewissheiten, Staunen und Besorgnis warten noch viele Herausforderungen auf Google Imagen.