Technology

OpenAI veröffentlicht ein Tool für künstliche Intelligenz, das aus Text ein Bild erzeugen kann

OpenAI-Forscher haben ein neues System entwickelt, das aus einem einfachen englischen Satz das vollständige Bild erzeugen kann, einschließlich eines Astronauten, der auf einem Pferd reitet.

Bekannt als DALL · E 2, ist die zweite Generation von KI-Text-to-Image in der Lage, realistische Bilder und Kunstwerke in höherer Auflösung als ihr Vorgänger zu erstellen.

Die Artificial Intelligence Research Group wird das System nicht für die Öffentlichkeit freigeben.

Die neue Version kann Bilder aus einfachem Text erstellen, Objekte zu bestehenden Bildern hinzufügen oder sogar verschiedene Blickwinkel auf ein bestehendes Bild bieten.

Entwickler haben den Anwendungsbereich von KI eingeschränkt, um sicherzustellen, dass sie weder Hassbilder, rassistische oder gewalttätige Bilder produzieren noch zur Verbreitung von Fehlinformationen verwendet werden kann.

OpenAI-Forscher haben ein neues System entwickelt, das aus einem einfachen englischen Satz das vollständige Bild erzeugen kann, einschließlich eines Astronauten, der auf einem Pferd reitet.  In diesem Fall reitet der Astronaut fotorealistisch auf einem Pferd

OpenAI-Forscher haben ein neues System entwickelt, das aus einem einfachen englischen Satz das vollständige Bild erzeugen kann, einschließlich eines Astronauten, der auf einem Pferd reitet. In diesem Fall reitet der Astronaut fotorealistisch auf einem Pferd

Bekannt als DALL · E 2, ist die zweite Generation von KI-Text-to-Image in der Lage, realistische Bilder und Kunstwerke in höherer Auflösung als ihr Vorgänger zu erstellen

Bekannt als DALL · E 2, ist die zweite Generation von KI-Text-to-Image in der Lage, realistische Bilder und Kunstwerke in höherer Auflösung als ihr Vorgänger zu erstellen

Bekannt als DALL · E 2, ist die zweite Generation von KI-Text-to-Image in der Lage, realistische Bilder und Kunstwerke in höherer Auflösung als ihr Vorgänger zu erstellen

Seine Originalversion, benannt nach dem spanischen Surrealisten Salvador Dali und dem Pixar-Roboter WALL-E, wurde im Januar 2021 als begrenzter Test dafür veröffentlicht, wie KI zur Präsentation von Konzepten eingesetzt werden kann – von langweiligen Beschreibungen bis hin zu Höhenflügen der Fantasie.

Zu den frühen Kunstwerken von AI gehörten ein Modell in einem Flanellhemd, eine Illustration eines Rettichs, der mit einem Hund spazieren geht, und Emoji-Babypinguine.

Beispiele für Sätze, die in der zweiten Ausgabe verwendet werden, um realistische Bilder zu erstellen, sind “ein Astronaut, der in einem fotorealistischen Stil auf einem Pferd reitet”.

Auf der DALL-E 2-Website kann dies angepasst werden, um Bilder „on the fly“ zu erhalten, einschließlich des Ersetzens des Astronauten durch einen Teddybären, eines Basketball spielenden Pferdes und der Darstellung als Bleistiftzeichnung oder als „Pop-Art im Stil von Gemälde von Andy Warhol.

Die Forschungsgruppe Künstliche Intelligenz wird das System nicht für die Öffentlichkeit freigeben, hofft aber, es in Zukunft als Add-On für bestehende Bildbearbeitungsanwendungen anbieten zu können

Die Forschungsgruppe Künstliche Intelligenz wird das System nicht für die Öffentlichkeit freigeben, hofft aber, es in Zukunft als Add-On für bestehende Bildbearbeitungsanwendungen anbieten zu können

Die Forschungsgruppe Künstliche Intelligenz wird das System nicht für die Öffentlichkeit freigeben, hofft aber, es in Zukunft als Add-On für bestehende Bildbearbeitungsanwendungen anbieten zu können

Es kann Objekte zum Bild hinzufügen oder daraus entfernen – wie zum Beispiel den Flamingo auf der linken Seite dieses Bildes
Es kann Objekte zum Bild hinzufügen oder daraus entfernen - wie den Flamingo auf der linken Seite

Kann Objekte zu einem Bild hinzufügen oder daraus entfernen, z. B. einen Flamingo, der im ersten Bild zu sehen ist und im zweiten fehlt

Selbst die härtesten Kunden mit endlosen Überarbeitungsanforderungen zufrieden stellend, kann KI mehrere Versionen jedes Bildes aus einem einzigen Satz pumpen.

Eine der spezifischen Funktionen des DALL-E 2 ermöglicht das „Malen“, bei dem ein vorhandenes Bild aufgenommen und andere Merkmale hinzugefügt werden können – wie z. B. ein Flamingo im Pool.

Es kann Details wie Schatten automatisch ausfüllen, wenn ein Objekt hinzugefügt wird, oder sogar den Hintergrund anpassen, wenn das Objekt verschoben oder entfernt wird.

„DALL · E 2 hat die Beziehung zwischen Bildern und Text gelernt, die zu ihrer Beschreibung verwendet werden“, erklärte OpenAI.

“Es verwendet einen Prozess namens “Diffusion”, der mit einem Muster aus zufälligen Punkten beginnt und dieses Muster allmählich in das Bild umwandelt, wenn es bestimmte Aspekte dieses Bildes erkennt.”

Die neue Version kann Bilder aus einfachem Text erstellen, Objekte zu bestehenden Bildern hinzufügen oder sogar verschiedene Blickwinkel auf ein bestehendes Bild bieten

Die neue Version kann Bilder aus einfachem Text erstellen, Objekte zu bestehenden Bildern hinzufügen oder sogar verschiedene Blickwinkel auf ein bestehendes Bild bieten

Die neue Version kann Bilder aus einfachem Text erstellen, Objekte zu bestehenden Bildern hinzufügen oder sogar verschiedene Blickwinkel auf ein bestehendes Bild bieten

Die erste Version von DALL-E war in ihrem Umfang begrenzt

Die erste Version von DALL-E war in ihrem Umfang begrenzt

Die neue Version kann detailliertere Bilder erstellen

Die neue Version kann detailliertere Bilder erstellen

Die erste Version von DALL-E war im Umfang eingeschränkt (links), wobei die neue Version detailliertere Bilder erstellen kann (rechts)

DALL-E 2 basiert auf einem Computer-Vision-System namens CLIP, das von OpenAI entwickelt und letztes Jahr angekündigt wurde.

„DALL-E 1 hat einfach unseren GPT-3-Ansatz aus der Sprache genommen und angewendet, um ein Bild zu erzeugen: Wir haben die Bilder in eine Reihe von Wörtern komprimiert und einfach gelernt, vorherzusagen, was als nächstes kommt“, sagte OpenAI-Forscherin Prafulla Dhariwal gegenüber The Verge.

Leider schränkte dieser Prozess den Realismus der Bilder ein, da er nicht immer die Qualitäten erfasste, die die Menschen für am dringendsten hielten.

CLIP betrachtet das Bild und fasst den Inhalt so zusammen, wie es ein Mensch tun würde, und sie haben dies umgekehrt – unCLIP – für DALL-E 2.

Entwickler haben den Umfang der KI eingeschränkt, um sicherzustellen, dass sie keine hasserfüllten, rassistischen oder gewalttätigen Bilder produzieren oder zur Verbreitung von Fehlinformationen verwendet werden kann

Entwickler haben den Umfang der KI eingeschränkt, um sicherzustellen, dass sie keine hasserfüllten, rassistischen oder gewalttätigen Bilder produzieren oder zur Verbreitung von Fehlinformationen verwendet werden kann

Entwickler haben den Umfang der KI eingeschränkt, um sicherzustellen, dass sie keine hasserfüllten, rassistischen oder gewalttätigen Bilder produzieren oder zur Verbreitung von Fehlinformationen verwendet werden kann

Seine Originalversion, benannt nach dem spanischen Surrealisten Salvador Dali und dem Pixar-Roboter WALL-E, wurde im Januar 2021 als begrenzter Test dafür veröffentlicht, wie KI zur Präsentation von Konzepten eingesetzt werden kann – von langweiligen Beschreibungen bis hin zu Höhenflügen der Fantasie.

Seine Originalversion, benannt nach dem spanischen Surrealisten Salvador Dali und dem Pixar-Roboter WALL-E, wurde im Januar 2021 als begrenzter Test dafür veröffentlicht, wie KI zur Präsentation von Konzepten eingesetzt werden kann – von langweiligen Beschreibungen bis hin zu Höhenflügen der Fantasie.

Seine Originalversion, benannt nach dem spanischen Surrealisten Salvador Dali und dem Pixar-Roboter WALL-E, wurde im Januar 2021 als begrenzter Test dafür veröffentlicht, wie KI zur Präsentation von Konzepten eingesetzt werden kann – von langweiligen Beschreibungen bis hin zu Höhenflügen der Fantasie.

OpenAI trainierte das Modell mit Bildern, und sie ließen unangemessenes Material fallen, wodurch seine Fähigkeit, anstößige Inhalte zu produzieren, eingeschränkt wurde.

Jedes Bild enthält auch ein Wasserzeichen, um klar zu zeigen, dass es von künstlicher Intelligenz und nicht von einer Person erstellt wurde, oder dass es sich um ein echtes Foto handelt – wodurch das Risiko von Fehlinformationen verringert wird.

Es kann auch keine erkennbaren Gesichter auf der Grundlage von Namen generieren, selbst solche, die nur von Kunstwerken wie der Mona Lisa erkannt werden können, wodurch charakteristische Variationen entstehen.

„Wir haben die Fähigkeit von DALL · E 2 eingeschränkt, gewalttätige, hasserfüllte oder nicht jugendfreie Bilder zu erzeugen“, so die OpenAI-Forscher.

„Indem wir die explizitesten Inhalte aus den Trainingsdaten entfernt haben, haben wir die Exposition von DALL · E 2 gegenüber diesen Konzepten minimiert.

Zu den frühen Kunstwerken, die von KI geschaffen wurden, gehörten ein Modell in einem Flanellhemd, eine Illustration eines Rettichs, der mit einem Hund spazieren geht, und Emojis von einem Baby-Pinguin – oder Gelegenheits-Astronauten

Zu den frühen Kunstwerken, die von KI geschaffen wurden, gehörten ein Modell in einem Flanellhemd, eine Illustration eines Rettichs, der mit einem Hund spazieren geht, und Emojis von einem Baby-Pinguin – oder Gelegenheits-Astronauten

Zu den frühen Kunstwerken, die von KI geschaffen wurden, gehörten ein Modell in einem Flanellhemd, eine Illustration eines Rettichs, der mit einem Hund spazieren geht, und Emojis von einem Baby-Pinguin – oder Gelegenheits-Astronauten

Das Mädchen mit dem Perlenohrring, auch bekannt als das Mädchen mit dem Turban des niederländischen Malers Johannes Vermeer aus dem Goldenen Zeitalter.  Um 1665

Das Mädchen mit dem Perlenohrring, auch bekannt als das Mädchen mit dem Turban des niederländischen Malers Johannes Vermeer aus dem Goldenen Zeitalter.  Um 1665

Die KI ist darauf beschränkt, das direkte Kopieren von Gesichtern zu vermeiden, auch nicht auf Kunstwerken

Die KI ist darauf beschränkt, das direkte Kopieren von Gesichtern zu vermeiden, auch nicht auf Kunstwerken

Die KI ist darauf beschränkt, das direkte Kopieren von Gesichtern zu vermeiden, selbst auf Kunstwerken wie „Das Mädchen mit dem Perlenohrring“ des niederländischen Malers Johannes Vermeer aus dem Goldenen Zeitalter. Rechts sehen Sie die AI-Version desselben Bildes, die so geändert wurde, dass sie kein direktes Gesicht imitiert

KI kann aus einer einfachen Beschreibung fotorealistische Kunst erstellen, wie z. B. ein „hochwertiges Foto vom Times Square“ (unten) oder ein hochwertiges Foto eines Hundes, der auf einer grünen Wiese am See spielt (oben), wobei mehrere Versionen jedes erzeugten Bildes erstellt werden

KI kann aus einer einfachen Beschreibung fotorealistische Kunst erstellen, wie z. B. ein „hochwertiges Foto vom Times Square“ (unten) oder ein hochwertiges Foto eines Hundes, der auf einer grünen Wiese am See spielt (oben), wobei mehrere Versionen jedes erzeugten Bildes erstellt werden

KI kann aus einer einfachen Beschreibung fotorealistische Kunst erstellen, wie z. B. ein „hochwertiges Foto vom Times Square“ (unten) oder ein hochwertiges Foto eines Hundes, der auf einer grünen Wiese am See spielt (oben), wobei mehrere Versionen jedes erzeugten Bildes erstellt werden

“Wir haben auch fortschrittliche Techniken eingesetzt, um fotorealistische Generationen realer Personen, einschließlich Persönlichkeiten des öffentlichen Lebens, zu verhindern.”

Obwohl es nicht öffentlich verfügbar sein wird, wird einigen Forschern Zugriff gewährt, und in Zukunft könnte es in andere Anwendungen eingebettet werden – was strenge Inhaltsrichtlinien erfordert.

Dies erlaubt Benutzern unter anderem nicht, gewalttätige, nicht jugendfreie oder politische Inhalte zu erstellen.

„Wir werden keine Bilder generieren, wenn unsere Filter Textanfragen und Bild-Uploads identifizieren, die möglicherweise gegen unsere Richtlinien verstoßen. Wir haben auch automatisierte Überwachungssysteme durch Menschen, um uns vor Missbrauch zu schützen“, erklärte der Sprecher.

„Wir arbeiten mit externen Experten zusammen und testen DALL · E 2 einer begrenzten Anzahl vertrauenswürdiger Benutzer, damit wir mehr über die Möglichkeiten und Grenzen der Technologie erfahren.

“Wir planen, mehr Menschen einzuladen, diese Forschung im Laufe der Zeit zu überprüfen, während wir lernen und unser Sicherheitssystem iterativ verbessern.”

WIE KÜNSTLICHE INTELLIGENZEN MIT NEURONALEN NETZWERKEN LERNEN

Künstliche Intelligenzsysteme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Art und Weise zu simulieren, wie das Gehirn beim Lernen arbeitet.

ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern – und bilden die Grundlage für viele KI-Entwicklungen der letzten Jahre.

Herkömmliche KI verwendet Eingaben, um einen Algorithmus zu einem bestimmten Thema zu „lernen“, indem sie ihm riesige Mengen an Informationen gibt.

Künstliche Intelligenzsysteme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Art und Weise zu simulieren, wie das Gehirn beim Lernen arbeitet.  ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern

Künstliche Intelligenzsysteme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Art und Weise zu simulieren, wie das Gehirn beim Lernen arbeitet.  ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern

Künstliche Intelligenzsysteme stützen sich auf künstliche neuronale Netze (KNNs), die versuchen, die Art und Weise zu simulieren, wie das Gehirn beim Lernen arbeitet. ANNs können darauf trainiert werden, Muster in Informationen zu erkennen – einschließlich Sprache, Textdaten oder visuellen Bildern

Zu den praktischen Anwendungen gehören die Sprachübersetzungsdienste von Google, die Gesichtserkennungssoftware von Facebook und die Live-Bildänderungsfilter von Snapchat.

Die Eingabe dieser Daten kann sehr zeitaufwändig und auf eine Art von Wissen beschränkt sein.

Eine neue Art von ANN namens Adversarial Neural Networks lässt die Gedanken zweier KI-Bots gegeneinander antreten, sodass sie voneinander lernen können.

Dieser Ansatz soll den Lernprozess beschleunigen und die von KI-Systemen generierten Ergebnisse verbessern.

About the author

admin

Leave a Comment