Google hat kürzlich zwei spannende neue Funktionen für seine KI-Plattform Gemini vorgestellt: Gems & Imagen 3. Gems ermglicht es, personalisierte KI-Experten für spezifische Aufgaben zu erstellen, während Imagen 3 die Generierung hochqualitativer, fotorealistischer Bilder revolutioniert. In diesem Artikel werfen wir einen genaueren Blick auf die Möglichkeiten, die Gems & Imagen 3 bieten, und wie sie die Nutzung von KI in verschiedenen Bereichen verbessern können.
Was sind Google Gemini Gems?
Gems sind eine der neuesten Funktionen der Google Gemini Plattform, die es Nutzern ermöglicht, personalisierte KI-Bots zu erstellen, die auf spezifische Aufgaben und Bedürfnisse instruiert sind. Ähnlich wie die sogenannten Plugins von ChatGPT, können Gems durch das Hinterlegen von detaillierten Anweisungen und spezifischem Wissen individuell angepasst werden. Dadurch sind sie in der Lage, bestimmtes Wissen, Verhalten und Tonalitäten widerzugeben, was repetitive Eingaben verhindert und eine effizientere Interaktion ermöglicht.
Um den Einstieg zu erleichtern, bietet Google eine Reihe von vordefinierten Gems an, die für verschiedene Szenarien konzipiert sind:
- Learning Coach: Hilft dabei, komplexe Themen zu vereinfachen und leichter verständlich zu machen.
- Brainstormer: Bietet kreative Inspiration, sei es für frische Ideen zu einer Themenparty oder das perfekte Geschenk.
- Career Guide: Unterstützt bei der Karriereplanung mit detaillierten Strategien zur Verbesserung von Fähigkeiten und Erreichung von Karrierezielen.
- Writing Editor: Verbessert das Schreiben durch klares, konstruktives Feedback zu Grammatik und Struktur.
Imagen 3 – Verbesserte Bildgenerierung
Imagen 3 soll es Nutzern ermöglichen, hochwertige, fotorealistische Bilder mit nur wenigen Worten zu erstellen. Nutzer können Bilder in verschiedenen Stilen anfordern, darunter fotorealistische Landschaften, strukturierte Ölgemälde oder skurrile Claymation-Szenen.
- Eingebaute Sicherheitsvorkehrungen und Produktdesignprinzipien
Imagen 3 integriert robuste Sicherheitsvorkehrungen und entspricht den Produktdesignprinzipien von Google. Diese Massnahmen sollen gewährleisten, dass die erzeugten Bilder den ethischen Standards entsprechen und keine schädlichen Inhalte enthalten. Google verwendet das Tool SynthID, um KI-generierte Bilder mit einem unsichtbaren Wasserzeichen zu versehen, das ihre Herkunft nachvollziehbar macht. - Bevorstehende Funktionen und Einschränkungen
In den kommeden Tagen soll die Bildgenerierung zunächst auf Englisch im Gemini Chatbot eingeführt werden. Gemäss Google wurden technische Verbesserungen und Massnahmen implementiert, um die Benutzererfahrung bei der Generierung von Personenbildern zu optimieren. Es gibt jedoch Einschränkungen bei der Erzeugung bestimmter Bildinhalte, um die Einhaltung von Sicherheits- und Ethikstandards zu gewährleisten.
Verfügbarkeit von Gems und Imagen 3
Gems & Imagen 3 sind zurzeit nur für zahlende Abonnenten der Gemini Advanced und Enterprise Pläne verfügbar. Gems werden in über 150 Ländern und in den meisten Sprachen eingeführt, einschliesslich der DACH-Region (Deutschland, Österreich, Schweiz).
Beide Funktionen sind vorerst nur über die Web-App von Google Gemini verfügbar. Die mobile Version soll in Kürze folgen.
Fazit zu Google Gems & Imagen 3
Gems können als Googles Antwort auf die “Plugins” von ChatGPT und die “Projects” von Anthropic gesehen werden. Imagen 3 hingegen reiht sich hinter zahlreichen bereits existierenden KI-Bildgenerierung Tools ein. Es wird sich erst noch zeigen müssen, ob die beiden Tools die bestehenden übertreffen können.
Mehr Infos zu Gems & Imagen 3 (auf Englisch)