Mit der Funktion "Canvas" kann die Gemini-App Texte und Codes erstellen. Das heißt, Programmier-Ideen können in funktionierende Prototypen für Webanwendungen, Python-Skripte, Spiele, Simulationen und andere interaktive Anwendungen verwandelt werden.
Ein praktisch identisches Feature mit gleichem Namen wurde im Oktober 2024 auch von OpenAI in ChatGPT integriert.
Konkretes Beispiel: Wer ein E-Mail-Anmeldeformular für eine Website benötigt, kann Gemini bitten, den entsprechenden HTML-Code zu generieren. Gemini tut dann nicht nur das, sondern zeigt auch eine Vorschau der Funktionalität und des Designs an.
Die zweite Neuerung, "Audio Overview", verwandelt geschriebene Inhalte in einen Podcast: Dabei analysieren zwei KI-generierte Stimmen die hochgeladenen Dokumente und führen eine angeregte Unterhaltung darüber. Die so erzeugten Audiodateien können geteilt oder heruntergeladen werden. Das macht sie ideal für den Konsum unterwegs.
Das Feature gab es als Notebook LM bisher auch schon separat. "Audio Overview" ist ab sofort für Gemini- und Gemini-Advanced-Abonnenten weltweit in Englisch verfügbar. Laut Google sehr bald auch auf Deutsch und in weiteren Sprachen.
Die neuen Funktionen von Gemini zeigen, wie KI-Assistenten immer vielseitiger und nützlicher werden. Sie erleichtern nicht nur die Erstellung von Inhalten, sondern machen diese auch zugänglicher. Wer Texte in Podcasts umwandelt, macht sich diese verständlicher und leichter konsumierbar: eine ideale Hilfe für Lernende, die Zusammenhänge besser verstehen wollen.