Zum Hauptinhalt springen
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Alle Artikel
  • 🗒️ Registrieren
  • 🔑 Anmelden
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Datenschutzrichtlinie cookie_banner_and Cookie-Richtlinie cookie_banner_more_info

Cookie-Einstellungen

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

AI, das den Kontext von Fotos nicht zerstört: Ein Wort für Kostümwechsel. Googles "Nano-Banana" revolutioniert die gängige Praxis der Fotobearbeitung.

AI, das den Kontext von Fotos nicht zerstört: Ein Wort für Kostümwechsel. Googles "Nano-Banana" revolutioniert die gängige Praxis der Fotobearbeitung.

2025年08月28日 09:49

„Nano-Banana“ überlässt den „letzten Schliff der Fotobearbeitung“ der KI – Googles neues Modell verändert die Retusche

„Die abgebildeten Personen, Haustiere und das Licht im Hintergrund bleiben ‚wie sie sind‘, nur die gewünschten Änderungen werden präzise hinzugefügt.“ Das neue Bildgenerierungs- und Bearbeitungsmodell „Gemini 2.5 Flash Image“ – auch bekannt als „Nano-Banana“ – integriert in die Gemini-App von Google, zielt darauf ab, diese „Natürlichkeit zu bewahren“. Es ist spezialisiert auf die „Konsistenz von Gesichtern, Frisuren und Outfits derselben Person“ sowie die „Beibehaltung der Lichtverhältnisse und Perspektiven bei der Aufnahme“, was mit herkömmlicher generativer KI schwierig war. Mit nur Textanweisungen kann es komplexe Bearbeitungen wie das Hinzufügen oder Entfernen von Elementen, das Kombinieren von zwei Bildern und das Anpassen der Gesichtsrichtung durchführen.InfoMoney


Der Schlüssel zur Implementierung liegt auf der Seite der Gemini-App. Benutzer können Fotos (einschließlich der in Google Fotos gespeicherten) aufrufen und in natürlicher Sprache Anweisungen wie „Zieh ihm dieses Hemd an“, „Nur den Text auf dem Schild in einer anderen Schriftart“ oder „Aus einem anderen Winkel nach vorne“ geben. Das Modell rekombiniert nur die Zielbereiche, während die „Identität von Personen und Objekten“ erhalten bleibt. Darüber hinaus ist ein Workflow vorgesehen, um das bearbeitete Standbild mit Veo 3 in ein Video zu verwandeln.InfoMoneyblog.googlexataka.com


Was ist die „neue“ Präzision?

Der offizielle Blog betont, dass dieses Modell gleichzeitig „das Mischen mehrerer Bilder“, „natürliche Sprachtransformationen nur für Zielbereiche“ und „Erzeugung/Bearbeitung unter Nutzung von ‚Weltwissen‘“ handhaben kann. Besonders die Tatsache, dass die „Gesichtszüge“ von Personen und Tieren sowie die Muster von Accessoires kontinuierlich erhalten bleiben, ist effektiv für Storytelling und die Generierung von Produktfoto-Variationen.Google Developers Blog


Das US-Magazin Axios berichtet, dass Nano-Banana sich dadurch auszeichnet, „nicht nur neue Inhalte zu generieren, sondern auch mehrstufige Feinabstimmungen auf natürliche Weise durchzuführen“, und es sowohl in der Web- als auch in der mobilen Version von Gemini kostenlos und kostenpflichtig weit verbreitet genutzt werden kann. Gleichzeitig wird jedoch auch gewarnt, dass die Verbesserung der Bearbeitungsgenauigkeit die Bedenken hinsichtlich Deepfakes erhöhen könnte.Axios


Wie ist das tatsächliche „Bediengefühl“? – Erste Testberichte in sozialen Medien

 


Ein Blick auf die Zusammenfassungen von InfoMoney und die Prüfbeiträge lokaler Nutzer zeigt, dass die „Stabilität“ in der Praxis auffällt, wie das Ersetzen von Kleidung mit kurzen Anweisungen, die Wiederherstellung von Fehlstellen, das Ersetzen durch andere Produkte und die konsistente Kombination aus mehreren Referenzen. Hier sind einige der repräsentativen Reaktionen:

  • „‚Zieh ihm dieses Hemd an‘ – und es sieht natürlich aus“: Austausch von Kleidung mit minimalen Eingaben (Pietro Schirano)InfoMoney

  • „Neue SOTA der Bildwiederherstellung“: Beeindruckende Präzision bei der Restaurierung alter und beschädigter Fotos (Diego)InfoMoney

  • „Selbst bei komplexen Mustern gelingt der Produktaustausch. Durchschnittlich reichen 2–3 Versuche aus“ (DStudioproject)InfoMoney

  • „Selbst mit vier Referenzen bricht es nicht zusammen. Nicht perfekt, aber das beste Bearbeitungsmodell“ (Halim Alrasihi)InfoMoney

  • Beiträge, die fragen „Kommt es auch zu Google Fotos?“, und Stimmen, die es als Photoshop-Killer bezeichnen (Matthew Berman/arrakis_ai), machen die Runde. Allerdings gibt es auch eine Community, die dem „übermäßigen Hype“ skeptisch gegenübersteht, und auf Reddit sind sarkastische Kommentare über Marketingmethoden und Verdachtsmomente eines „Nerfs“ zu finden, was auf unterschiedliche Meinungen hinweist.X (formerly Twitter)Reddit


Liste der Möglichkeiten (basierend auf Beispielen)

  • Hinzufügen/Entfernen von Elementen: Entfernen unerwünschter Objekte, Hinzufügen von Accessoires, Kleidung und Requisiten.InfoMoney

  • Kombination mehrerer Bilder: Austausch von Personen, Produkten und Hintergründen oder Integration verschiedener Aufnahmen.InfoMoneyGoogle Developers Blog

  • Anpassung von Gesichtsausdruck und Pose: Natürliche Korrektur von Blickrichtung und Gesichtsneigung.InfoMoney

  • Konsistenz von Beleuchtung und Perspektive: Bearbeitung unter Beibehaltung der „Atmosphäre“ des Originalfotos.InfoMoney

  • Video-Pipeline: Nach der Bearbeitung Integration mit Veo 3 für Motion Graphics.InfoMoney


Wo und wie kann es genutzt werden?

Derzeit ist das Hauptanwendungsfeld dieGemini-App. Sie ist sowohl im Web als auch mobil verfügbar, und Anweisungen werden einfach im Chat eingegeben. Das Importieren von Fotos erfolgt am besten in Kombination mit Google Fotos, und Xataka erklärt die „kostenlose Bearbeitung ‚eigener Fotos‘ mit Gemini“ in der Praxis. Es könnte Unterschiede in den Gebühren oder Nutzungsgrenzen je nach Kontotyp geben, aber die Tatsache, dass es weit geöffnet ist, ist der entscheidende Punkt.Axiosxataka.com


In sozialen Medien kursieren Beiträge, die behaupten, dass „Premium+ oder Pro unbegrenzt“ seien, aber dies ist kein offizielles Statement. Für detaillierte Einschränkungen je nach Plan sollte man stets die Anweisungen von Google prüfen.InfoMoney


Beruflich und privat, jeweils passende Anwendungen

  • E-Commerce und Werbeproduktion: Austausch von Kleidung/Accessoires/Farben auf Lagerfotos, saisonale Hintergrundanpassungen, Varianten für A/B-Tests.

  • PR und Design: Massenproduktion von Schlüsselbildern für Veranstaltungen, Konsistenz von Subjekten und Logos.

  • Fotoorganisation: Entfernen von Störungen, Korrektur von geschlossenen Augen, Restaurierung alter Fotos.

  • UCG (User Generated Content): Einheitliche „Weltanschauung“ für Fan-Aktivitäten, Cosplay und Haustierfotos.


Grenzen und Risiken: Die „Echtheit“ als zweischneidiges Schwert

Je höher die Präzision, desto intensiver werden die ethischen und sicherheitsrelevanten Fragen. Axios weist auf das Risiko hin, dass es eine Grundlage für Deepfakes oder Fehlinformationen bilden könnte, und fordert die gesamte Branche auf, die „Nutzungsbereiche“ zu gestalten.Kennzeichnung (Angabe von Zusammensetzungen/Bearbeitungen) sowieZustimmung der abgebildeten Personen undRegeln für die Zweitnutzung sollten auch von den Nutzern berücksichtigt werden.Axios


Zusammenfassung: Eine Ära, in der Bearbeitung „mit Worten“ erfolgt

Nano-Banana konzentriert sich nicht darauf, den „bearbeiteten Look“ zu eliminieren, sondern darauf, **„den Kontext nicht zu zerstören“**. Basierend auf der Prämisse der „Erhaltung der Identität“ und der „Bewahrung der Natürlichkeit“, die für herkömmliche generative KI schwierig waren, ermöglicht es sowohl Profis als auch normalen Nutzern, den letzten Schliff durch Dialog zu erledigen – und aktualisiert damit die Standardform der Bearbeitung.Google Developers Blogblog.google


Referenzartikel

Googles „Nano-B

← Zurück zur Artikelliste

Kontakt |  Nutzungsbedingungen |  Datenschutzrichtlinie |  Cookie-Richtlinie |  Cookie-Einstellungen

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Alle Rechte vorbehalten.