AI ที่ไม่ทำลายบริบทของภาพ: เปลี่ยนชุดด้วยคำเดียว "Nano-Banana" ของ Google กำลังเปลี่ยนแปลงมาตรฐานการแก้ไขภาพ

2025年08月28日 09:52

"Nano-Banana" มอบหมาย "ขั้นตอนสุดท้ายของการแก้ไขภาพ" ให้ AI - โมเดลใหม่ของ Google เปลี่ยนวิธีการรีทัช

"คนที่อยู่ในภาพ สัตว์เลี้ยง หรือแสงพื้นหลังยังคง 'เหมือนเดิม' แต่การเปลี่ยนแปลงที่ต้องการจะถูกเพิ่มเข้าไปอย่างพอดี" Google ได้รวมโมเดลการสร้างและแก้ไขภาพใหม่ "Gemini 2.5 Flash Image" หรือที่เรียกว่า "Nano-Banana" เข้ากับแอป Gemini ซึ่งเป็นเครื่องมือที่มุ่งเน้นไปที่ "ความเป็นธรรมชาติที่ยั่งยืน" มันเน้นที่ "ความสม่ำเสมอของใบหน้า ทรงผม และเครื่องแต่งกายของบุคคลเดียวกัน" และ "การรักษาแสงและมุมมองในขณะถ่ายภาพ" ซึ่งเป็นเรื่องที่ยากสำหรับ AI ในการสร้างแบบเดิมๆ โดยสามารถทำการแก้ไขที่ซับซ้อนเช่น การเพิ่มหรือลบองค์ประกอบ การรวมภาพสองภาพ และการปรับทิศทางใบหน้าได้ด้วยคำสั่งข้อความเท่านั้นInfoMoney

การใช้งานหลักอยู่ที่ฝั่งแอป Gemini ผู้ใช้สามารถเรียกดูภาพถ่าย (รวมถึงที่บันทึกใน Google Photos) และให้คำสั่งในรูปแบบธรรมชาติ เช่น "ใส่เสื้อตัวนี้" "เปลี่ยนฟอนต์เฉพาะตัวอักษรบนป้าย" หรือ "เปลี่ยนมุมมองให้เป็นมุมตรง" โมเดลจะทำการรวมใหม่เฉพาะส่วนที่ต้องการโดยยังคง "ความเหมือนของบุคคลหรือวัตถุ" นอกจากนี้ยังมีการวางแผนที่จะเชื่อมต่อภาพนิ่งที่แก้ไขแล้วกับ Veo 3 เพื่อสร้างวิดีโอInfoMoneyblog.googlexataka.com

อะไรคือความ "แม่นยำ" ใหม่?

บล็อกทางการเน้นย้ำว่าโมเดลนี้สามารถจัดการ "การผสมผสานภาพหลายภาพ" "การแปลงภาษาธรรมชาติในพื้นที่เป้าหมายเท่านั้น" และ "การสร้าง/แก้ไขที่ใช้ 'ความรู้ของโลก'" ได้พร้อมกัน โดยเฉพาะอย่างยิ่งการรักษาความต่อเนื่องของ "ใบหน้า" ของบุคคลหรือสัตว์ และลวดลายของสิ่งของเล็กๆ ซึ่งมีประโยชน์ในการเล่าเรื่องหรือสร้างความหลากหลายของภาพสินค้าGoogle Developers Blog

สำนักข่าว Axios รายงานว่า Nano-Banana มีความสามารถในการ "สร้างใหม่และปรับแต่งหลายขั้นตอนได้อย่างเป็นธรรมชาติ" และสามารถใช้ได้อย่างกว้างขวางทั้งใน Web และมือถือของ Gemini ไม่ว่าจะเป็นแบบฟรีหรือเสียค่าใช้จ่าย อย่างไรก็ตาม การเพิ่มความแม่นยำในการแก้ไขยังเพิ่มความกังวลเกี่ยวกับดีพเฟคอีกด้วยAxios

ความรู้สึกในการ "ใช้งานจริง" เป็นอย่างไร? - รีวิวการทดลองใช้บนโซเชียลมีเดีย

จากบทสรุปของ InfoMoney และโพสต์การตรวจสอบจากผู้ใช้ท้องถิ่น พบว่าการเปลี่ยนเสื้อผ้า การฟื้นฟูสิ่งที่ขาดหาย การแทนที่ผลิตภัณฑ์ และการรวมหลายแหล่งอ้างอิงอย่างสม่ำเสมอด้วยคำสั่งสั้นๆ เป็นสิ่งที่โดดเด่นในการใช้งานจริง ต่อไปนี้คือปฏิกิริยาที่เป็นตัวแทน

"แค่ 'ใส่เสื้อตัวนี้' - มันดูเป็นธรรมชาติ": การเปลี่ยนเสื้อผ้าของบุคคลด้วยคำสั่งที่เรียบง่าย (Pietro Schirano)InfoMoney
"มาตรฐานใหม่ของการฟื้นฟูภาพ": ประทับใจในความแม่นยำในการฟื้นฟูภาพเก่าและภาพที่เสียหาย (Diego)InfoMoney
"การแทนที่ผลิตภัณฑ์แม้ในลวดลายที่ซับซ้อนก็สำเร็จได้ ใช้ความพยายามเฉลี่ย 2-3 ครั้งก็เพียงพอ" (DStudioproject)InfoMoney
"แม้ใช้การอ้างอิง 4 ครั้งก็ไม่ล้มเหลว ไม่สมบูรณ์แบบแต่เป็นโมเดลการแก้ไขที่ดีที่สุด" (Halim Alrasihi)InfoMoney
โพสต์ที่เป็นที่นิยมว่า "มันมาถึง Google Photos แล้วหรือ?" และมีเสียงที่เรียกมันว่าเป็น Photoshop killer (Matthew Berman/arrakis_ai) อย่างไรก็ตามยังมีชุมชนที่มีมุมมองที่เย็นชาเกี่ยวกับ "การยกย่องเกินจริง" และใน Reddit มีการเสียดสีวิธีการตลาดและสงสัยเกี่ยวกับ "การลดความสามารถ"X (formerly Twitter)Reddit

รายการสิ่งที่สามารถทำได้ (ตามตัวอย่างจริง)

การเพิ่ม/ลบองค์ประกอบ: การลบสิ่งที่ไม่ต้องการ การเพิ่มเครื่องประดับ/เสื้อผ้า/อุปกรณ์InfoMoney
การรวมภาพหลายภาพ: การเปลี่ยนบุคคล/สินค้า/พื้นหลัง หรือการรวมภาพจากการถ่ายหลายครั้งInfoMoneyGoogle Developers Blog
การปรับทิศทางใบหน้าและท่าทาง: การปรับสายตาหรือมุมใบหน้าให้เป็นธรรมชาติInfoMoney
การปรับแสงและมุมมอง: การแก้ไขโดยยังคง "บรรยากาศ" ของภาพต้นฉบับInfoMoney
กระบวนการสร้างวิดีโอ: การเชื่อมต่อกับ Veo 3 เพื่อสร้างกราฟิกเคลื่อนไหวหลังการแก้ไขInfoMoney

ใช้งานที่ไหนและอย่างไร?

สนามรบหลักในปัจจุบันคือแอป Gemini มีให้บริการทั้งใน Web และมือถือ เพียงแค่พิมพ์คำสั่งในแชท การนำเข้าภาพถ่ายสามารถทำได้โดยการผสานกับ Google Photos ซึ่งเป็นการเชื่อมต่อที่เป็นธรรมชาติ Xataka ได้อธิบายการใช้งานจริงในการ "แก้ไข 'ภาพของตัวเอง' ใน Gemini ฟรี" ความแตกต่างในเรื่องค่าใช้จ่ายหรือจำนวนครั้งอาจขึ้นอยู่กับประเภทบัญชี แต่การเปิดให้ใช้งานอย่างกว้างขวางเป็นจุดสำคัญAxiosxataka.com

อย่างไรก็ตาม ในโซเชียลมีเดียมีการโพสต์ว่า "Premium+ หรือ Pro จะไม่มีการจำกัด" แต่ไม่ใช่คำกล่าวอย่างเป็นทางการ ควรตรวจสอบข้อจำกัดที่ละเอียดตามแผนจากการแนะนำของ GoogleInfoMoney

การใช้งานที่ "ตรงจุด" ในงานและงานอดิเรก

การผลิต EC และโฆษณา: การเปลี่ยนเสื้อผ้า/เครื่องประดับ/สีในภาพสต็อก การปรับเปลี่ยนฤดูกาลของพื้นหลัง การสร้างความหลากหลายสำหรับการทดสอบ AB
การประชาสัมพันธ์และการออกแบบ: การผลิตภาพหลักของงานอีเวนต์ การรักษาความสม่ำเสมอของวัตถุและโลโก้
การจัดระเบียบภาพถ่าย: การลบสิ่งที่ติดอยู่ในภาพ การแก้ไขตาครึ่งหลับ การฟื้นฟูภาพเก่า
UCG (เนื้อหาที่ผู้ใช้สร้าง): การรวม "โลกทัศน์" ของภาพถ่ายแฟนคลับ คอสเพลย์ และสัตว์เลี้ยง

ข้อจำกัดและความเสี่ยง: ความสมจริงเป็น "ดาบสองคม"

ยิ่งความแม่นยำสูงขึ้น คำถามด้านจริยธรรมและความปลอดภัยก็ยิ่งเข้มข้น Axios ชี้ให้เห็นถึงความเสี่ยงที่อาจเกิดขึ้นจากดีพเฟคหรือข้อมูลที่ผิดพลาด และกระตุ้นให้มีการออกแบบ "การใช้งาน" เป็นปัญหาของอุตสาหกรรมทั้งหมดการติดฉลาก (การระบุการรวม/แก้ไข) และความยินยอมของบุคคล และกฎการใช้ซ้ำ ควรเป็นสิ่งที่ผู้ใช้เตรียมพร้อมAxios##HTML_TAG_

Google เปิดตัวฟีเจอร์ใหม่ "Ask Photos" อีกครั้ง! "พูดคุยกับภาพถ่าย" ── อนาคตของการค้นหารุ่นถัดไปที่ Google วาดฝัน

Google แปลภาษาสู่ยุคใหม่ที่ "เข้าใจความหมาย" ด้วย Gemini เพื่อการแปลที่สื่อถึง "สิ่งที่ต้องการจะบอก"

百度ปฏิวัติการค้นหาและการสร้างวิดีโอด้วย AI! เป้าหมายใหม่ของ百度หลังจากยุคโฆษณา

AI ที่ไม่ทำลายบริบทของภาพ: เปลี่ยนชุดด้วยคำเดียว "Nano-Banana" ของ Google กำลังเปลี่ยนแปลงมาตรฐานการแก้ไขภาพ

"Nano-Banana" มอบหมาย "ขั้นตอนสุดท้ายของการแก้ไขภาพ" ให้ AI - โมเดลใหม่ของ Google เปลี่ยนวิธีการรีทัช

อะไรคือความ "แม่นยำ" ใหม่?

ความรู้สึกในการ "ใช้งานจริง" เป็นอย่างไร? - รีวิวการทดลองใช้บนโซเชียลมีเดีย

รายการสิ่งที่สามารถทำได้ (ตามตัวอย่างจริง)

ใช้งานที่ไหนและอย่างไร?

การใช้งานที่ "ตรงจุด" ในงานและงานอดิเรก

ข้อจำกัดและความเสี่ยง: ความสมจริงเป็น "ดาบสองคม"

cookie_banner_title

"Nano-Banana" มอบหมาย "ขั้นตอนสุดท้ายของการแก้ไขภาพ" ให้ AI - โมเดลใหม่ของ Google เปลี่ยนวิธีการรีทัช

อะไรคือความ "แม่นยำ" ใหม่?

ความรู้สึกในการ "ใช้งานจริง" เป็นอย่างไร? - รีวิวการทดลองใช้บนโซเชียลมีเดีย

รายการสิ่งที่สามารถทำได้ (ตามตัวอย่างจริง)

ใช้งานที่ไหนและอย่างไร?

การใช้งานที่ "ตรงจุด" ในงานและงานอดิเรก

ข้อจำกัดและความเสี่ยง: ความสมจริงเป็น "ดาบสองคม"

Google เปิดตัวฟีเจอร์ใหม่ "Ask Photos" อีกครั้ง! "พูดคุยกับภาพถ่าย" ── อนาคตของการค้นหารุ่นถัดไปที่ Google วาดฝัน

Google แปลภาษาสู่ยุคใหม่ที่ "เข้าใจความหมาย" ด้วย Gemini เพื่อการแปลที่สื่อถึง "สิ่งที่ต้องการจะบอก"

百度ปฏิวัติการค้นหาและการสร้างวิดีโอด้วย AI! เป้าหมายใหม่ของ百度หลังจากยุคโฆษณา