ข้ามไปที่เนื้อหาหลัก
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア โลโก้
  • บทความทั้งหมด
  • 🗒️ สมัครสมาชิก
  • 🔑 เข้าสู่ระบบ
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • हिंदी
cookie_banner_title

cookie_banner_message นโยบายความเป็นส่วนตัว cookie_banner_and นโยบายคุกกี้ cookie_banner_more_info

การตั้งค่าคุกกี้

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

AI ที่ไม่ทำลายบริบทของภาพ: เปลี่ยนชุดด้วยคำเดียว "Nano-Banana" ของ Google กำลังเปลี่ยนแปลงมาตรฐานการแก้ไขภาพ

AI ที่ไม่ทำลายบริบทของภาพ: เปลี่ยนชุดด้วยคำเดียว "Nano-Banana" ของ Google กำลังเปลี่ยนแปลงมาตรฐานการแก้ไขภาพ

2025年08月28日 09:52

"Nano-Banana" มอบหมาย "ขั้นตอนสุดท้ายของการแก้ไขภาพ" ให้ AI - โมเดลใหม่ของ Google เปลี่ยนวิธีการรีทัช

"คนที่อยู่ในภาพ สัตว์เลี้ยง หรือแสงพื้นหลังยังคง 'เหมือนเดิม' แต่การเปลี่ยนแปลงที่ต้องการจะถูกเพิ่มเข้าไปอย่างพอดี" Google ได้รวมโมเดลการสร้างและแก้ไขภาพใหม่ "Gemini 2.5 Flash Image" หรือที่เรียกว่า "Nano-Banana" เข้ากับแอป Gemini ซึ่งเป็นเครื่องมือที่มุ่งเน้นไปที่ "ความเป็นธรรมชาติที่ยั่งยืน" มันเน้นที่ "ความสม่ำเสมอของใบหน้า ทรงผม และเครื่องแต่งกายของบุคคลเดียวกัน" และ "การรักษาแสงและมุมมองในขณะถ่ายภาพ" ซึ่งเป็นเรื่องที่ยากสำหรับ AI ในการสร้างแบบเดิมๆ โดยสามารถทำการแก้ไขที่ซับซ้อนเช่น การเพิ่มหรือลบองค์ประกอบ การรวมภาพสองภาพ และการปรับทิศทางใบหน้าได้ด้วยคำสั่งข้อความเท่านั้นInfoMoney


การใช้งานหลักอยู่ที่ฝั่งแอป Gemini ผู้ใช้สามารถเรียกดูภาพถ่าย (รวมถึงที่บันทึกใน Google Photos) และให้คำสั่งในรูปแบบธรรมชาติ เช่น "ใส่เสื้อตัวนี้" "เปลี่ยนฟอนต์เฉพาะตัวอักษรบนป้าย" หรือ "เปลี่ยนมุมมองให้เป็นมุมตรง" โมเดลจะทำการรวมใหม่เฉพาะส่วนที่ต้องการโดยยังคง "ความเหมือนของบุคคลหรือวัตถุ" นอกจากนี้ยังมีการวางแผนที่จะเชื่อมต่อภาพนิ่งที่แก้ไขแล้วกับ Veo 3 เพื่อสร้างวิดีโอInfoMoneyblog.googlexataka.com


อะไรคือความ "แม่นยำ" ใหม่?

บล็อกทางการเน้นย้ำว่าโมเดลนี้สามารถจัดการ "การผสมผสานภาพหลายภาพ" "การแปลงภาษาธรรมชาติในพื้นที่เป้าหมายเท่านั้น" และ "การสร้าง/แก้ไขที่ใช้ 'ความรู้ของโลก'" ได้พร้อมกัน โดยเฉพาะอย่างยิ่งการรักษาความต่อเนื่องของ "ใบหน้า" ของบุคคลหรือสัตว์ และลวดลายของสิ่งของเล็กๆ ซึ่งมีประโยชน์ในการเล่าเรื่องหรือสร้างความหลากหลายของภาพสินค้าGoogle Developers Blog


สำนักข่าว Axios รายงานว่า Nano-Banana มีความสามารถในการ "สร้างใหม่และปรับแต่งหลายขั้นตอนได้อย่างเป็นธรรมชาติ" และสามารถใช้ได้อย่างกว้างขวางทั้งใน Web และมือถือของ Gemini ไม่ว่าจะเป็นแบบฟรีหรือเสียค่าใช้จ่าย อย่างไรก็ตาม การเพิ่มความแม่นยำในการแก้ไขยังเพิ่มความกังวลเกี่ยวกับดีพเฟคอีกด้วยAxios


ความรู้สึกในการ "ใช้งานจริง" เป็นอย่างไร? - รีวิวการทดลองใช้บนโซเชียลมีเดีย

 


จากบทสรุปของ InfoMoney และโพสต์การตรวจสอบจากผู้ใช้ท้องถิ่น พบว่าการเปลี่ยนเสื้อผ้า การฟื้นฟูสิ่งที่ขาดหาย การแทนที่ผลิตภัณฑ์ และการรวมหลายแหล่งอ้างอิงอย่างสม่ำเสมอด้วยคำสั่งสั้นๆ เป็นสิ่งที่โดดเด่นในการใช้งานจริง ต่อไปนี้คือปฏิกิริยาที่เป็นตัวแทน

  • "แค่ 'ใส่เสื้อตัวนี้' - มันดูเป็นธรรมชาติ": การเปลี่ยนเสื้อผ้าของบุคคลด้วยคำสั่งที่เรียบง่าย (Pietro Schirano)InfoMoney

  • "มาตรฐานใหม่ของการฟื้นฟูภาพ": ประทับใจในความแม่นยำในการฟื้นฟูภาพเก่าและภาพที่เสียหาย (Diego)InfoMoney

  • "การแทนที่ผลิตภัณฑ์แม้ในลวดลายที่ซับซ้อนก็สำเร็จได้ ใช้ความพยายามเฉลี่ย 2-3 ครั้งก็เพียงพอ" (DStudioproject)InfoMoney

  • "แม้ใช้การอ้างอิง 4 ครั้งก็ไม่ล้มเหลว ไม่สมบูรณ์แบบแต่เป็นโมเดลการแก้ไขที่ดีที่สุด" (Halim Alrasihi)InfoMoney

  • โพสต์ที่เป็นที่นิยมว่า "มันมาถึง Google Photos แล้วหรือ?" และมีเสียงที่เรียกมันว่าเป็น Photoshop killer (Matthew Berman/arrakis_ai) อย่างไรก็ตามยังมีชุมชนที่มีมุมมองที่เย็นชาเกี่ยวกับ "การยกย่องเกินจริง" และใน Reddit มีการเสียดสีวิธีการตลาดและสงสัยเกี่ยวกับ "การลดความสามารถ"X (formerly Twitter)Reddit


รายการสิ่งที่สามารถทำได้ (ตามตัวอย่างจริง)

  • การเพิ่ม/ลบองค์ประกอบ: การลบสิ่งที่ไม่ต้องการ การเพิ่มเครื่องประดับ/เสื้อผ้า/อุปกรณ์InfoMoney

  • การรวมภาพหลายภาพ: การเปลี่ยนบุคคล/สินค้า/พื้นหลัง หรือการรวมภาพจากการถ่ายหลายครั้งInfoMoneyGoogle Developers Blog

  • การปรับทิศทางใบหน้าและท่าทาง: การปรับสายตาหรือมุมใบหน้าให้เป็นธรรมชาติInfoMoney

  • การปรับแสงและมุมมอง: การแก้ไขโดยยังคง "บรรยากาศ" ของภาพต้นฉบับInfoMoney

  • กระบวนการสร้างวิดีโอ: การเชื่อมต่อกับ Veo 3 เพื่อสร้างกราฟิกเคลื่อนไหวหลังการแก้ไขInfoMoney


ใช้งานที่ไหนและอย่างไร?

สนามรบหลักในปัจจุบันคือแอป Gemini มีให้บริการทั้งใน Web และมือถือ เพียงแค่พิมพ์คำสั่งในแชท การนำเข้าภาพถ่ายสามารถทำได้โดยการผสานกับ Google Photos ซึ่งเป็นการเชื่อมต่อที่เป็นธรรมชาติ Xataka ได้อธิบายการใช้งานจริงในการ "แก้ไข 'ภาพของตัวเอง' ใน Gemini ฟรี" ความแตกต่างในเรื่องค่าใช้จ่ายหรือจำนวนครั้งอาจขึ้นอยู่กับประเภทบัญชี แต่การเปิดให้ใช้งานอย่างกว้างขวางเป็นจุดสำคัญAxiosxataka.com


อย่างไรก็ตาม ในโซเชียลมีเดียมีการโพสต์ว่า "Premium+ หรือ Pro จะไม่มีการจำกัด" แต่ไม่ใช่คำกล่าวอย่างเป็นทางการ ควรตรวจสอบข้อจำกัดที่ละเอียดตามแผนจากการแนะนำของ GoogleInfoMoney


การใช้งานที่ "ตรงจุด" ในงานและงานอดิเรก

  • การผลิต EC และโฆษณา: การเปลี่ยนเสื้อผ้า/เครื่องประดับ/สีในภาพสต็อก การปรับเปลี่ยนฤดูกาลของพื้นหลัง การสร้างความหลากหลายสำหรับการทดสอบ AB

  • การประชาสัมพันธ์และการออกแบบ: การผลิตภาพหลักของงานอีเวนต์ การรักษาความสม่ำเสมอของวัตถุและโลโก้

  • การจัดระเบียบภาพถ่าย: การลบสิ่งที่ติดอยู่ในภาพ การแก้ไขตาครึ่งหลับ การฟื้นฟูภาพเก่า

  • UCG (เนื้อหาที่ผู้ใช้สร้าง): การรวม "โลกทัศน์" ของภาพถ่ายแฟนคลับ คอสเพลย์ และสัตว์เลี้ยง


ข้อจำกัดและความเสี่ยง: ความสมจริงเป็น "ดาบสองคม"

ยิ่งความแม่นยำสูงขึ้น คำถามด้านจริยธรรมและความปลอดภัยก็ยิ่งเข้มข้น Axios ชี้ให้เห็นถึงความเสี่ยงที่อาจเกิดขึ้นจากดีพเฟคหรือข้อมูลที่ผิดพลาด และกระตุ้นให้มีการออกแบบ "การใช้งาน" เป็นปัญหาของอุตสาหกรรมทั้งหมดการติดฉลาก (การระบุการรวม/แก้ไข) และความยินยอมของบุคคล และกฎการใช้ซ้ำ ควรเป็นสิ่งที่ผู้ใช้เตรียมพร้อมAxios##HTML_TAG_

← กลับไปที่รายการบทความ

contact |  ข้อกำหนดการใช้งาน |  นโยบายความเป็นส่วนตัว |  นโยบายคุกกี้ |  การตั้งค่าคุกกี้

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア สงวนลิขสิทธิ์