बायडू, AI क्रांति के साथ खोज और वीडियो निर्माण में बदलाव कर रहा है! बायडू का लक्ष्य विज्ञापन के बाद का खजाना है।

बायडू, AI क्रांति के साथ खोज और वीडियो निर्माण में बदलाव कर रहा है! बायडू का लक्ष्य विज्ञापन के बाद का खजाना है।

1. “10 वर्षों में सबसे बड़ा बदलाव”──खोज शीर्ष पृष्ठ AI नेटिव बन गया

3 जुलाई की सुबह (बीजिंग समय), Baidu ने अपने खोज इंजन के "सबसे बड़े पैमाने के अपडेट" की घोषणा अपनी आधिकारिक ब्लॉग और बीजिंग मुख्यालय में एक प्रेस कॉन्फ्रेंस में की। खोज बार को "लंबी क्वेरी" के लिए विस्तारित किया गया है, और वॉयस इनपुट बटन और कैमरा इनपुट बटन स्थायी रूप से जोड़े गए हैं। बैकग्राउंड में, बड़े पैमाने के भाषा मॉडल ERNIE 4.5 परिवार पूरे संदर्भ की व्याख्या करता है और उत्तर के विकल्प उत्पन्न करता है।


इसके अलावा, संदर्भ के अनुसार छवियों, वीडियो, शॉपिंग, मैप्स आदि को इनलाइन कैरोसेल में प्रदर्शित किया जाएगा - वास्तव में "जनरेटिव AI नेटिव पोर्टल" की ओर एक कदम।reuters.comreuters.com


2. MuseSteamer――“एक छवि → 10 सेकंड वीडियो” को तीन स्तरों की कीमत पर

साथ में पेश किया गया छवि से वीडियो मॉडल "MuseSteamer"। Turbo/Pro/Lite के तीन स्तरों में, Turbo सबसे तेज़ 1.5 सेकंड में, Pro 4 सेकंड में, और Lite 10 सेकंड में 1080p वीडियो उत्पन्न करता है। सभी एक स्थिर छवि से अधिकतम 10 सेकंड का वीडियो आउटपुट कर सकते हैं, और इसे केवल कॉर्पोरेट उपयोगकर्ताओं के लिए परीक्षण के रूप में उपलब्ध कराया गया है। Baidu ने "Sora और Gen-2 की तुलना में चीनी भाषा की लिप सिंक सटीकता अधिक है" पर जोर दिया।reuters.comtechinasia.com


3. क्यों “B2B विशेष” है――विनियमन और मुद्रीकरण की वास्तविकता

OpenAI "Sora" और Runway "Gen-3 Alpha" मासिक सदस्यता मॉडल के साथ सामान्य क्रिएटर्स के लिए दरवाजे खोल रहे हैं, जबकि MuseSteamer केवल कॉर्पोरेट बीटा के लिए है। इसके पीछे की पृष्ठभूमि में

① कॉपीराइट क्लीयरेंस की जिम्मेदारी उठाने वाली कंपनियों के लिए चीनी साइबर निगरानी की समीक्षा को पास करना आसान होता है

② कॉर्पोरेट उच्च मूल्य SaaS विज्ञापन राजस्व में कमी को पूरा कर सकता है

③ आउटपुट की गुणवत्ता के बारे में पूछताछ समर्थन लागत से सीधे संबंधित होती है

――आदि की गणना शामिल है। Reuters ने इसे "Chatbot प्लेटफ़ॉर्म Doubao (ByteDance) और Yuanbao (Tencent) द्वारा छीने गए खोज ट्रैफ़िक को पुनः प्राप्त करने की रणनीति" के रूप में विश्लेषित किया।reuters.comreuters.com


4. SNS पर 48 घंटे की हलचल―70% सकारात्मक, 30% संदेहास्पद

 


  • सकारात्मक

    • "चीनी भाषा के साथ वीडियो एक बटन के साथ!" (@hasantoxr)twitter.com

    • "Midjourney + Sora का चीनी संस्करण, और वह भी बेहद तेज़" (@LearnWithBishal)twitter.com

    • AI速報日本語アカウントは「絵想(中国語版サイト)で今週中に試用登録受付」と報道。x.com

  • नकारात्मक/चिंता

    • Weibo पर "यदि व्यक्तिगत उपयोगकर्ता इसे नहीं आजमा सकते, तो रुचि आधी हो जाती है" और "सेंसरशिप शब्दों के कारण वीडियो ब्लैक आउट हो सकता है" जैसी पोस्ट देखी गईं।

    • X अंग्रेजी क्षेत्र में भी "केवल कॉर्पोरेट अनुबंध? API की कीमत अज्ञात होने पर Sora के खिलाफ नहीं टिक सकता" जैसी टिप्पणियाँ आईं।

मात्रात्मक रूप से, Stocktwits पर "BIDU Bullish" संदेश का अनुपात पिछले दिन की तुलना में +14pt बढ़ गया, लेकिन उसी थ्रेड में "कॉपीराइट जोखिम के साथ, ऊपर की ओर दबाव रहेगा" जैसी सिनिकल आवाजें जारी रहीं।stocktwits.com

5. तकनीकी गहराई में डुबकी

MuseSteamer एक हाइब्रिड संरचना है, जिसमें स्थिर छवि एम्बेडिंग + प्रसार मॉडल का समय-अक्ष दिशा में विस्तार किया गया "Conditioned Latent Diffusion" और ERNIE Vision एन्कोडर शामिल है। Turbo संस्करण 4 GPU A800×8 कार्ड के साथ 1.5 सेकंड में उत्पन्न होता है, Pro संस्करण A100×4 कार्ड के साथ 4 सेकंड में――आदि विवरण चीनी तकनीकी ब्लॉग में प्रकाशित किए गए। इसके परिणामस्वरूप लिप सिंक त्रुटि (LSE) OpenAI Sora की तुलना में ▲18% कम हो जाती है।mfro.net


6. प्रतिस्पर्धी स्थिति: विभिन्न कंपनियों की “V-Gen” रोडमैप

कंपनीमॉडलप्रकाशन सीमाअनुशंसित लंबाईमूल्य (परीक्षण)स्थिति
BaiduMuseSteamerB2B β10 सेकंडगोपनीयचीनी भाषा पर केंद्रित
OpenAISoraआरक्षित60 सेकंडनिर्धारित नहींसामान्य
ByteDanceMagicVideo 3उपभोक्ता के लिए15 सेकंडमासिक ¥1,980शॉर्ट वीडियो इंटीग्रेशन
RunwayGen-3 Alphaप्रारंभिक एक्सेस16 सेकंडमासिक $12फिल्म निर्माण के लिए

Baidu ने "लंबाई से अधिक गति और मातृभाषा ध्वनि" को विभेदक धुरी के रूप में स्थापित किया है, और खोज ट्रैफ़िक (विज्ञापन) और कॉर्पोरेट SaaS (मुद्रीकरण) के "दोहरी फसल" को लक्षित किया है।


7. बाजार प्रभाव

घोषणा के अगले दिन, हांगकांग में सूचीबद्ध BIDU शेयर एक समय में पिछले दिन की तुलना में +3.1% तक बढ़ गए, लेकिन समापन मूल्य +0.6% पर सीमित रहा। गोल्डमैन सैक्स ने "प्रतिस्पर्धी वातावरण की अस्पष्टता" के कारण लक्ष्य शेयर मूल्य को अपरिवर्तित रखा। निवेशक "उत्पाद डेमो→वास्तविक मुद्रीकरण" तक के समय अंतराल का आकलन कर रहे हैं।stocktwits.com


8. चुनौतियाँ और दृष्टिकोण

  1. कॉपीराइट क्लीयरेंस──इनपुट छवि के अधिकारों की पुष्टि को कंपनियों पर छोड़ने वाला मॉडल अमेरिकी DMCA के समकक्ष नोटिस का सामना कर सकता है।

  2. सेंसरशिप और नैतिकता──चीन के घरेलू सेवा के लिए राजनीतिक फिल्टर से बचना असंभव है, और उत्पन्न परिणाम वैश्विक बाजार मानकों तक नहीं पहुंच सकते हैं।

  3. GPU लागत──Turbo की अनुमानित गति को समर्थन देने वाला क्लस्टर A800/A100 पर केंद्रित है। ChatGPT की अनुमानित अनुकूलन प्रगति के बीच, प्रति गणना लागत में पिछड़ने की चिंता है।

Baidu इस वर्ष के अंत तक Lite संस्करण के API को विदेशी कंपनियों के लिए विस्तारित करने और 2026 की पहली छमाही में व्यक्तिगत क्रिएटर्स के लिए सदस्यता पर विचार कर रहा है।

9. सारांश

MuseSteamer और खोज AI का पूर्ण नवीनीकरण, विज्ञापन पर निर्भर मौजूदा व्यवसाय को AI SaaS में बदलने के लिए Baidu का "दूसरा उद्यम" है। हालांकि, मुद्रीकरण और वैश्विक अनुकूलन की बाधाएं ऊंची हैं। प्रतिस्पर्धियों की गतिविधियों और नियामक वातावरण में बदलाव के आधार पर, यह प्रयास खोज इतिहास को बदलने वाली सफलता की कहानी या अल्पकालिक आतिशबाजी बन सकता है।


संदर्भ लेख

Baidu ने AI का उपयोग करके खोज कार्यक्षमता को नवीनीकृत किया और छवि से वीडियो उत्पन्न करने वाले मॉडल "MuseSteamer" का प्रदर्शन किया
स्रोत: https://seekingalpha.com/news/4465258-baidu-shows-off-search-with-ai-revamp-image-to-video-model-musesteamer?utm_source=feed_news_all&utm_medium=referral&feed_item_type=news