Google का नया AI सिस्टम जो कर सकता है वीडियो के बारे में प्रेडिक्शन
9/15/2019 3:27:29 PM
गैजेट डेस्क : Google के रिसर्चर्स ने VideoBERT AI सिस्टम का प्रस्ताव दिया है जो एक सेल्फ-सुपरवाइज़ड प्रणाली है जो अनलिस्टेड वीडियो के बारे में अनुमान करने में सक्षम होगी।
वीडियो का विवरण जानने के लिए वीडियोबर्ट Google के BERT(Bidirectional Encoder Representations from Transformers) ओपन सोर्स मशीन लैंग्वेज मॉडल का उपयोग करता है।
Google VideoBERT की टेस्टिंग हुई इस तरह
Google ने 1.5-सेकंड की अवधि के विज़ुअल्स में परिवर्तित करने के लिए ऑटोमैटिक स्पीच रिकग्निशन आउटपुट के साथ कंबाइंड इमेज फ्रेम का उपयोग किया। ये विज़ुअल्स टोकन्स फिर वर्ड टोकन्स के साथ जोड़े जाते हैं। VideoBERT मॉडल का उपयोग करके इन्हीं मिसिंग विज़ुअल टोकन्स को भर दिया गया था।
रिसर्चर्स के अनुसार वीडियोबेर्ट एक वीडियो के बारे यह अनुमान लगाने में सक्षम था कि एक कटोरी मैदा और कोको पाउडर को ओवन में बेक किया जा सकता है और एक ब्राउनी या कपकेक में बदल सकता है जबकि यह वीडियो में आगे का हिस्सा जिसे प्ले नहीं किया गया था। ब्लॉग पोस्ट इस बात को भी पेश करता है कि वीडियोबर्ट अक्सर छोटी वस्तुओं और स्माल मूवमेंट जैसी बारीक-बारीक चीज़ों की डिटेलिंग को नोट करता है।