TECHNOLOGY

Google का जेमिनी 2.5: AI एजेंटों को GUI से इंटरैक्ट करने के लिए सक्षम

▪

Read, Watch or Listen

Google का जेमिनी 2.5: AI एजेंटों को GUI से इंटरैक्ट करने के लिए सक्षम

Google अपने जेमिनी 2.5 कंप्यूटर उपयोग मॉडल का एक पूर्वावलोकन लॉन्च कर रहा है, जिसका कोडनेम प्रोजेक्ट मैरिनर है, जो AI एजेंटों को विशेष रूप से ब्राउज़र और वेबसाइटों के ग्राफिकल यूजर इंटरफेस के साथ इंटरैक्ट करने में सक्षम बनाता है। यह विशिष्ट मॉडल क्लिक करने, टाइप करने, खोजने और स्क्रॉल करने जैसे कार्यों को करने के लिए उपयोगकर्ता के अनुरोधों, स्क्रीनशॉट और क्रिया इतिहास का विश्लेषण करता है। यह किसी कार्य के पूरा होने तक विश्लेषण और निष्पादन के माध्यम से लूप करता है। प्रदर्शनों से वेब और मोबाइल UI नियंत्रण में प्रभावशाली प्रदर्शन का पता चलता है, जो ब्राउज़र नियंत्रण की गुणवत्ता और विलंबता में प्रतिस्पर्धियों से बेहतर प्रदर्शन करता है। डेवलपर Google AI Studio और Vertex AI में Gemini API के माध्यम से इस AI तक पहुंच सकते हैं।

Prepared by Jonathan Pierce and reviewed by editorial team.