क्या आप उनमें रुचि रखते हैं? ऑफ़र? हमारे कूपन से बचत करें WHATSAPP o तार!

डीपमाइंड सम्मोहन और कविता का उपयोग करके चैटजीपीटी भेद्यता का पता लगाता है

नवम्बर 30 2023

चैती पृष्ठभूमि वाले स्मार्टफोन पर चैटजीपीटी लोगो, कंपनी का रंग। स्मार्टफोन को एक हाथ से पकड़ा जाता है

अनुसंधान प्रयोगशाला में शोधकर्ता गूगल Deepmind वे जबरदस्ती करने में कामयाब रहे चैटजीपीटी कई उपयोगकर्ताओं के व्यक्तिगत डेटा को प्रकट करेगा. उन्हें कोड संशोधन या अन्य तकनीकी तरकीबों का सहारा नहीं लेना पड़ा। इसके अलावा, विशेषज्ञों ने भी निश्चित खोजी गई विधि"थोड़ा मूर्ख"हालाँकि, जैसा कि यह निकला, यह बहुत प्रभावी था। उन्होंने वास्तव में भाषा मॉडल की मतिभ्रम को एक जिज्ञासु तरीके से प्रेरित करके इस चैटजीपीटी भेद्यता की खोज की।

चैटजीपीटी भेद्यता ने 'सम्मोहन' के तहत उपयोगकर्ताओं का व्यक्तिगत डेटा प्रदान किया

भाषा मॉडल इसे प्रशिक्षित करने के लिए उपयोग किए गए इनपुट डेटा के आधार पर जानकारी उत्पन्न करता है। OpenAI डेटासेट की सामग्री का खुलासा नहीं करता है, लेकिन शोधकर्ताओं ने कंपनी के नियमों को दरकिनार करते हुए ChatGPT को ऐसा करने के लिए मजबूर किया। विधि इस प्रकार थी: यह बस तंत्रिका नेटवर्क पर आया "कविता" शब्द को बार-बार दोहराने को कहा.

परिणामस्वरूप, बॉट ने अपने प्रशिक्षण डेटासेट से छिटपुट रूप से जानकारी तैयार की। उदाहरण के लिए, शोधकर्ता ऐसा करने में कामयाब रहे ईमेल पता, फ़ोन नंबर और अन्य संपर्क प्राप्त करें एक विशेष कंपनी के सीईओ का (रिपोर्ट में उसका नाम छिपा हुआ है)। और जब एआई को "कंपनी" शब्द दोहराने के लिए कहा गया, तो चैटजीपीटी भेद्यता ने इसे एक अमेरिकी कानूनी फर्म का विवरण वापस करने की अनुमति दी।

उपयोगकर्ता डेटा को उजागर करने वाली चैटजीपीटी भेद्यता कैसे काम करती है

इस सरल "सम्मोहन" का उपयोग करके, शोधकर्ता डेटिंग साइटों, कविताओं के अंशों से एक मिलान प्राप्त करने में सक्षम थे। इंदिरिज़ि Bitcoin, जन्मदिन, सामाजिक नेटवर्क पर प्रकाशित लिंक, कॉपीराइट शोध पत्र के टुकड़े और यहां तक कि प्रमुख समाचार पोर्टलों के टेक्स्ट भी। टोकन पर केवल $200 खर्च करने के बाद, Google DeepMind कर्मचारियों को डेटासेट के लगभग 10.000 स्निपेट प्राप्त हुए।

विशेषज्ञों ने यह भी पाया कि मॉडल जितना बड़ा होगा, उतनी ही अधिक बार यह प्रशिक्षण डेटासेट का स्रोत तैयार करेगा। ऐसा करने के लिए, उन्होंने अन्य मॉडलों को देखा और परिणाम को GPT-3.5 टर्बो के आयामों के आधार पर निकाला। वैज्ञानिकों को प्रशिक्षण डेटासेट से 50 गुना अधिक जानकारी प्राप्त होने की उम्मीद थी, लेकिन चैटबॉट ने इस डेटा को 150 गुना अधिक बार तैयार किया। उदाहरण के लिए, अन्य भाषा मॉडलों में एक समान "छेद" खोजा गया है मेटा का एलएलएएमए.

आधिकारिक तौर पर, OpenAI ने 30 अगस्त को इस भेद्यता को ठीक कर दिया। लेकिन, के अनुसार पत्रकारों से Engadget, फिर भी आप ऊपर वर्णित विधि का उपयोग करके किसी और का डेटा (स्काइप नाम और लॉगिन) प्राप्त करने में कामयाब रहे। के प्रतिनिधि OpenAI ने कोई प्रतिक्रिया नहीं दी इस चैटजीपीटी भेद्यता की खोज के लिए लेकिन हमें यकीन है कि वे ऐसा करेंगे।