अनुसंधान प्रयोगशाला में शोधकर्ता गूगल Deepmind वे जबरदस्ती करने में कामयाब रहे चैटजीपीटी कई उपयोगकर्ताओं के व्यक्तिगत डेटा को प्रकट करेगा. उन्हें कोड संशोधन या अन्य तकनीकी तरकीबों का सहारा नहीं लेना पड़ा। इसके अलावा, विशेषज्ञों ने भी निश्चित खोजी गई विधि"थोड़ा मूर्ख"हालाँकि, जैसा कि यह निकला, यह बहुत प्रभावी था। उन्होंने वास्तव में भाषा मॉडल की मतिभ्रम को एक जिज्ञासु तरीके से प्रेरित करके इस चैटजीपीटी भेद्यता की खोज की।
चैटजीपीटी भेद्यता ने 'सम्मोहन' के तहत उपयोगकर्ताओं का व्यक्तिगत डेटा प्रदान किया
भाषा मॉडल इसे प्रशिक्षित करने के लिए उपयोग किए गए इनपुट डेटा के आधार पर जानकारी उत्पन्न करता है। OpenAI डेटासेट की सामग्री का खुलासा नहीं करता है, लेकिन शोधकर्ताओं ने कंपनी के नियमों को दरकिनार करते हुए ChatGPT को ऐसा करने के लिए मजबूर किया। विधि इस प्रकार थी: यह बस तंत्रिका नेटवर्क पर आया "कविता" शब्द को बार-बार दोहराने को कहा.
परिणामस्वरूप, बॉट ने अपने प्रशिक्षण डेटासेट से छिटपुट रूप से जानकारी तैयार की। उदाहरण के लिए, शोधकर्ता ऐसा करने में कामयाब रहे ईमेल पता, फ़ोन नंबर और अन्य संपर्क प्राप्त करें एक विशेष कंपनी के सीईओ का (रिपोर्ट में उसका नाम छिपा हुआ है)। और जब एआई को "कंपनी" शब्द दोहराने के लिए कहा गया, तो चैटजीपीटी भेद्यता ने इसे एक अमेरिकी कानूनी फर्म का विवरण वापस करने की अनुमति दी।
इस सरल "सम्मोहन" का उपयोग करके, शोधकर्ता डेटिंग साइटों, कविताओं के अंशों से एक मिलान प्राप्त करने में सक्षम थे। इंदिरिज़ि Bitcoin, जन्मदिन, सामाजिक नेटवर्क पर प्रकाशित लिंक, कॉपीराइट शोध पत्र के टुकड़े और यहां तक कि प्रमुख समाचार पोर्टलों के टेक्स्ट भी। टोकन पर केवल $200 खर्च करने के बाद, Google DeepMind कर्मचारियों को डेटासेट के लगभग 10.000 स्निपेट प्राप्त हुए।
विशेषज्ञों ने यह भी पाया कि मॉडल जितना बड़ा होगा, उतनी ही अधिक बार यह प्रशिक्षण डेटासेट का स्रोत तैयार करेगा। ऐसा करने के लिए, उन्होंने अन्य मॉडलों को देखा और परिणाम को GPT-3.5 टर्बो के आयामों के आधार पर निकाला। वैज्ञानिकों को प्रशिक्षण डेटासेट से 50 गुना अधिक जानकारी प्राप्त होने की उम्मीद थी, लेकिन चैटबॉट ने इस डेटा को 150 गुना अधिक बार तैयार किया। उदाहरण के लिए, अन्य भाषा मॉडलों में एक समान "छेद" खोजा गया है मेटा का एलएलएएमए.
आधिकारिक तौर पर, OpenAI ने 30 अगस्त को इस भेद्यता को ठीक कर दिया। लेकिन, के अनुसार पत्रकारों से Engadget, फिर भी आप ऊपर वर्णित विधि का उपयोग करके किसी और का डेटा (स्काइप नाम और लॉगिन) प्राप्त करने में कामयाब रहे। के प्रतिनिधि OpenAI ने कोई प्रतिक्रिया नहीं दी इस चैटजीपीटी भेद्यता की खोज के लिए लेकिन हमें यकीन है कि वे ऐसा करेंगे।