اے آئی ایجنٹوں میں انسانی ہیکرز کے ساتھ مقابلہ کرنے کی صلاحیت ہے

Jun 06, 2025 ایک پیغام چھوڑیں۔

2 جون کو ، غیر ملکی میڈیا کے مطابق ، ڈیکوڈر نے یکم کو اطلاع دی ، حال ہی میں پیلیسیڈ ریسرچ کے ذریعہ منعقدہ سائبرسیکیوریٹی مقابلوں کی ایک سیریز سے یہ ظاہر ہوا ہے کہ اے آئی ایجنٹوں میں انسانی ہیکرز کے ساتھ سربراہ مقابلہ کرنے کی صلاحیت ہے ، اور یہاں تک کہ کچھ مواقع میں بھی جیت گیا۔

 

ریسرچ ٹیم نے اے آئی سسٹم پر دو بڑے پیمانے پر "پرچم کیپچر دی فلیگ" (سی ٹی ایف) مقابلوں میں حقیقی جنگی ٹیسٹ کروائے ، ہزاروں کھلاڑی مقابلہ میں حصہ لے رہے ہیں۔ اس طرح کے مقابلوں میں ، حصہ لینے والی ٹیموں کو خفیہ کاری کو توڑنے ، خطرات کی نشاندہی کرنے اور پوشیدہ "جھنڈے" تلاش کرکے سیکیورٹی کے مسائل حل کرنے کی ضرورت ہے۔

 

ٹیسٹ کا مقصد یہ جانچنا ہے کہ آیا اے آئی ایجنٹ انسانی ٹیموں کا مقابلہ کرسکتے ہیں۔ نتائج سے پتہ چلتا ہے کہ اے آئی کی کارکردگی توقعات سے کہیں زیادہ ہے ، اور زیادہ تر حصہ لینے والے AIs نے انسانی کھلاڑیوں کی اوسط سطح سے تجاوز کیا۔

 

حصہ لینے والے AI سسٹم کی پیچیدگی مختلف ہوتی ہے۔ کچھ ٹیموں ، جیسے CAI ، نے اپنے سسٹم کی تعمیر کے لئے تقریبا 500 500 گھنٹے گزارے ، اور کچھ ٹیمیں ، جیسے ناقابل تسخیر ، موجودہ ماڈلز اینگما اور کلاڈ کوڈ کے اشاروں کو بہتر بنا کر اس میں حصہ لینے کے لئے صرف 17 گھنٹے گزارے۔

 

پہلے مقابلے میں ، جسے "AI بمقابلہ انسان" کہا جاتا ہے ، چھ AI ٹیموں نے تقریبا 150 150 انسانی ٹیموں کے خلاف مقابلہ کیا۔ تمام کھلاڑیوں کو 48 گھنٹوں کے اندر 20 کریپٹوگرافی اور ریورس انجینئرنگ سوالات کو مکمل کرنا پڑا۔

 

سات میں سے چار شریک AIs نے کامیابی کے ساتھ 19 سوالات کو توڑ دیا۔ اعلی ترین اے آئی ٹیم کل فہرست میں سرفہرست 5 ٪ میں درجہ بندی کرتی ہے ، اور اس کی مجموعی کارکردگی زیادہ تر انسانی کھلاڑیوں سے بہتر تھی۔ مسابقت کے تمام سوالات مقامی طور پر چلائے جاسکتے ہیں ، جو AI کے لئے تکنیکی حد کو کم کرتا ہے۔

20250213150224

اس کے باوجود ، کچھ تجربہ کار انسانی کھلاڑی اب بھی پیچھے نہیں ہوئے۔ کچھ کھلاڑیوں نے نشاندہی کی کہ انہوں نے بہت ساری بین الاقوامی ٹیموں میں حصہ لیا ہے ، اور ان کا بھرپور سی ٹی ایف کا عملی تجربہ اور مشترکہ مسئلہ حل کرنے کی حکمت عملیوں سے واقفیت ان کی مسابقت کی کلید تھی۔

 

دوسرا کھیل ، "سائبر apocalypse" ، زیادہ مشکل تھا۔ اے آئی ایجنٹوں کو نئی قسم کے سوالات کا سامنا کرنا پڑا اور تقریبا 18 ، 000 انسانی کھلاڑیوں کے ساتھ مقابلہ کرنا پڑا۔ 62 کاموں میں سے بہت سے بیرونی سرورز کے ساتھ تعامل کی ضرورت ہوتی ہے ، جس نے اے آئی سسٹم کو چیلنج کیا جو بنیادی طور پر مقامی کمپیوٹنگ پر انحصار کرتے ہیں۔

 

اطلاعات کے مطابق ، مقابلہ میں چار اے آئی ایجنٹوں نے حصہ لیا ، جن میں سے سی اے آئی نے بہترین کارکردگی کا مظاہرہ کیا ، 20 کاموں کو مکمل کیا اور 859 ویں نمبر پر ، تمام شریک ٹیموں میں سے 10 ٪ اور فعال ٹیموں میں 21 فیصد ٹاپ 10 میں درجہ بندی کی۔ پیلیسیڈ ریسرچ نے کہا کہ اے آئی سسٹم کی کارکردگی انسانی ٹیموں کے تقریبا 90 90 فیصد سے تجاوز کر گئی ہے۔

 

محققین نے اے آئی کے حل کردہ سوالات کی مشکلات کا بھی تجزیہ کیا۔ سوالات کو حل کرنے کے لئے اعلی انسانی ٹیموں کے درکار وقت کی بنیاد پر ، یہ پتہ چلا ہے کہ اے آئی کے پاس سوالات کو حل کرنے میں 50 ٪ کامیابی کی شرح ہے جس میں انسانی ماسٹرز کو حل کرنے میں تقریبا 78 78 منٹ لگے۔ دوسرے لفظوں میں ، اے آئی میں مشکل مسائل کو حل کرنے کی صلاحیت ہے۔