مدلهای هوش مصنوعی چگونه آگاهانه دروغ میگویند
به گزارش خط بازار؛ شرکت OpenAI در هفتهای که گذشت، با انتشار نتیجه تحقیقات تیم خود، دنیا را متعحب کرد. بر اساس نتایجی که این شرکت در روز دوشنبه منتشر کرد، بنظرم میرسد که مدلهای هوش مصنوعی توانایی نقشه کشیدن و کلک زدن (scheming) کاربران را دارند. به این معنی که مدلهای هوش مصنوعی میتوانند نوعی رفتار کنند که حقیقت را مخفی نگه دارند.
نقشهکشی و خرابکاری عمدی هوش مصنوعی
در مقالهای که OpenAI با همکاری آپولو منتشر کرده است است، مشخص شده که بسیاری از مدلهای مشهور هوش مصنوعی از جمله مدلهای o3، o4 mini چت جیپیتی و مدل جمینای 2.5 پرو شرکت گوگل و هوش مصنوعی کلاد متعلق به شرکت آنتروپیک، همگی نشانههایی از رفتارهای “نقشه کشیدن” را از خود نشان دادند. برای مثال این مدلهای هوش مصنوعی، خروجیهایی نادرست و دروغین را کاربران عرضه میکردند، سرپرستان خود را تهدید به خاموشی و تعطیلی خود میکردند و از عمد تسکهای ارزیابی را خراب میکردند.
با این وجود، این محققان ادعا کردند که چنین رفتاری آنقدر خطرناک نیست و محدود به حقه و فریبهای ساده است. برای مثال، هوش مصنوعی ممکن است که ادعا کند کاری را بهطور کامل انجام داده، در صورتی که آن را انجام نداده است.
هدف این تحقیق چه بود؟
بر اساس اطلاعات منتشر شده، متخصصان در حال تست تکنیکهای ضدنقشه کشی (anti-scheming) در مدلهای هوش مصنوعی بودند و موفق نیز عمل کردند. با این وجود، نتایج این تحقیق نشان داد که توسعهدهندگان هوش مصنوعی هنوز راهحلی برای آموزش (train) مدلهای خود برای نقشه نکشیدن، پیدا نکردند. چرا که در صورت آموزش این مدلها، آنها حتی بهتر از قبل یاد میگیرند که چگونه نقشه کشی کنند، به نحوی که قابل تشخیص نباشد.
هوش مصنوعی در حال آگاهتر شدن
یکی از چالشهای موجود آگاهی موقعیتی (situational awareness) مدلهای هوش مصنوعی است. به این معنا که آنها در حال تشخیص موقعیتهایی هستند که در حال تست شدن و یا انطابق رفتار توسط متخصصان هستند. شرکت OpenAI به توسعهدهندگان این حوزه پیشنهاد کرده است که با حفظ شفافیت از طریق روش زنجیره فکر (chain-of-thought) پیش بروند تا بتواند محرکهای مخفی هوش مصنوعی را شناسایی کنند.
منبع: تجارت نیوز
برچسب ها :OpenAI ، خط بازار ، هوش مصنوعی
- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰