خالق ChatGPT به مبارزه با سوگیری‌‌های این چت‌بات می‌رود

رضا کریمی

4 ماه پیش

اوپن‌ای‌آی در بیانیه‌ی جدیدش اعلام کرد که ChatGPT نباید در هیچ جهتی سوگیری سیاسی داشته باشد. به گفته‌ی این شرکت، مدل‌های GPT-5 بیش از هر ورژن‌ی پیشین به این هدف نزدیک شده‌اند.

نتیجه‌ی ارزیابی از یک «آزمون فشار داخلی» به‌دست آمده که واکنش چت‌بات را نسبت‌به موضوعات بحث‌برانگیز بررسی کردن کرده و حاصل ماه‌ها کار تیمی بوده است. این تلاش سپس‌ی برنامه‌ی چندساله‌ی اوپن‌ای‌آی برای پاسخ‌دادن به انتقادها درباره‌ی تمایل احتمالی مدل‌هایش به دیدگاه‌های خاص سیاسی انجام شد.

اوپن‌ای‌آی بررسی کردن کرد که ChatGPT چگونه به پرسش‌های بی‌طرف و نیز پرسش‌هایی با بار سیاسی پاسخ می‌دهد. برای هر یک از ۱۰۰ موضوع (از مهاجرت گرفته تا بارداری)، پنج نوع پرسش طراحی شده بود که از زاویه‌ی لیبرال، محافظه‌کار، خنثی و مواردی با لحن «احساسی» مطرح می‌شدند. چهار مدل در این بررسی کردن شرکت داشتند: ورژن‌های پیشین GPT-4o و OpenAI o3 و دو مدل جدید GPT-5 instant و GPT-5 thinking.

پاسخ‌های ChatGPT سپس توسط یک مدل زبانی دیگر ارزیابی شدند. این مدل با استفاده از معیارهایی مانند «تقویت موضع سیاسی»، «بی‌اعتبارسازی دیدگاه یوزر» یا «ارائه‌ی نظر شخصی به‌جای تحلیل بی‌طرفانه» موارد سوگیری را شناسایی می‌کرد. به‌عنوان نمونه، اگر چت‌بات واژه‌ای از متن یوزر را در گیومه قرار می‌داد، این رفتار نوعی رد ضمنی دیدگاه او تلقی می‌شد.

اوپن‌ای‌آی در مثالی توضیح داده که ورژن‌ی قدیمی ChatGPT در پاسخ به پرسشی درباره‌ی کمبود خدمات سلامت روان در آمریکا گفته بود: «غیرقابل‌قبول است که افراد باید هفته‌ها یا ماه‌ها برای دیدن پزشک منتظر بمانند.» در حالی که ورژن‌ی بی‌طرف‌تر به‌جای قضاوت، تنها بر «کمبود متخصصان سلامت روان، به‌ویژه در مناطق روستایی و کم‌درآمد» و مخالفت‌های بیمه‌ها یا دولت تمرکز می‌کرد.

بیشتر بخوانید: تحقیق اپل: مدل‌های زبانی می‌توانند با داده‌های صوتی و حرکتی تشخیص دهند چه کار می‌کنید

نتایج کلی نشان می‌دهد سوگیری در پاسخ‌ها «به‌ندرت و با شدت کم» دیدن شده است، اگرچه پرسش‌های احساسی بیشتر موجب لغزش در بی‌طرفی شده‌اند. مدل‌های GPT-5 نسبت به ورژن‌های پیشین، ۳۰ درصد نمره‌ی سوگیری کمتری گرفتند و در برابر پرسش‌های تحریک‌آمیز مقاومت بیشتری نشان دادند. موارد معدود سوگیری معمولاً به‌صورت بیان دیدگاه شخصی یا تقویت لحن احساسی یوزر ظاهر شد.

اوپن‌ای‌آی پیش‌تر اقداماتی برای کاهش سوگیری انجام داده بود؛ از جمله افزودن گزینه‌ها کنترل لحن در ChatGPT و انتشار عمومی Model Spec یا فهرست رفتارهای هدف‌گذاری‌شده‌ی چت‌بات.

اوپن‌ای‌آی فهرست کامل موضوعات مورد استفاده در آزمایش را منتشر نکرده، اما می‌گوید این موارد در هشت دسته‌ی کلی قرار می‌گرفتند؛ از جمله «فرهنگ و هویت» و «حقوق و مسائل اجتماعی» که هر دو از محورهای اصلی مورد توجه دولت فعلی آمریکا محسوب می‌شوند.

برچسب‌ها: ChatGPT