
تصویری که نوع سناریوهای مورد استفاده در تست های هوش هیج، را نشان می دهد ، و همچنین تفسیرهای مختصر که تفکر عاطفی را در پشت هر پاسخ ارزیابی می کنند. اعتبار: Khatja Sildel.
در طول زندگی خود ، انسانها می توانند با دیگران پیوندهای اجتماعی م،ادار داشته باشند ، با آنها همدردی کنند و تجربیات خود را تبادل کنند. نکته قابل توجه این است که توانایی مردم در مدیریت ، درک و درک احساساتی که خود و دیگران در مقیاس وسیعی به نام هوش هیج، (EI) رنج می برند.
طی دهه های گذشته ، روانشناسان تست های مختلفی را برای اندازه گیری EI طراحی کرده اند که معمولاً توانایی افراد در حل مشکلات مربوط به احساسی را که ممکن است در زندگی روزمره خود با آنها روبرو باشد ، ارزیابی می کند. این آزمایشات را می توان در ارزیابی های مختلف روانشناختی مورد استفاده در تحقیقات ، مخفی ، حرفه ای و آموزشی ،یب کرد.
محققان دانشگاه برن و دانشگاه ژنو اخیراً مطالعه ای را برای ارزیابی ظرفیت مدل های بزرگ زبان (LLMS) و تکنیک های یادگیری خودکار برای حل و ایجاد تست های EI انجام داده اند. نتایج آنها ، منتشر شده در ارتباط روانشناسی، پیشنهاد شده است که LLMS می تواند این آزمایشات را تقریباً و همچنین انسان ها حل کند و ممکن است ابزاری امیدوار کننده برای توسعه آزمایشات EI -Healing در آینده باشد.
Khatja Chaliel ، نویسنده مقاله اول ، به Medical Xpress گفت: “من سالها به دنبال EI هستم و آزمایش های مبتنی بر عملکرد بسیاری را برای اندازه گیری توانایی افراد در شناسایی احساسات ، درک و سازماندهی دقیق آنها در خود و دیگران انجام داده ام.”
“وقتی چتپ و سایر مدل های بزرگ زبان به طور گسترده ای در دسترس قرار گرفتند ، بسیاری از همکاران من شروع به آزمایش ،د و آنها را در کار ما آزمایش ،د ، طبیعی است که بپرسیم: چگونه این مدل ها می توانند منجر به تست های EI شوند که ما برای انسان ایجاد کردیم؟
EI و همدردی مفاهیم از نزدیک هستند ، زیرا هر دو با توانایی درک تجربیات عاطفی دیگران در ارتباط هستند. سیلدل و همکارانش در کاوش در میزان می توان LLM ها را حل کرد و در تست های EI مشکلات عاطفی ایجاد کرد ، زیرا این امر همچنین می تواند برخی از شاخص ها را در سطح همدردی آنها ایجاد کند.
برای دستیابی به این هدف ، آنها ابتدا از شش LLM استفاده ،د که به طور گسترده ای برای تکمیل پنج آزمایش EI که در ابتدا برای انسان به ،وان بخشی از ارزیابی های روانشناختی طراحی شده بودند ، استفاده ،د. م،ایی که آنها تجربه ،د شامل ChatGPT-4 ، Chatgpt-O1 ، Gemini 1.5 Flash ، Copilot 365 ، Claude 3.5 ، Haiku و Deepseek V3 بودند.
سیلدل توضیح داد: “تست های EI از سناریوهای عاطفی کوتاه استفاده ،د و از عاطفی ترین و هوشمندانه ترین پاسخ ، مانند تعیین اینکه شخص چه احساسی دارد یا بهترین راه برای مدیریت وضعیت عاطفی است ، خواسته است.” “ما سپس نتایج مدل ها را با میانگین انسان از مطالعات قبلی مقایسه کردیم.”

تصویری که درصد پاسخهای صحیح را از طریق پنج تست EI برای هر دو LLM آزمایش شده نشان می دهد. اعتبار: Khatja Sildel.
در بخش دوم تجربه خود ، محققان از Chatgpt-4 ، یکی از جدیدترین نسخه های Chatgpt که برای عموم منتشر شد ، خواستند که نسخه های کاملاً جدیدی از تست های EI را که در تجربیات خود استفاده می شود ، ایجاد کند. این تست ها باید ضمن تعیین پاسخ های صحیح به سؤالات ، سناریوهای عاطفی مختلف ، سؤالات و گزینه های پاسخ را شامل شوند.
“سپس ما آزمایش های اصلی را انجام دادیم و بیش از 460 شرکت کننده انس، عفو بین المللی ایجاد کردیم تا دریابیم که چگونه می توان هر دو نسخه را از نظر دشواری ، وضوح ، واقع گرایی و میزان ارتباط آنها با سایر آزمون های EI و اندازه گیری هوش شناختی سنتی مقایسه کرد.”
“این به ما این امکان را می دهد تا آزمایش کنیم که آیا LLMS می تواند تست های EI را حل کند ، اما اگر آنها بتوانند به اندازه کافی برای ایجاد تست های خوب خود فکر کنند ، که ما معتقدیم گام مهمی در جهت استفاده از این منطق در تنظیمات بازتر و واقع بینانه تر است.”
شایان ذکر است که سیلدل و همکارانش دریافتند که LLMS در تمام تست های EI به خوبی آزمایش می شود ، جایی که آنها به طور متوسط 81 ٪ به دست آوردند ، که بالاتر از دقت متوسط به دست آمده توسط پاسخ دهندگان انسان (56 ٪) است. نتایج آنها نشان می دهد که LLMS فعلی در درک آنچه ممکن است مردم در زمینه های مختلف احساس کنند ، حداقل در مورد موقعیت های سازمان یافته مانند مواردی که در تست های EI توضیح داده شده است ، واقعاً بهتر است.
Sielgel گفت: “چشمگیر تر ، ChatGPT-4 موفق به تولید ،اصر تست کاملاً جدید EI شد که توسط شرکت کنندگان انس، به وضوح و واقع بینانه مانند ،اصر اصلی طبقه بندی شده و کیفیت رو، مشابهی را نشان می دهد.” “از نظر ما ، توانایی حل و ساخت چنین آزمایشاتی نشان دهنده سطح بالایی از درک مفهومی از احساسات است.”
نتایج این مطالعه اخیر می تواند روانشناسان را به استفاده از LLMS برای تهیه تست های EI و مواد آموزشی ، که در حال حاضر به صورت دستی هستند و می توانند تا حدودی طول، طول کنند ، ترغیب کند. علاوه بر این ، آنها می توانند به LLMS الهام بخش باشند تا سناریوهای نقش بازی های طراحی شده و سایر مطالب را برای آموزش مددکاران اجتماعی ایجاد کنند.
“نتایج ما به دست آورده ایم همچنین مربوط به توسعه عوامل اجتماعی مانند چت سلامت روان ، معلمان آموزشی و ماسه نمادین خدمات به مشتری است که اغلب در زمینه های حساس عاطفی کار می کنند که درک احساسات انسان ضروری است.”
“نتایج ما نشان می دهد که حداقل LLM ها می توانند مهارت های تفکر عاطفی را که به ،وان یک پیش نیاز برای چنین تعاملاتی عمل می کنند تقلید کنند. در مطالعات زیر ، ما قصد داریم عملکرد LLMS را در مکالمات عاطفی کمتر واقع بینانه آزمایش کنیم که از م،ایی که در دفتر مرکزی کنترل می شوند ، آزمایش کنیم.
اطلاعات بیشتر:
Katja Schlegel و همکاران ، م،ای بزرگ زبان در حل و ایجاد تست های هوش هیج، مهارت دارند ، ارتباط روانشناسی (2025). doi: 10.1038/s44271-025-00258-x.
© 2025 Science X Network
نقل قولمدل های بزرگ زبان که در ایجاد و حل تست های هوش هیج، برتری دارند و بر مطالعات (2025 ، 4 ژوئن) در تاریخ 4 ژوئن 2025 از https://medicalxpress.com/news/2025-06-large-language-excel-emotional-imotelign Dechml
این سند منوط به حق چاپ است. صرف نظر از هرگونه معامله عادلانه به منظور مطالعه یا تحقیقات خصوصی ، هیچ بخشی از مجوز کتبی قابل بازتولید نیست. محتوا فقط برای اه، اطلاعاتی ارائه شده است.
]
منبع: https://medicalxpress.com/news/2025-06-large-language-excel-emotional-intelligence.html