آنچه در این مقاله میخوانید
هذیان گویی یا Hallucinations در هوش مصنوعی چیست؟
۲۷ شهریور ۱۴۰۴
هوش مصنوعی با خودکارسازی وظایف، تحلیل مجموعههای بزرگ داده و البته کمک به ارتباطات طبیعی زبانی، صنعت را متحول کرده است. با این حال، با وجود پیشرفتهای زیاد در این زمینه سیستمهای هوشمصنوعی، پدیده توهم هوش مصنوعی همچنان یک چالش باقی مانده است که باید حل شود.
این مسئله خصوصا در کاربردهای نیازمند قابلیت اطمینان بالا مانند مراقبتهای بهداشتی، حقوق و بانکداری، اهمیت زیادی را از آن خود کرده است. ادغام سیستمهای بازیابی، افزوده شده (RAG) با گرافهای دنش، روشی امیدوار کننده و صحیحی برای کاهش هذیان گویی خواهد بود، زیرا سیستمهای هوش مصنوعی را بر پایه اطلاعات ساخت یافته و قابل تایید قرار میدهد. در ادامه این مطلب از بلاگ لیارا به بررسی دقیق و کامل هذیان گویی هوش مصنوعی، مزایا و چالشهای اصلی سیستمهای RAG و پتانسیل ادغام آنها با گرافهای دانش برای کاهش این هذیان گویی خواهیم پرداخت.
آنچه در ادامه خواهید خواند:
- پیش نیازهای این مطلب
- هذیان گویی (Hallucinations) در هوش مصنوعی چیست؟
- انواع هذیان گویی هوش مصنوعی
- انواع هذیان گویی هوش مصنوعی چه اهمیتی دارد؟
- سوالات متداول
- جمع نید
پیش نیازهای این مطلب
برای اینکه بتوانید به صورت صحیح این مقاله را دنبال کنید، به دانش پایهای در زمینه هوش مصنوعی و مدلهای مولد خواهید داشت، اگر نگران هستید که این مطالب را نمیدانید، به شما خواهیم گفت که هیچ نگرانی نداشته باشید برای رفع این چالش تنها کافی است تا مطلب هوش مصنوعی مولد (Generative AI) را با دقت مطالعه کنید و بعد از آن ادامه این مقاله را مطالعه کنید. در این مطلب باید با فرآیندهای RAG و گرافهای دانش آشنایی نسبی داشته باشید.
هذیان گویی (Hallucinations) در هوش مصنوعی چیست؟
هذیان گویی در هوش مصنوعی به پدیده ای گفته میشود که در ان مدلهای هوش مصنوعی خروجیهای نادرست، غیر منطقی یا ساختگی را به صورت خودکار تولید میکنند. شاید در نگاه اول این خروجیها منطقی و یک جواب معقول به نظر برسد، اما در اصل تمامی این جوابها ناقص و به اصطلاح فاسد هستند که بهره وری صحیحی نخواهند داشت.
انواع هذیان گویی هوش مصنوعی
هذیان هوش مصنوعی میتوانند در اشکالهای مختلفی ظاهر شوند و هرکدام از آنها به شیوههای ختلفی بر یکپارچگی سیستم هوش مصنوعی تاثیرات خود را بگذارند. شناخت انواع آن برای شناسایی و کاهش شیوع آنها در کاربردهای واقعی به کمک شما خواهند آمد.
هذیان گویی factual
هذیان گویی factual زمانی اتفاق میافتد که سیستم هوش مصنوعی خروجیهایی را تولید میکند که با واقعیتهای شناخته شده تناقضهایی را داشته باشد، معمولا به دلیل نادرستیها یا حذفها در دادههای آموزشی یا مکانیسمهای بازاریابی اتفاق میافتد.
بیایید با شرح یک مثال بهتر این موضوع را بشناسیم: هوش مصنوعی ممکن است به اشتباه به کاربر خود بگوید: برج ایفل در برلین قرار دارد. درحالی که این یک دروغ و اشتباه است.
بروز این خطابه خصوص در زمینه های مراقبتهای بهداشتی، خدمات حقوقی و آموزش اتفاقی بسیار زیان آور و منفی خواهد بود. اگر در این حوزههای نام برده شده اطلاعات غلط ارائه شود، قطعا منجر به نتایج بسیار نا مطلوب خواهد شد و در نتیجه اعتماد کاربران را از دست خواهید داد.
به چه دلیل هذیان گویی factual اتفاق می افتد؟
دلایل رخ دادن این هذیان گویی شامل دادههای آموزشی قدیمی یا اطلاعات نادرست وارد شده در اسناد استخراج شده خواهد بود.
هذیان گویی semantic
هذیان گویی semantic زمانی رخ میدهد که سیستم هوش مصنوعی پاسخهای گرامی درست اما نا مرتبط را با زمینه یا نا همانگ را به کاربر خود ارائه دهد.
بیایید با شرح یک مثال بهتر این موضوع را بشناسیم: اگر از آن بپرسید که علائدم دیابت چیست؟ هوش مصنوعی ابتدا تصور میکند که پاسخ صحیح این است: اولین اشاره به علائم دیابت در پاپیروس ابرس مشاهده میشود. این پاسخ اساسا درست است اما به نیت اصلی پرسش پاسخ صحیح را نمیدهد.
هذیان گویی semantic کارایی هوش مصنوعی را در وظایف contextual مانند پشتیابنی مشتری یا فنی کاش میدهند و کاربران را نا امید و بی اعتماد خواهد کرد. این مشکل معمولا ناشی از عدم تطابق بین پیش بینیهای احتمالی مدل و قصد پرسش هستند. همچنین میتواند به دلیل کمبود در grounding معنایی یا درک contextual اتفاق بیافتد.
هذیان گویی reasoning
هذیان گویی reasoning در زمانی مشاهده میشود که سیستم هوش مصنوعی خورجیهایی را تولید کند که نتیجه گیریهای منطقی آن نادرست باشد. این فرآیند به دلیل عدم درک روابط بین موجودیتها یا مفاهیم خواهد بود.
بیایید با شرح یک مثال بهتر این موضوع را بشناسیم: اگر بگویید تمامی میوه ها سیب هستند و پرتقال ها میوه هستند هوش مصنوعی ممکن است که به اشتباه نتیجه بگیرد که تمامی سیب ها پرتقال هستند. همین اندازه بی معنی و بی ربط😂.
این خطا به خصوص در وظایف علمی، حقوق یا فنی بسیار آسیب رسان خواهد بود. به این دلیل که consistency منطقی بسیار حائز اهمیت خواهد بود. دلایل اصلی آن شامل عدم نمایش روابط منطقی در دادههای آموزشی و نبود مکانیسمهای reasoning واضح در مدلهای مولد است.
هذیان گویی هوش مصنوعی چه اهمیتی دارد؟
درک این انواع هذیان گویی برای توسعه موثر هوش مصنوعی بسیار مهم خواهد بود. هذیان گویی factual به تکنیکهایی مانند بازیابی افزوده شدن (RAG) نیاز خواهند داشت تا بتوانند خروجیها را در برابر منابع خارجی تایید کنند.
اصلاح پرسش و ادغام زمینه از طریق گرافهای دانش میتواند از هذیان گویی semantic جلوگیری کند. در مقابل، هذیان گویی reasoning، نیاز به reasoning نمادین یا ماژول های منطقی مستقیم دارند تا consistency را تضمین کنند. حال اگر این سیستمهای هوش مصنوعی بتوانند تمامی این هذیان گوییها را بر طرف کنند، نتیجه کار آن خروجیهای دقیقتر خواهد بود.
علت اصلی هذیان گویی هوش مصنوعی
توهمات یا هذیان گویی هوش مصنوعی از محدودیتهای داده، معماری مدل و پیچیدگیهای درک زمینه به وجود میآیند. در ادامه به علتهای اصلی خواهیم پرداخت با دقت مطالعه کنید.
محدودیتهای داده آموزشی: مدلهای زبانی بزرگ در اغلب موارد بر روی مجموعه داده بزرگ اما غیرقابل اعتماد یا قدیمی آموزشهای لازم را میبینند و این عمل آن را منجر به misrepresentation دانش میشود و مدلها احتمالا در زمانی که با سوالات مبهم رو به رو میشوند جزئیات ساختگی از خود تولید میکنند.
Overgeneralization: مدلهای هوش مصنوعی خروجیها را بر اساس پیشبینیهای احتمالی تولید میکنند و در این زمان انعطافپذیری را فراهم میکند اما اگر مدل فاقد دانش خاص حوزه یا با موارد edge مواجه شود میتواند منجر به اظهارات confident اما نادرست شود.
عدم آگاهی contextual: مدلهای آموزشی بدون دسترسی به اطلاعات واقعی زمان تایید شده نمیتوانند هروجیهای مرتبط و دقیق contextual را حفظ کند. این کمبود grounding آن هم در صنایع مانند مراقبتهای بهداشتی و مالی بیشتر به چشم میآید. در این حوزهها دانش تخصصی و جاری بسیار مهم است و باید تمامی اطلاعات صحت داشته باشند.
عدم reasoning صریح: سیتمهای مولد اغلب فاقد reasoning صحیح در مورد روابط بین محدودیتها یا واقعیتها نخواهند هستند. این مورد منجر به نتیجهگیری نادرست یا پاسخهای بی معنی میشود.
تمامی علتها بر اهمیت استفاده از دادهای دقیق زمان برای مدلهای هوش مصنوعی و پیاده سازی روشهایی مانند RAG و گرافهای دانش برای جلوگیری از هذیان گویی تاکید میشود. به زبان ساده به ریشه اجازه میدهد سیستمهای هوش مصنوعی نتایج دقیق تر و آگاه از زمینه را تولید کنند.
بازیابی افزودهشده (RAG)
RAG یک معماری هوش مصنوعی است که مدلهای زبانی مولد را با یک موتور بازیابی تکمیل میکند. به جای تکیه بر وزنهای پیشآموزشدیده، اسناد خارجی را جستجو میکند تا پاسخهای مدل را contextual کند.
RAG ها چگونه کار میکنند؟
فرآیند با تحلیل پرسش و تبدیل آن به فرمت مناسب برای بازیابی شروع میشود. در مرحله بازیابی اسناد، جستجوی vector اسناد مناسب را از منبع دانش خارجی استخراج میکند. در تولید پاسخ، مدل از اسناد بازیابی شده بهعنوان زمینه استفاده میکند تا خروجی هایی را بر اساس داده های به روز و مرتبط تولید کند.
تصویر زیر نشان میدهد که چگونه یک پرسش از طریق embedding