تغییرات اخیر

در اینجا اطلاعیه‌ها، نسخه‌ها و تغییرات جدید لیارا فهرست می‌شوند.

مقایسه Agentic RAG و RAG؛ کدام برای پروژه‌های AI بهتر است؟


۲۷ تیر ۱۴۰۴

هوش مصنوعی دیگر فقط ابزاری برای پاسخگویی به پرسش‌ها نیست؛ حالا قادر است خودش فکر کند، تصمیم بگیرد و حتی راه‌حل‌هایی فراتر از آنچه انتظار می‌رود، ارائه دهد. ترکیب این توانایی‌ها با فناوری‌های بازیابی اطلاعات، نسل جدیدی از سیستم‌ها را به وجود آورده که به آن‌ها Agentic RAG می‌گویند. این سیستم‌ها نه تنها اطلاعات را بازیابی می‌کنند، بلکه با هوشمندی و برنامه‌ریزی مستقل، بهترین پاسخ‌ها را از منابع مختلف گردآوری و تولید می‌کنند.

در این مقاله به بررسی Agentic RAG، قابلیت‌ها و تفاوت‎‌های آن با سیستم‌های RAG معمولی می‌پردازیم و نشان می‌دهیم چگونه این فناوری می‌تواند آینده تعامل انسان و ماشین را متحول کند.

در ادامه خواهید خواند:

  • RAG چیست؟
  • هوش مصنوعی عاملی (Agentic AI) چیست؟
  • مقایسه Agentic RAG با سیستم‌های RAG سنتی
  • Agentic RAG چگونه کار می‌کند؟
  • کاربردهای Agentic RAG
  • جمع بندی
هوش مصنوعی Agentic RAG

RAG چیست؟

RAG یا تولید تقویت‌شده با بازیابی (Retrieval-Augmented Generation)، یک روش پیشرفته در حوزه هوش مصنوعی است که با ترکیب یک چت‌بات هوشمند با یک پایگاه داده خارجی، می‌تواند پاسخ‌هایی دقیق‌تر و مرتبط‌تر ارائه دهد.

در این روش، مدل هوش مصنوعی تنها به داده‌هایی که از قبل با آن آموزش دیده، وابسته نیست. بلکه می‌تواند به‌صورت هم‌زمان به اطلاعات به‌روز از منابع خارجی مانند پایگاه‌های داده یا API ها دسترسی داشته باشد. این ویژگی باعث می‌شود مدل در موضوعات تخصصی، بدون نیاز به آموزش مجدد، عملکرد بهتری داشته باشد.

ساختار یک سیستم RAG معمولا از دو بخش اصلی تشکیل شده است:

  • بخش بازیابی اطلاعات: این بخش وظیفه دارد داده‌های مرتبط با پرسش کاربر را از یک پایگاه داده دانش پیدا کند. این کار معمولا با استفاده از یک مدل تعبیه‌سازی (embedding) و یک پایگاه داده برداری (vector database) انجام می‌شود.
  • بخش تولید پاسخ: در این مرحله، یک مدل زبانی بزرگ (LLM) با استفاده از اطلاعات بازیابی شده و خود پرسش کاربر، پاسخ نهایی را تولید می‌کند.

به‌صورت خلاصه، وقتی کاربر یک سوال می‌پرسد، ابتدا آن پرسش به یک بردار عددی تبدیل می‌شود. سپس سیستم، داده‌هایی مشابه از پایگاه دانش پیدا می‌کند و در اختیار مدل هوش مصنوعی قرار می‌دهد تا پاسخ نهایی را با توجه به اطلاعات واقعی و مرتبط تولید کند. نتیجه، پاسخی است که نه‌تنها به سوال کاربر مرتبط است، بلکه از نظر محتوایی نیز دقیق‌تر و کاربردی‌تر خواهد بود.

RAG یا Fine-tuning؟ انتخاب مناسب برای مدل‌ های هوش مصنوعی
RAG یا Fine-tuning

هوش مصنوعی عاملی (Agentic AI) چیست؟

Agentic AI یا هوش مصنوعی عامل محور نوعی از هوش مصنوعی است که می‌تواند به‌صورت مستقل تصمیم بگیرد و مسیر انجام یک کار را مشخص و اجرا کند. بیشتر Agent هایی که در حال حاضر استفاده می‌شوند، مدل‌های زبانی بزرگ هستند که توانایی فراخوانی ابزارها از طریق API را دارند؛ به این معنا که می‌توانند ابزار مناسب را برای انجام یک وظیفه انتخاب کرده و اجرا کنند.

به‌صورت کلی، Agentic AI سه ویژگی اصلی دارند.

  • حافظه کوتاه‌مدت و بلندمدت: این حافظه امکان برنامه‌ریزی و اجرای وظایف پیچیده را فراهم می‌کند. عامل می‌تواند به اطلاعات وظایف قبلی مراجعه کرده و از آن برای تصمیم‌گیری‌های بعدی استفاده کند. در سیستم‌های Agentic RAG، معمولا از حافظه معنایی برای ذخیره و استفاده مجدد از پرسش‌ها، زمینه‌ها و پاسخ‌ها استفاده می‌شود.
  • توانایی مسیردهی، برنامه‌ریزی مرحله‌به‌مرحله و تصمیم‌گیری: Agent می‌تواند یک درخواست پیجیده را به مراحل کوچک‌تری تقسیم کند، برای هر مرحله برنامه‌ریزی کند و براساس اطلاعات ذخیره‌شده، بهترین مسیر را برای رسیدن به پاسخ انتخاب کند.
  • قابلیت استفاده از طریق API برای ابزارهای خارجی: Agent های قدرتمند می‌توانند تشخیص دهند برای انجام یک وظیفه به کدام ابزار نیاز دارند و آن را به‌صورت مستقل فراخوانی کنند.

فرآیندهای مبتنی بر Agentic AI می‌توانند شامل یک Agent باشند یا به‌صورت سیستم‌های چند عامله طراحی شوند که چندین Agent را در کنار هم به کار می‌گیرند.

عامل هوش مصنوعی چیست؟ هر آنچه باید در مورد آن‌ها بدانید
عامل هوش مصنوعی (AI Agent)

مقایسه Agentic RAG با سیستم‌های RAG سنتی

Agentic RAG در مقایسه با پیاده‌سازی‌های سنتی RAG، چندین بهبود قابل توجه ارائه می‌دهد که در ادامه به آن‌ها اشاره می‌کنیم.

  • انعطاف‌پذیری: در سیستم‌های Agentic RAG، داده‌ها می‌توانند از چندین پایگاه دانش خارجی جمع‌آوری شوند و استفاده از ابزارهای بیرونی نیز امکان‌پذیر است. در مقابل، ساختار RAG سنتی معمولا یک مدل زبانی (LLM) را تنها به یک مجموعه‌داده خارجی متصل می‌کند. برای مثال، در بسیاری از سیستم‌های سازمانی، یک چت‌بات به یک پایگاه داده اختصاصی متصل است که تنها شامل اطلاعات داخلی شرکت است.
  • سازگاری: RAG سنتی یک ابزار بازیابی واکنشی است که صرفا در پاسخ به پرسش‌ها، اطلاعات مرتبط را بازیابی می‌کند و توانایی انطباق با شرایط جدید یا دسترسی به منابع دیگر را ندارد. برای گرفتن نتایج مطلوب، معمولا نیاز به مهندسی پیشرفته‌ی پرسش (prompt engineering) وجود دارد.
    در مقابل، Agentic RAG از یک سیستم پرسش‌محور ایستا به سمت حل مسئله هوشمند و سازگار حرکت می‌کند. رد این مدل، سیستم‌های چندعامله به مدل‌های مختلف اجازه می‌دهند با یکدیگر همکاری کنند و حتی خروجی‌های همدیگر را بررسی و بهبود دهند.
  • دقت: در سیستم‌های سنتی، هیچ مکانیزم داخلی برای بررسی یا بهینه‌سازی پاسخ‌ها وجود ندارد. در نتیجه، کاربران باید خودشان تشخیص دهند که آیا خروجی درست بوده یا خیر. اما در Agentic RAG، عامل‌ها می‌توانند فرآیندهای قبلی را بررسی کرده و به‌مرور زمان کیفیت پاسخ‌ها را بهینه کنند.
  • مقیاس‌پذیری: با استفاده از Agent ها که به منابع مختلف متصل هستند و قابلیت برنامه‌ریزی و فراخوانی ابزارها را دارند، Agentic RAG مقیاس‌پذیری بسیار بیشتری دارد. توسعه‌دهندگان می‌توانند با کمک این ساختار، سیستم‌هایی بسازند که طیف وسیعی از درخواست‌های کاربران را به‌صوت همزمان مدیریت کنند.
  • چندوجهی بودن (Multimodality): Agentic RAG از پیشرفت‌های اخیر در مدل‌های زبانی چندوجهی (Multimodal LLMs) بهره‌مند است. این مدل‌ها می‌توانند با انواع مختلفی از داده‌ها مانند تصویر، صدا، متن‌های ساختاریافته، نیمه‌ساختاریافته و بدون ساختار کار کنند. برای مثال، برخی از نسخه‌های جدید GPT قادر هستند علاوه بر تولید متن، محتوای صوتی و تصویری نیز ایجاد کنند.

فرض کنید چند کارمند در یک دفتر مشغول به کار هستند:
یک سیستم RAG سنتی مانند کارمندی است که وظایف خودر ا دقیق انجام می‌دهد، اما فقط در صوتی که دقیقا به او گفته شود چه کاری، چطور و چه زمانی باید انجام شود. او علاقه‌ای به ابتکار عمل ندارد و از خارج شدن از چارچوب دستورالعمل‌ها احساس ناراحتی می‌کند.

در مقابل، یک سیستم Agentic RAG مثل تیمی خلاق و باانگیزه است. آن‌ها هم می‌توانند دستورالعمل‌ها را دنبال کنند، اما از حل مسئله، یافتن راه‌حل‌های جدید و پیش‌بینی چالش‌ها لذت می‌برند. این تیم بدون ترس از شکست، راه‌هایی را امتحان می‌کند که شاید دیگران حتی جرئت فکر کردن به آن‌ها را نداشته باشند.

آیا Agentic RAG همیشه بهتر است؟

با وجود تمام مزایایی که Agentic RAG ارائه می‌دهد، از جمله استفاده از Function Calling، تفکر چندمرحله‌ای و سیستم‌های چندعامله همیشه بهترین انتخاب نیست.

این ساختار پیچیده‌تر، معمولا هزینه‌ بیشتری دارد، چون استفاده از Agent های متعدد یعنی مصرف بیشتر توکن و منابع پردازشی. هرچند سرعت پاسخ‌گویی ممکن است نسبت به RAG سنتی بیشتر باشد، اما گاهی تولید خروجی توسط LLM ها با تاخیر زمانی همراه است.

از طرف دیگر، Agent ها همیشه هم دقیق و قابل اعتماد نیستند. ممکن است در اجرای برخی وظایف شکست بخورند یا همکاری بین آن‌ها دچار اختلال شود. هرچه تعداد Agent ها بیشتر باشد، هماهنگی بین آن‌ها پیچیده‌تر شده و احتمال بروز مشکل هم افزایش می‌یابد. حتی در پیشرفته‌ترین سیستم‌های RAG هم هنوز خطر هالوسینیشن (تولید پاسخ نادرست یا ساختگی) به‌طور کامل حذف نشده است.

با سرویس هوش مصنوعی لیارا، بدون دغدغه زیرساخت، مدل‌های AI خودت رو اجرا و مدیریت کن.
✅ پشتیبانی از GPU و CPU ✅ مناسب مدل‌های متن‌باز ✅ اجرای پایدار و سریع
خرید و راه‌انداری سرویس هوش مصنوعی

Agentic RAG چگونه کار می‌کند؟

Agentic RAG با استفاده از یک یا چند نوع عامل (Agent) هوش مصنوعی درون سیستم‌های RAG کار می‌کند. به عنوان مثال، ممکن است یک سیستم Agentic RAG چند عامل بازیابی اطلاعات داشته باشد که هرکدام در یک حوزه خاص یا منبع داده مشخص تخصص دارند. یکی از این عامل‌ها ممکن است پایگاه‌های داده خارجی را جست‌وجو کند، در حالی که عامل دیگر ایمیل‌ها یا نتایج وب را بررسی کند.

فریم‌ورک‌های Agentic AI مانند LangChain، LlamaIndex و فریم‌ورک ارکستراسیون LangGraph در GitHub در دسترس هستند و به توسعه‌دهندگان اجازه می‌دهند با کمترین هزینه معماری‌های Agentic برای RAG را پیاده‌سازی و آزمایش کنند. استفاده از مدل‌های متن‌باز مانند Granite™ یا Llama-3 علاوه بر کاهش هزینه‌های مربوط به استفاده از سرویس‌هایی مثل OpenAI، امکان نظارت بیشتر بر روند اجرای سیستم را نیز فراهم می‌کند.

سیستم‌های Agentic RAG می‌توانند از یک یا چند نوع عامل هوش مصنوعی بهره ببرند، از جمله:

Routing Agent

این عامل مشخص می‌کند برای پاسخ به درخواست کاربر، باید از کدام منبع دانش یا ابزار خارجی استفاده شود. در یک سیستم تک‌عاملی، Routing Agent تصمیم می‌گیرد که کدام پایگاه داده برای جست‌وجو مناسب‌تر است.

Query Planning Agent

این عامل نقش برنامه‌ریز و مدیر وظایف را ایفا می‌کند. وقتی با یک درخواست پیچیده مواجه شود، آن را به مراحل کوچکتر تقسیم کرده و به عامل‌های دیگر می‌سپارد. در نهایت نیز پاسخ‌های دریافتی را ترکیب کرده و یک پاسخ یکپارچه تولید می‌کند. این نوع معماری نمونه‌ای از ارکستراسیون هوش مصنوعی محسوب می‌شود.

ReAct Agent

ReAct (مخفف Reasoning and Action) چارچوبی برای ساخت سیستم‌های چندعاملی است که می‌توانند راه‌حل‌هایی مرحله‌به‌مرحله تولید کرده و بر اساس آن عمل کنند. این عامل‌ها همچنین توانایی انتخاب ابزارهای مناسب برای اجرای هر مرحله را دارند و می‌توانند مسیر اجرای وظایف را به‌صورت پویا بر اساس نتایج هر مرحله تغییر دهند.

عامل هوش مصنوعی (AI Agents) یا چت‌ بات؟ تفاوت‌ ها و کاربرد ها
AI Agents یا چت‌ بات

Plan-and-Execute Agent

این چارچوب نسخه‌ی پیشرفته‌تر ReAct است که می‌تواند بدون نیاز به تعامل مجدد با عامل اصلی، وظایف چندمرحله‌ای را به‌طور کامل اجرا کند. این موضوع باعث کاهش هزینه‌ها و افزایش سرعت اجرای فرآیند می‌شود. از آنجا که این عامل باید تمام مراحل را به‌صورت دقیق برنامه‌ریزی کند، معمولاً نرخ موفقیت و کیفیت خروجی بالاتری دارد.

کاربردهای Agentic RAG

در حالی که Agentic RAG می‌تواند در تمام سناریوهای معمول RAG کاربرد داشته باشد، اما به‌دلیل نیاز بیشتر به منابع محاسباتی، معمولاً برای مواردی مناسب‌تر است که نیاز به جست‌وجو در چندین منبع داده به‌صورت هم‌زمان وجود دارد. برخی از کاربردهای رایج عبارتند از:

  • پاسخ‌گویی لحظه‌ای به سؤالات: کسب‌وکارها می‌توانند از چت‌بات‌ها و بخش‌های پرسش‌های متداول مبتنی بر RAG استفاده کنند تا اطلاعات دقیق و به‌روز در اختیار کاربران یا کارکنان قرار دهند.
  • پشتیبانی خودکار: شرکت‌ها می‌توانند از سیستم‌های Agentic RAG برای پاسخ‌گویی خودکار به درخواست‌های ساده پشتیبانی استفاده کنند و در صورت نیاز، موارد پیچیده‌تر را به نیروی انسانی ارجاع دهند.
  • مدیریت داده‌ها: سیستم‌های RAG می‌توانند به کارمندان کمک کنند تا بدون نیاز به جست‌وجوی دستی در پایگاه داده‌ها، اطلاعات موردنیازشان را به سرعت پیدا کنند.
چرا چت‌بات‌ها نیت ما را نمی‌فهمند؟ از تولید زبان تا گفت‌وگوی با LLM ها
گفت‌وگوی با LLM

جمع بندی

Agentic RAG فقط یک نسخه‌ به‌روزشده از سیستم‌های بازیابی اطلاعات نیست؛ بلکه راهی نو برای ساخت ابزارهایی‌ست که می‌فهمند، تصمیم می‌گیرند و عمل می‌کنند. وقتی چندین ایجنت با تخصص‌های متفاوت در کنار هم کار می‌کنند، می‌توان به پاسخ‌هایی دقیق‌تر، سریع‌تر و متناسب با نیاز کاربر رسید. این یعنی عبور از پاسخ‌های ساده و رسیدن به درک عمیق‌تری از داده‌ها. اگر می‌خواهید تجربه‌ای واقعی از هوش مصنوعی تعامل‌پذیر و تصمیم‌گیر داشته باشید، وقتش رسیده Agentic RAG را جدی‌تر دنبال کنید.

به اشتراک بگذارید