پس از چند سال تمرکز جامعهی فناوری بر «مهندسی پرامپت»، اکنون نگاهها به مرحلهای تازه از طراحی عاملهای هوشمند دوخته شده است؛ مرحلهای که «مهندسی کانتکست» نام دارد. آنتروپیک (Anthropic) در تازهترین مقالهی خود، از این مفهوم بهعنوان گامی اساسی در بهبود عملکرد مدلهای زبانی بزرگ یاد میکند — جایی که مهندسان دیگر تنها بر واژهها تمرکز نمیکنند، بلکه بر مدیریت مؤثر اطلاعاتی که مدل در هر لحظه میبیند، تکیه دارند.
از پرامپتنویسی تا طراحی وضعیت ذهنی مدل
در مدلهای زبانی بزرگ (LLM)، مهندسی کانتکست بهمعنای یافتن «پیکربندی بهینهی اطلاعات» است؛ ترکیبی از دادهها، دستورالعملها و مثالهایی که احتمال دستیابی مدل به پاسخ درست را افزایش میدهد.
آنتروپیک در مقالهای منتشرشده در سپتامبر ۲۰۲۵ توضیح میدهد که این رویکرد فراتر از مهندسی پرامپت است. اگر مهندسی پرامپت هنر نوشتن دستورهای دقیق برای مدل باشد، مهندسی کانتکست علم مدیریت کل اطلاعات در دسترس مدل است — از دستورالعملهای سیستم گرفته تا تاریخچهی مکالمات و دادههای بازیابیشده.
چرا کانتکست اهمیت دارد؟
کانتکست همان حافظهی کاری مدل است؛ منبعی محدود که با هر توکن پر میشود و ظرفیتش هرچقدر هم افزایش یابد، باز هم محدود است. پژوهشها نشان دادهاند که با افزایش طول کانتکست، دقت مدل در بازیابی اطلاعات کاهش مییابد — پدیدهای که به «فرسایش کانتکست» (Context Rot) معروف است.
علت اصلی این محدودیت در معماری ترنسفورمر نهفته است؛ جایی که هر توکن با تمام توکنهای دیگر ارتباط دارد و این وابستگی از مرتبهی n² رشد میکند. در نتیجه، با افزایش حجم داده، تمرکز مدل افت میکند و کارایی آن پایین میآید.
اصول طراحی کانتکست مؤثر
- پرامپتهای سیستم: باید شفاف، دقیق و متناسب با نقش عامل باشند. جزئیات بیش از حد یا ابهام در دستورها، عملکرد مدل را تضعیف میکند.
- ابزارها (Tools): ابزارهای عامل باید داده را با کمترین هزینهی توکنی بازگردانند و رفتار مؤثر را تقویت کنند.
- مثالها (Few-Shot Examples): چند مثال گویا میتواند رفتار مدل را در مسیر درست هدایت کند. تعادل میان تنوع و تعداد مثالها اهمیت دارد.
بازیابی پویا؛ حافظهای هوشمند برای عاملها
در نسل جدید عاملهای هوشمند، رویکردی موسوم به بازیابی لحظهای (Just-in-Time Retrieval) در حال گسترش است. در این روش، عامل بهجای بارگذاری همهی دادهها از ابتدا، فقط شناسههای سبک (مانند لینک یا مسیر فایل) را نگه میدارد و هنگام نیاز، دادهی مرتبط را بازیابی میکند.
برای نمونه، عامل «Claude Code» از همین شیوه استفاده میکند تا بدون بارگذاری کامل مخزن کد، تنها بخشهای لازم را جستوجو کند. این فرآیند شبیه روش یادگیری انسان است؛ ما نیز همهچیز را به خاطر نمیسپاریم، بلکه میدانیم «کجا» باید به دنبال آن بگردیم.
چالش حافظه در پروژههای بلندمدت
- فشردهسازی (Compaction): خلاصهسازی مکالمات و دادهها بدون از دست دادن اطلاعات حیاتی.
- یادداشتبرداری ساختاریافته: ذخیرهی نکات مهم بیرون از پنجرهی کانتکست و فراخوانی آنها در لحظهی مناسب.
- معماری چندعاملی (Sub-Agent Architecture): تقسیم وظایف میان چند عامل تخصصی با حافظههای مستقل و تجمیع نتایج در عامل اصلی.
جمعبندی
مهندسی کانتکست، گامی فراتر از پرامپتنویسی است. در این رویکرد، توسعهدهنده دیگر تنها «دستور» نمینویسد، بلکه «ذهن مدل» را طراحی میکند — ذهنی که بداند چه ببیند، چه به یاد بسپارد و چه فراموش کند.
هرچند با پیشرفت مدلهای زبانی، نیاز به ترفندهای مهندسی پیچیده کمتر میشود، اما مدیریت کانتکست همچنان یکی از ارکان حیاتی در ساخت عاملهای دقیق، قابل اعتماد و هوشمند باقی خواهد ماند.
منبع: Anthropic – تیم Applied AI
نویسندگان: Prithvi Rajasekaran، Ethan Dixon، Carly Ryan و Jeremy Hadfield
با همکاری: Rafi Ayub، Hannah Moran، Cal Rueb و Connor Jennings
ویرایش و بازنویسی فارسی: تحریریه فناوری




