ملاحظات عمل وتجارب ومقالات مما نبنيه ونختبره. تطبيقية وقابلة للتكرار وصادقة حول ما لم ينجح.
نحلل أين يقضي وكلاء الذكاء الاصطناعي متعددو الخطوات وقتهم فعلا ونعرض استراتيجية تخزين مؤقت + توجيه تقلل وقت الاستجابة بشكل كبير مع فقدان جودة ضئيل.
تقييم للنماذج المدمجة على مهام عملاء حقيقية. أين تصمد الصغيرة، وأين تفشل، وحسابات التكلفة وراء اختيار واحد منها.
بوابة ثقة بسيطة تسمح لنظام RAG بالإجابة من معرفته الخاصة عندما يضيف الاسترجاع ضوضاء. هلوسات أقل، عمليات بحث ضائعة أقل.
التعامل مع الأوامر كقطع برمجية مُصدرة مع اختبارات انحدار. الأداة التي نستخدمها داخليا لمنع "التحسينات" من كسر الأشياء بهدوء.