AI Research - FuturaX

أبحاث الذكاء الاصطناعي

ملاحظات عمل وتجارب ومقالات مما نبنيه ونختبره. تطبيقية وقابلة للتكرار وصادقة حول ما لم ينجح.

2026.05 · مسودة قابل للتكرار

نحلل أين يقضي وكلاء الذكاء الاصطناعي متعددو الخطوات وقتهم فعلا ونعرض استراتيجية تخزين مؤقت + توجيه تقلل وقت الاستجابة بشكل كبير مع فقدان جودة ضئيل.

وكلاءتأخيراستدلال

2026.04 · ملاحظة بيانات مفتوحة

تقييم للنماذج المدمجة على مهام عملاء حقيقية. أين تصمد الصغيرة، وأين تفشل، وحسابات التكلفة وراء اختيار واحد منها.

نماذج صغيرةتقييمتكلفة

2026.03 · تجربة الكود متاح

بوابة ثقة بسيطة تسمح لنظام RAG بالإجابة من معرفته الخاصة عندما يضيف الاسترجاع ضوضاء. هلوسات أقل، عمليات بحث ضائعة أقل.

RAGاسترجاعموثوقية

2026.02 · ملاحظة قيد التنفيذ

التعامل مع الأوامر كقطع برمجية مُصدرة مع اختبارات انحدار. الأداة التي نستخدمها داخليا لمنع "التحسينات" من كسر الأشياء بهدوء.

توجيهاختبارأدوات