Thiết kế các ứng dụng được cung cấp sức mạnh bởi AI liên quan đến việc chọn cách tiếp cận AI đúng, xử lý các đặc điểm độc đáo của AI (không tất định, chi phí, latency, lỗi), và thiết kế cho độ tin cậy xung quanh AI vốn không hoàn hảo. Nó kết hợp kỹ thuật phần mềm với các cân nhắc đặc thù cho AI.
Chọn cách tiếp cận AI
→ PROMPTING (API LLM) → cho hầu hết các tác vụ LLM (đơn giản nhất); prompt tốt đi xa
→ RAG → để căn cứ câu trả lời trên DỮ LIỆU riêng/hiện tại của bạn (giảm hallucination)
→ FINE-TUNING → cho hành vi/phong cách cụ thể mà prompting không thể đạt được
→ ML TRUYỀN THỐNG → cho dự đoán/phân loại có cấu trúc với dữ liệu
→ Các dịch vụ DỰNG SẴN → thị giác, giọng nói, v.v. (đừng phát minh lại)
→ khớp cách tiếp cận với bài toán (thường: prompting + RAG cho các ứng dụng LLM)
