Bạn thiết kế các ứng dụng được cung cấp sức mạnh bởi AI như thế nào?

Question

Accepted Answer

Thiết kế các **ứng dụng được cung cấp sức mạnh bởi AI** liên quan đến việc chọn cách tiếp cận AI đúng, xử lý các đặc điểm độc đáo của AI (không tất định, chi phí, latency, lỗi), và thiết kế cho độ tin cậy xung quanh AI vốn không hoàn hảo. Nó kết hợp kỹ thuật phần mềm với các cân nhắc đặc thù cho AI.

## Chọn cách tiếp cận AI

```text
→ PROMPTING (API LLM) → cho hầu hết các tác vụ LLM (đơn giản nhất); prompt tốt đi xa
→ RAG → để căn cứ câu trả lời trên DỮ LIỆU riêng/hiện tại của bạn (giảm hallucination)
→ FINE-TUNING → cho hành vi/phong cách cụ thể mà prompting không thể đạt được
→ ML TRUYỀN THỐNG → cho dự đoán/phân loại có cấu trúc với dữ liệu
→ Các dịch vụ DỰNG SẴN → thị giác, giọng nói, v.v. (đừng phát minh lại)
→ khớp cách tiếp cận với bài toán (thường: prompting + RAG cho các ứng dụng LLM)
```

## Thiết kế xung quanh các đặc điểm của AI

```text
⚠️ AI KHÔNG HOÀN HẢO/không tất định → thiết kế cho nó:
  ✓ XÁC THỰC output của AI → đừng tin mù quáng; output có cấu trúc + xác thực; guardrail
  ✓ XỬ LÝ LỖI/thất bại → phương án dự phòng; AI có thể sai, không khả dụng, hoặc chậm
  ✓ HALLUCINATION → căn cứ (RAG), xác minh, trích dẫn, rà soát bởi con người cho các quyết định quan trọng
  ✓ HUMAN-IN-THE-LOOP → cho các quyết định rủi ro cao (đừng tự động hóa hoàn toàn các lựa chọn quan trọng)
  ✓ KHÔNG TẤT ĐỊNH → thiết kế cho sự biến thiên (đừng giả định các output giống hệt nhau)
```

## Các cân nhắc thực tế

```text
✓ CHI PHÍ → các lệnh gọi LLM tốn tiền (theo token) → tối ưu, cache, giám sát; chọn kích thước model đúng
✓ LATENCY → AI chậm → bất đồng bộ, streaming, quản lý kỳ vọng UX
✓ Đánh giá → bạn đo CHẤT LƯỢNG tính năng AI thế nào? (test AI khó hơn)
✓ BẢO MẬT → prompt injection, rò rỉ dữ liệu, bảo vệ key, làm sạch I/O
✓ UX → đặt kỳ vọng, cho phép phản hồi/sửa lỗi, suy giảm có kiểm soát
→ kỹ thuật các hệ thống đáng tin cậy XUNG QUANH AI không hoàn hảo
```

## Tại sao điều này quan trọng

Hiểu cách thiết kế các ứng dụng được cung cấp sức mạnh bởi AI là kiến thức cấp senior có giá trị vì **xây dựng các ứng dụng AI thực tế đòi hỏi xử lý các đặc điểm độc đáo của AI**, nên ngày càng quan trọng cho developer xây dựng các tính năng AI.

Thiết kế các ứng dụng AI kết hợp kỹ thuật phần mềm với các cân nhắc đặc thù cho AI.

Hiểu **chọn cách tiếp cận AI** — prompting (API LLM, đơn giản nhất, cho hầu hết các tác vụ LLM), RAG (căn cứ trên dữ liệu riêng/hiện tại của bạn để giảm hallucination), fine-tuning (cho hành vi cụ thể), ML truyền thống (cho dự đoán có cấu trúc), và các dịch vụ dựng sẵn — và khớp cách tiếp cận với bài toán (thường là prompting cộng RAG cho các ứng dụng LLM) phản ánh quyết định kiến trúc về cách áp dụng AI.

Hiểu **thiết kế xung quanh các đặc điểm của AI** là then chốt: vì AI **không hoàn hảo và không tất định**, bạn phải thiết kế cho nó — **xác thực output của AI** (đừng tin mù quáng, dùng output có cấu trúc và xác thực), **xử lý lỗi và thất bại** (phương án dự phòng cho khi AI sai, không khả dụng, hoặc chậm), xử lý **hallucination** (căn cứ qua RAG, xác minh, rà soát bởi con người cho các quyết định quan trọng), dùng **human-in-the-loop** cho các quyết định rủi ro cao (đừng tự động hóa hoàn toàn các lựa chọn quan trọng), và thiết kế cho **không tất định**.

Những điều này phản ánh cái nhìn then chốt rằng bạn phải kỹ thuật các hệ thống đáng tin cậy *xung quanh* AI vốn không hoàn hảo.

Hiểu **các cân nhắc thực tế** — chi phí (tối ưu và cache các lệnh gọi LLM), latency (bất đồng bộ, streaming), đánh giá (đo chất lượng tính năng AI, vốn khó hơn), bảo mật (prompt injection, rò rỉ dữ liệu, bảo vệ key), và UX (đặt kỳ vọng, cho phép sửa lỗi) — phản ánh toàn bộ phạm vi của việc xây dựng các ứng dụng AI vững chắc.

Khi các tính năng AI trở nên phổ biến, thiết kế các ứng dụng AI tốt (chọn cách tiếp cận, xử lý sự không hoàn hảo, quản lý chi phí/latency/bảo mật) là một kỹ năng developer ngày càng quan trọng.

Vì xây dựng các ứng dụng AI thực tế đòi hỏi xử lý các đặc điểm độc đáo của AI (sự không hoàn hảo, không tất định, chi phí, latency) và thiết kế các hệ thống đáng tin cậy xung quanh AI vốn không hoàn hảo, và vì hiểu cách chọn các cách tiếp cận và thiết kế cho các đặc điểm của AI ngày càng quan trọng cho developer, nên hiểu cách thiết kế các ứng dụng được cung cấp sức mạnh bởi AI là kiến thức cấp senior có giá trị, ngày càng thiết yếu — quan trọng để xây dựng các ứng dụng AI thực tế (chọn cách tiếp cận, thiết kế xung quanh sự không hoàn hảo và không tất định của AI, xử lý chi phí/latency/bảo mật), với cái nhìn then chốt là kỹ thuật các hệ thống đáng tin cậy xung quanh AI không hoàn hảo, và ngày càng thiết yếu khi các tính năng AI trở nên phổ biến trong ứng dụng.