Hành Trình Từ Prompt Engineering Đến Kỷ Nguyên Agent & MCP

Năm 2023, chúng ta choáng ngợp vì ChatGPT có thể viết thơ và trả lời mọi câu hỏi. Năm 2024, chúng ta bắt đầu thấy thất vọng. Tại sao? Vì chúng ta nhận ra: AI chỉ đang “nói mồm”. Nó không thể tự sửa file code trên máy tính của tôi, không thể tự query vào Database công ty để lấy báo cáo doanh thu, và càng không thể tự đặt lịch họp khi thấy email khách hàng.

Đó là lúc cuộc đua thay đổi: Chúng ta không cần một Chatbot thông thái nữa, chúng ta cần một Agent (Tác nhân) biết hành động. Và để làm được điều đó, chúng ta cần những tiêu chuẩn mới như MCP (Model Context Protocol).

Bài viết này sẽ giải mã 4 cấp độ tiến hóa của AI mà mọi lập trình viên cần nắm vững.

*Hành Trình Tiến Hóa Của AI: Từ Prompt Engineering Đến Kỷ Nguyên Agent & MCP*

Cấp độ 1: Prompt Engineering (Lời nhắc tĩnh)

Đây là tầng cơ bản nhất. Bạn đưa văn bản đầu vào (Input), mô hình LLM (Large Language Model) trả về văn bản đầu ra (Output).

Cơ chế: Dựa trên xác suất thống kê từ dữ liệu đã học (Pre-trained data).
Hạn chế chí mạng:
- Dữ liệu cũ: AI không biết những gì xảy ra sau ngày nó được train.
- Ảo giác: Nếu không biết, nó sẽ bịa.
- Cô lập: Nó không thể chạm vào dữ liệu thực tế của bạn (File, Database, API).

Cấp độ 2: Skills / Tools (Trao “tay” cho AI)

Để AI bớt “chém gió”, các nhà phát triển (như OpenAI) giới thiệu Function Calling (Gọi hàm).

Cơ chế hoạt động: Thay vì AI trực tiếp trả lời, nó sẽ trả về một cấu trúc dữ liệu (thường là JSON) yêu cầu chạy một hàm cụ thể.

User: “Thời tiết Hà Nội thế nào?”
AI (Suy nghĩ): Mình không biết dữ liệu realtime. Nhưng mình được dev cung cấp tool get_weather.
AI (Output JSON): { "function": "get_weather", "params": { "city": "Hanoi" } }
App (Backend): Nhận JSON -> Chạy code thực tế gọi API thời tiết -> Trả kết quả “25 độ C” lại cho AI.
AI (Final Answer): “Hà Nội đang 25 độ C bạn nhé.”

Cấp độ 3: AI Agents (Trao “não” cho AI)

Đây là bước nhảy vọt. Agent = LLM + Memory + Planning + Tools.

Khác với việc gọi 1 hàm đơn lẻ, Agent có khả năng Reasoning (Lập luận) để giải quyết một vấn đề phức tạp bằng chuỗi hành động.

Vòng lặp của Agent: Agent thường hoạt động theo mô hình ReAct (Reason + Act):

Thought: User muốn “Viết báo cáo doanh thu tuần rồi gửi mail cho sếp”.
Plan:
- Bước 1: Dùng tool database_query lấy số liệu.
- Bước 2: Dùng tool calculator tính tăng trưởng.
- Bước 3: Dùng tool send_email để gửi.
Action: Thực thi từng bước, nếu bước 1 lỗi, nó tự biết quay lại sửa query và thử lại.

Cấp độ 4: MCP – Model Context Protocol (Chuẩn hóa kết nối)

Đây là công nghệ “trending” nhất hiện nay, được Anthropic giới thiệu cuối năm 2024.

Vấn đề của thế giới trước MCP: Bạn muốn nối AI (Claude, ChatGPT) với Google Drive? Bạn phải viết code integration. Bạn muốn nối nó với Slack? Lại viết code integration khác. Bạn muốn nối nó với Postgres DB? Lại code tiếp. -> Mỗi mô hình AI x Mỗi nguồn dữ liệu = Cấp số nhân công sức bảo trì (The m x n problem).

Giải pháp MCP: MCP giống như cổng USB-C cho các mô hình AI. Nó là một giao thức mở (Open Standard).

MCP Server: Bạn viết code kết nối dữ liệu (ví dụ: code đọc file trong máy tính) một lần duy nhất tuân theo chuẩn MCP.
MCP Client: Mọi ứng dụng AI (Claude Desktop, Cursor, Zed IDE…) đều có thể “cắm” vào Server này và dùng luôn.

Ví dụ thực tế về sức mạnh của MCP:

Bạn chạy một MCP Server trên máy local có quyền truy cập vào Database PostgreSQL.

Bạn bật Claude Desktop lên, Claude tự động nhận diện được Database này.
Bạn chat: “Kiểm tra user nào đăng ký hôm qua nhưng chưa verify email”.
Claude (thông qua MCP) tự sinh SQL, query vào DB local của bạn (an toàn tuyệt đối), và trả về kết quả. Không cần upload dữ liệu lên mây, không cần API key phức tạp.

Bảng So Sánh Tổng Hợp

Tiêu chí	Prompt	Skill (Tools)	Agent	MCP
Vai trò	Ra lệnh bằng văn bản.	Các hàm chức năng riêng lẻ.	Nhân viên tự chủ quy trình.	Cổng kết nối tiêu chuẩn.
Khả năng	Chỉ dựa trên dữ liệu training cũ.	Tương tác với thế giới bên ngoài (API).	Tự lập kế hoạch, sửa lỗi, phối hợp nhiều tool.	Giúp AI kết nối với mọi dữ liệu (Local/Remote) một cách thống nhất.
Ví dụ	“Viết code SQL lấy user.”	Gọi hàm `excute_sql(query)`.	Tự vào DB lấy schema -> viết query -> chạy -> xuất report.	Một driver chuẩn để Claude, OpenAI, Gemini đều kết nối được DB đó.
Tư duy	Người dùng	Người chế tạo công cụ	Người thiết kế hệ thống	Người xây dựng hệ sinh thái

Bảng So Sánh Tổng Hợp Prompt, Skill, Agent & MCP

Tương lai của lập trình viên

Sự xuất hiện của Agent và MCP đang thay đổi cách chúng ta viết phần mềm:

Code ít UI hơn: Thay vì viết Dashboard admin phức tạp, ta viết các MCP Server để Agent có thể query dữ liệu và trả lời sếp ngay trong khung chat.
Tập trung vào API & Logic: Agent không quan tâm UI đẹp, nó quan tâm API có mô tả rõ ràng (Documentation) để nó hiểu cách dùng hay không.