Sản phẩm · Simon Willison Blog
Tối ưu hóa Claude Code: Bí quyết để AI tự đưa ra quyết định thông minh
Simon Willison chia sẻ cách để AI tự quyết định quy trình làm việc thay vì tuân thủ quy tắc cứng nhắc, đồng thời kết hợp các mô hình như Sonnet và Haiku để tiết kiệm token hiệu quả.
Simon Willison chia sẻ cách để AI tự quyết định quy trình làm việc thay vì tuân thủ quy tắc cứng nhắc, đồng thời kết hợp các mô hình như Sonnet và Haiku để tiết kiệm token hiệu quả.
Bài viết cung cấp kỹ thuật thực chiến có giá trị cao cho người dùng AI Agent, giúp tối ưu chi phí và hiệu suất làm việc thực tế.
Nội dung dịch chi tiết
Một trong những mẹo thú vị nhất mà tôi thu thập được từ buổi trò chuyện với Cat Wu và Thariq Shihipar từ đội ngũ Claude Code tại AIE là hãy để Fable (và phần nào đó là Opus) tự sử dụng khả năng phán đoán của chúng thay vì chỉ định cách chúng nên làm việc.
Ví dụ điển hình là việc kiểm thử. Thay vì ra lệnh "chỉ sử dụng kiểm thử tự động cho các tính năng lớn, không cập nhật hoặc chạy kiểm thử cho các thay đổi nhỏ về nội dung hay thiết kế", tốt hơn hết là hãy yêu cầu Fable tự quyết định khi nào cần viết kiểm thử.
Jesse Vincent cũng vừa chia sẻ với tôi một mẹo liên quan để tránh tiêu tốn quá nhiều token Fable quý giá trước khi giá tăng. Đó là yêu cầu Fable sử dụng các mô hình khác cho những tác vụ nhỏ hơn, dựa trên khả năng tự đánh giá của nó để chọn mô hình phù hợp.
Tôi đã thử nghiệm bằng cách ra lệnh cho Claude Code: "Đối với tất cả các tác vụ lập trình, hãy sử dụng khả năng phán đoán của bạn để quyết định một mô hình có công suất thấp hơn phù hợp và chạy tác vụ đó trong một subagent (tác nhân phụ)."
Claude đã lưu lại chỉ dẫn này vào tệp bộ nhớ dự án. Nguyên tắc cốt lõi là: công việc triển khai hiếm khi cần đến mô hình cao cấp nhất, trong khi các khâu phán đoán, đánh giá và tổng hợp vẫn được giữ lại ở vòng lặp chính.
Cách áp dụng là khi một tác vụ chủ yếu là viết hoặc chỉnh sửa mã, hãy tạo một Agent với mô hình được chỉ định (như Sonnet cho các triển khai quan trọng, Haiku cho các chỉnh sửa cơ học đơn giản). Sau đó, hãy xem xét kết quả trong vòng lặp chính trước khi xác nhận.
Cho đến nay, phương pháp này hoạt động rất hiệu quả. Tôi đang hoàn thành được khối lượng công việc lớn mà hạn mức Fable của tôi cũng giảm chậm hơn trước.
Ý chính từ bài gốc
- Hãy để AI tự phán đoán thay vì áp đặt quy trình làm việc cứng nhắc.
- Ủy quyền các tác vụ lập trình nhỏ cho các mô hình AI có công suất thấp hơn.
- Sử dụng mô hình cao cấp cho các tác vụ đòi hỏi tư duy, đánh giá và tổng hợp.
- Kiểm tra kết quả từ các tác nhân phụ trong vòng lặp chính trước khi xác nhận.
- Phương pháp này giúp tối ưu hóa chi phí token và tăng hiệu suất làm việc.