Sản phẩm · X:Xiaohu (@xiaohu)
Browser Use CLI 3.0 ra mắt: Tối ưu hiệu suất, giảm 6 lần dung lượng và tiết kiệm token
Browser Use CLI 3.0 nâng cấp khả năng điều khiển trình duyệt trực tiếp qua CDP, loại bỏ việc nạp toàn bộ DOM vào ngữ cảnh và hỗ trợ tái sử dụng các luồng thao tác. Công cụ này giúp tối ưu chi phí toke
Browser Use CLI 3.0 nâng cấp khả năng điều khiển trình duyệt trực tiếp qua CDP, loại bỏ việc nạp toàn bộ DOM vào ngữ cảnh và hỗ trợ tái sử dụng các luồng thao tác. Công cụ này giúp tối ưu chi phí token, tăng tốc độ xử lý và dễ dàng tích hợp vào các agent như Claude Code.
Đây là bản cập nhật kỹ thuật quan trọng cho các nhà phát triển AI Agent, giải quyết trực tiếp bài toán chi phí token và hiệu suất điều khiển trình duyệt vốn đang là điểm nghẽn.
Nội dung dịch chi tiết
Browser Use CLI 3.0 đã chính thức ra mắt với kích thước nhỏ hơn 6 lần so với các phiên bản trước, đồng thời giúp giảm thiểu đáng kể mức tiêu thụ token.
Điểm nâng cấp cốt lõi của phiên bản này là khả năng điều khiển trình duyệt trực tiếp thông qua Chrome DevTools Protocol (CDP). Thay vì phải đóng gói các công cụ như click() hay nạp toàn bộ cây DOM vào ngữ cảnh, hệ thống giờ đây hoạt động tinh gọn và hiệu quả hơn.
Người dùng có thể lưu trữ các quy trình đăng nhập hoặc bộ chọn (selector) đã được xác định thành các 'domain-skills' để tái sử dụng cho các tác vụ sau này. Ngoài ra, khi gặp các hàm còn thiếu, hệ thống có khả năng tự động viết và thực thi mã ngay lập tức.
Công cụ này hỗ trợ kết nối với trình duyệt Chrome cục bộ, trình duyệt đám mây hoặc bất kỳ điểm cuối CDP nào. Với tính chất không phụ thuộc vào mô hình (model-agnostic), Browser Use CLI 3.0 có thể được tích hợp như một kỹ năng vào các khung tác nhân (agent framework) như Claude Code hoặc Codex.
Ý chính từ bài gốc
- Dung lượng giảm 6 lần và tối ưu hóa mức tiêu thụ token.
- Điều khiển trực tiếp qua giao thức CDP, không cần nạp toàn bộ cây DOM.
- Hỗ trợ lưu trữ và tái sử dụng quy trình (domain-skills).
- Tự động viết và thực thi mã khi phát hiện hàm còn thiếu.
- Hỗ trợ đa dạng môi trường: Chrome cục bộ, đám mây hoặc CDP endpoint.
- Tính linh hoạt cao, có thể tích hợp vào các agent framework như Claude Code.