Cách Dùng Hiệu Quả Claude Opus 4.7 Với Claude Code
Claude Opus 4.7 được Anthropic giới thiệu là model mạnh nhất đang được phát hành rộng rãi cho coding, workflow doanh nghiệp và các tác vụ agentic kéo dài. Điểm khác biệt lớn so với Opus 4.6 không chỉ nằm ở chất lượng code, mà còn ở cách model xử lý sự mơ hồ tốt hơn, giữ mạch ngữ cảnh ổn định hơn và tự đưa ra quyết định hợp lý hơn trong các task dài.
Nhưng đổi model không có nghĩa là bạn cứ giữ nguyên cách làm cũ, Opus 4.7 có tokenizer cập nhật và có xu hướng suy nghĩ nhiều hơn ở các effort level cao, nên token usage cũng có thể tăng lên. Nếu bạn đang dùng Claude Code hằng ngày, điều quan trọng không chỉ là “đổi sang model mới”, mà là biết cách tổ chức session và viết brief sao cho model phát huy đúng thế mạnh.
Điểm chính
- Với Opus 4.7, bạn nên giao việc theo kiểu delegated engineer hơn là pair programming từng dòng.
xhighlà effort level mặc định mới và là lựa chọn hợp lý cho phần lớn task coding nhiều bước.- Adaptive thinking giúp model tự phân bổ độ sâu suy luận theo từng bước, nhưng bạn vẫn nên nói rõ khi muốn phản hồi nhanh hơn hoặc suy nghĩ kỹ hơn.
Cách tổ chức session coding tương tác
Opus 4.7 hành xử khác nhau giữa các lượt chạy agent một phát và các session tương tác nhiều turn. Trong môi trường tương tác, model có xu hướng suy nghĩ nhiều hơn sau mỗi lượt người dùng, nhờ đó giữ coherence tốt hơn, bám chỉ dẫn tốt hơn và cho chất lượng code ổn định hơn trong các phiên dài. Đổi lại, chi phí token cũng tăng.
Vì vậy, cách dùng hợp lý là xem Claude như một kỹ sư được bạn giao đầu việc tương đối đầy đủ, thay vì một người ngồi cạnh để bạn ra từng lệnh nhỏ. Turn đầu tiên càng rõ về ý định, ràng buộc, acceptance criteria và vị trí file liên quan, model càng ít phải đoán. Khi đó bạn cũng giảm được số vòng hỏi đáp không cần thiết, vốn chính là thứ làm reasoning overhead tăng lên.
Nếu task đủ an toàn để chạy với ít lần check-in hơn, bạn nên cân nhắc Auto mode. Ý tưởng ở đây khá đơn giản: đừng bắt model dừng lại sau mỗi bước nhỏ nếu bạn đã biết rõ mục tiêu và đã cung cấp đủ bối cảnh ngay từ đầu. Với các task dài như debug mơ hồ, sửa nhiều file hay rà một vùng codebase lớn, cách giao việc gọn nhưng đầy đủ thường hiệu quả hơn đáng kể.
Nên chọn effort level nào cho Opus 4.7?
Claude Code hiện dùng xhigh làm effort level mặc định mới. Đây là mức nằm giữa high và max, được thiết kế để giữ được độ thông minh và khả năng tự vận hành mạnh, nhưng tránh bớt kiểu “overthinking” dễ làm tăng token quá nhiều trong các run dài.
Cách chọn effort có thể hiểu như sau:
lowvàmedium: phù hợp khi bạn nhạy về chi phí, độ trễ hoặc task rất gọn phạm vi.high: điểm cân bằng khá tốt nếu bạn vẫn muốn chất lượng mạnh nhưng cần kiểm soát cost.xhigh: lựa chọn nên dùng mặc định cho đa số tác vụ agentic như thiết kế API, migration legacy hoặc review codebase lớn.max: hợp cho bài toán đặc biệt khó, bài eval hoặc khi bạn cần vắt tối đa chất lượng và chấp nhận chi phí cao hơn.
Điểm hay là Anthropic không khuyên bê nguyên thói quen từ Opus 4.6 sang 4.7. Thay vào đó, bạn nên thử lại mức effort theo từng loại việc. Nếu trước đây bạn hay đẩy lên mức rất cao chỉ để bù cho độ mơ hồ, Opus 4.7 có thể đã xử lý tốt hơn ngay ở xhigh. Đây là thay đổi nhỏ về setting, nhưng có thể ảnh hưởng rõ đến cost lẫn tốc độ phản hồi.
Adaptive thinking hoạt động ra sao?
Opus 4.7 không còn hỗ trợ kiểu Extended Thinking với thinking budget cố định. Thay vào đó, model dùng adaptive thinking, tức là ở mỗi bước nó có thể tự quyết định có cần suy nghĩ sâu hơn hay không. Với các thao tác đơn giản, nó có thể đi nhanh. Với các chỗ cần phân tích kỹ hơn, nó mới tăng độ sâu reasoning.
Đây là một thay đổi khá thực dụng. Trong nhiều workflow coding, không phải bước nào cũng đáng tốn cùng một lượng suy luận. Một lệnh tìm file, một chỉnh sửa nhỏ hay một tra cứu ngắn không cần bị xử lý như một quyết định kiến trúc. Bài gốc cho biết bản phát hành này đã cải thiện adaptive thinking để giảm bớt xu hướng overthink so với trước.
Nếu bạn vẫn muốn điều khiển rõ hơn, cách làm không phức tạp: hãy nói thẳng trong prompt. Khi muốn model suy nghĩ kỹ, bạn có thể yêu cầu nó đi từng bước cẩn thận. Khi muốn phản hồi nhanh và chấp nhận một chút đánh đổi về độ chính xác ở các bước khó, bạn cũng nên nói rõ điều đó. Nói cách khác, adaptive thinking là mặc định tốt hơn, nhưng không thay thế việc viết brief có chủ đích.
Những thay đổi hành vi bạn nên biết
Thứ nhất, độ dài phản hồi giờ được cân chỉnh theo độ phức tạp của task. Những việc đơn giản như lookup ngắn thường sẽ cho câu trả lời ngắn hơn. Những bài phân tích mở hoặc task dài sẽ cho output dài hơn. Nếu bạn cần một format cụ thể, hãy nói rõ ngay từ đầu. Anthropic cũng lưu ý rằng ví dụ tích cực thường hiệu quả hơn chỉ dẫn kiểu “đừng làm thế này”.
Thứ hai, model có xu hướng dùng tool ít hơn và tự reasoning nhiều hơn. Trong khá nhiều trường hợp, đây là điểm cộng vì chất lượng suy luận tốt hơn và workflow bớt vụn. Nhưng nếu bạn có quy trình cần gọi tool rõ ràng, ví dụ phải đọc đúng các file nhất định hoặc phải kiểm tra bằng command trước khi kết luận, bạn nên ghi yêu cầu đó thành chỉ dẫn trực tiếp.
Thứ ba, Opus 4.7 mặc định spawn ít subagent hơn trước. Đây không phải là điểm yếu. Nó chỉ có nghĩa là model sẽ thận trọng hơn với việc fan-out công việc. Nếu task thật sự cần chia nhánh, chẳng hạn đọc nhiều file độc lập hoặc khám phá nhiều hướng song song, bạn nên nói rõ rằng bạn muốn nó tách thành nhiều subagent. Còn với các việc làm được trong một luồng chính, để model xử lý trực tiếp thường gọn hơn.
Bạn nên thử gì tiếp theo?
Opus 4.7 đặc biệt đáng thử ở các task kéo dài như sửa đổi nhiều file, debug chưa rõ nguyên nhân, review code trên cả một service hoặc các workflow agentic nhiều bước. Đây là những bài toán mà chất lượng giữ ngữ cảnh và khả năng tự đưa quyết định của model ảnh hưởng trực tiếp đến kết quả.
Nếu bạn đang muốn cảm nhận khác biệt thực tế, cách thử tốt nhất khá đơn giản:
- Giữ effort ở
xhigh. - Viết turn đầu tiên đầy đủ hơn bình thường.
- Hạn chế chia nhỏ task thành quá nhiều lượt nhắc.
- Chỉ yêu cầu thêm tool hoặc subagent khi workflow thật sự cần.
Cách tiếp cận này giúp bạn đánh giá đúng sức mạnh của Opus 4.7, thay vì vô tình bó nó vào một cách dùng cũ vốn hợp hơn với thế hệ model trước. Nói ngắn gọn, model mới mạnh hơn không chỉ vì trả lời hay hơn, mà vì nó phối hợp tốt hơn khi bạn giao đúng loại nhiệm vụ.
Câu hỏi thường gặp
xhigh có phải luôn là lựa chọn tốt nhất không?
Không hẳn. xhigh là mặc định rất hợp lý cho phần lớn task coding nhiều bước, nhưng nếu bạn đang làm việc nhỏ, cần tiết kiệm chi phí hoặc muốn phản hồi nhanh hơn, low, medium hoặc high có thể phù hợp hơn.
Vì sao Opus 4.7 có thể tốn token hơn Opus 4.6?
Hai nguyên nhân chính là tokenizer đã thay đổi và model có xu hướng suy nghĩ nhiều hơn ở các effort level cao. Vì vậy, khi nâng cấp, bạn nên theo dõi lại prompt và harness thay vì giả định cost sẽ giữ nguyên.
Khi nào nên yêu cầu dùng subagent rõ ràng?
Bạn nên làm vậy khi task có thể tách thành nhiều nhánh độc lập, ví dụ đọc nhiều file riêng rẽ hoặc điều tra nhiều hướng khác nhau song song. Nếu mọi thứ vẫn xoay quanh một luồng sửa đổi chính, session trực tiếp thường gọn hơn.
Kết luận
Nếu cần tóm gọn trong một câu, đây là tinh thần của bài viết: hãy dùng Claude Opus 4.7 như một kỹ sư được giao việc trọn gói, không phải như một autocomplete biết nói. Khi brief đầu tiên đủ rõ, effort được chọn hợp lý và số lượt qua lại được giữ ở mức cần thiết, Claude Code sẽ cho ra kết quả tốt hơn cả về chất lượng lẫn nhịp làm việc.
Opus 4.7 không bắt bạn đổi toàn bộ workflow, nhưng nó thưởng rất rõ cho những ai biết giao việc theo mục tiêu, theo ràng buộc và theo bối cảnh. Nếu bạn đang quen điều khiển model từng bước nhỏ, đây là lúc tốt để thử một cách làm chủ động hơn.
Bình luận