Claude Sonnet 5 có gì mới?

Claude Sonnet 5 là thế hệ tiếp theo của dòng mô hình Sonnet của Anthropic. Đây là bản nâng cấp trực tiếp cho Claude Sonnet 4.6 với 3 thay đổi về hành vi: Adaptive Thinking được bật mặc định, Manual Extended Thinking giờ đây trả về lỗi 400 (đã bị loại bỏ trên Claude Sonnet 4.6), và việc thiết lập các tham số lấy mẫu (temperature, top_p, top_k) thành các giá trị không mặc định sẽ trả về lỗi 400. Trang này tóm tắt tất cả những điểm mới khi ra mắt, bao gồm cả tokenizer mới.

Mô hình Claude Sonnet 5 mới

Mô hình	ID mô hình API	Mô tả
Claude Sonnet 5	`claude-sonnet-5`	Sự kết hợp tốt nhất giữa tốc độ và trí thông minh

Claude Sonnet 5 hỗ trợ cửa sổ ngữ cảnh 1 triệu token theo mặc định (1 triệu token là cả giá trị mặc định và tối đa; không có biến thể ngữ cảnh nhỏ hơn), 128 nghìn token đầu ra tối đa, Adaptive Thinking, cùng bộ công cụ và tính năng nền tảng như Claude Sonnet 4.6, ngoại trừ Priority Tier, không có trên Claude Sonnet 5.

Thay đổi hành vi trong Claude Sonnet 5

Adaptive Thinking được bật theo mặc định

Trên Claude Sonnet 4.6, các yêu cầu không có thinking field sẽ chạy mà không có tư duy. Trên Claude Sonnet 5, các yêu cầu tương tự sẽ chạy với Adaptive Thinking. Để tắt tư duy, hãy truyền tham số thinking: {type: "disabled"}. Vì max_tokens là giới hạn cứng đối với tổng đầu ra (tư duy cộng với văn bản phản hồi), hãy xem xét lại tham số này đối với các khối lượng công việc đã chạy mà không có tư duy trên Claude Sonnet 4.6.

Tham số lấy mẫu không được chấp nhận

Đặt temperature, top_p hoặc top_k thành giá trị không mặc định sẽ trả về lỗi 400. Hãy xóa các tham số này khi di chuyển; giá trị mặc định (hoặc bỏ qua tham số) được chấp nhận. Sử dụng hướng dẫn prompt hệ thống để điều khiển hành vi của mô hình. Điều này là mới đối với các mô hình thuộc lớp Sonnet; ràng buộc tương tự đã được giới thiệu trước đó trên Claude Opus 4.7.

Đã loại bỏ Manual Extended Thinking

Manual Extended Thinking (thinking: {type: "enabled", budget_tokens: N}) đã bị loại bỏ trên Claude Sonnet 4.6. Trên Claude Sonnet 5, nó bị loại bỏ và trả về lỗi 400, giống như trên Claude Opus 4.8 và Claude Opus 4.7. Thay vào đó, hãy sử dụng Adaptive Thinking với tham số effort.

# Không được hỗ trợ trên Claude Sonnet 5 (trả về lỗi 400)
thinking = {"type": "enabled", "budget_tokens": 32000}

# Sử dụng thay thế
thinking = {"type": "adaptive"}

Tokenizer từ mới

Claude Sonnet 5 sử dụng tokenizer mới. Cùng một văn bản đầu vào tạo ra số lượng từ nhiều hơn khoảng 30% so với Claude Sonnet 4.6. Đây không phải là thay đổi API: Các yêu cầu, phản hồi và sự kiện stream vẫn giữ nguyên cấu trúc và không cần thay đổi code.

Thay đổi này ảnh hưởng đến bất cứ điều gì bạn đo lường hoặc tính toán theo token:

Số lượng token: Các trường sử dụng và kết quả đếm từ cho cùng một văn bản cao hơn so với Claude Sonnet 4.6. Không sử dụng lại số lượng đã đo lường so với các mô hình trước đó; hãy đếm lại so với Claude Sonnet 5.
Dung lượng cửa sổ ngữ cảnh theo văn bản: Cửa sổ ngữ cảnh có 1 triệu từ, nhưng mỗi từ trung bình bao phủ ít văn bản hơn, vì vậy cùng một cửa sổ chứa ít văn bản hơn so với Claude Sonnet 4.6.
Ngân sách max_tokens: Giới hạn đầu ra được điều chỉnh cho Claude Sonnet 4.6 có thể cắt bớt đầu ra tương đương trên Claude Sonnet 5. Hãy xem xét lại các giới hạn có kích thước gần với độ dài đầu ra dự kiến của bạn.
Chi phí mỗi yêu cầu: Giá mỗi token không thay đổi, nhưng vì cùng một văn bản tạo ra nhiều token hơn, chi phí cho một yêu cầu tương đương có thể khác với Claude Sonnet 4.6.

Những ràng buộc API được kế thừa từ Claude Sonnet 4.6

Ràng buộc này không thay đổi so với Claude Sonnet 4.6. Ngoài 3 thay đổi về hành vi, code đã chạy trên Claude Sonnet 4.6 không cần thay đổi nào khác.

Không hỗ trợ điền trước thông báo trợ lý

Việc điền trước thông báo trợ lý trả về lỗi 400, không thay đổi so với Claude Sonnet 4.6. Thay vào đó, hãy sử dụng đầu ra có cấu trúc, hướng dẫn prompt hệ thống hoặc output_config.format.

Cải tiến khả năng

Claude Sonnet 5 là bản nâng cấp khả năng so với Claude Sonnet 4.6 với cùng mức giá. Đây cũng là một lựa chọn cho các khối lượng công việc cần nhiều khả năng hơn so với Claude Sonnet 4.6 cung cấp mà không cần chuyển sang mô hình lớp Opus.

Những cải tiến lớn nhất so với Claude Sonnet 4.6 nằm ở các tác vụ lập trình và tác vụ tác agentic.

Các biện pháp bảo vệ an ninh mạng

Claude Sonnet 5 là mô hình cấp Sonnet đầu tiên có các biện pháp bảo vệ an ninh mạng theo thời gian thực. Các yêu cầu liên quan đến những chủ đề an ninh mạng bị cấm hoặc có rủi ro cao có thể bị từ chối. Việc từ chối sẽ trả về phản hồi HTTP 200 thành công với stop_reason: "refusal", chứ không phải lỗi.

Giá cả

Claude Sonnet 5 có giá 3 USD cho mỗi triệu token đầu vào và 15 USD cho mỗi triệu token đầu ra, không thay đổi so với Claude Sonnet 4.6. Vì tokenizer mới tạo ra nhiều hơn khoảng 30% token cho cùng một văn bản, nên chi phí cho một yêu cầu tương đương có thể khác với Claude Sonnet 4.6 mặc dù giá mỗi token không thay đổi.

Giá khuyến mãi giới thiệu là 2 USD/10 USD cho mỗi triệu token đầu vào/đầu ra có hiệu lực đến ngày 31 tháng 8 năm 2026, sau đó giá tiêu chuẩn là 3 USD/15 USD cho mỗi triệu token đầu vào/đầu ra sẽ có hiệu lực.

Tính khả dụng

Khi ra mắt, Claude Sonnet 5 có sẵn trên:

Claude API: Có sẵn cho tất cả khách hàng.
AWS: Có sẵn thông qua Claude trên Amazon Bedrock và Claude Platform trên AWS. Claude Sonnet 5 không khả dụng trên Claude trên Amazon Bedrock (phiên bản cũ) (API InvokeModel và Converse).
Google Cloud: Có sẵn thông qua Claude trên Google Cloud.
Microsoft Foundry (preview): Có sẵn thông qua Claude trên Microsoft Foundry.

Claude Sonnet 5 hỗ trợ không lưu giữ dữ liệu cho các tổ chức có thỏa thuận ZDR.

Hướng dẫn chuyển đổi

Claude Sonnet 5 là bản thay thế trực tiếp cho Claude Sonnet 4.6. Hãy cập nhật ID mô hình của bạn:

model = "claude-sonnet-4-6" # Trước
model = "claude-sonnet-5" # Sau

Sau đó hãy xem xét các điểm sau:

Ngân sách và số lượng token: Tokenizer mới tạo ra nhiều hơn khoảng 30% token cho cùng một văn bản. Tính lại các prompt có đếm token và xem xét lại giới hạn max_tokens có kích thước gần với độ dài đầu ra dự kiến của bạn.
Extended Thinking: Nếu bạn vẫn đặt budget_tokens, hãy chuyển sang Adaptive Thinking. Manual Extended Thinking (thinking: {type: "enabled"}) không được hỗ trợ và trả về lỗi 400.
Tham số lấy mẫu: Các yêu cầu đặt tham số lấy mẫu (temperature, top_p, top_k) thành giá trị không mặc định sẽ trả về lỗi 400; hãy xóa chúng khi chuyển đổi. Định nghĩa công cụ và hình dạng phản hồi không thay đổi, việc điền trước thông báo trợ lý đã không được hỗ trợ trên Claude Sonnet 4.6.