Extended Thinking là gì?
Extended Thinking cho phép Claude "suy nghĩ lâu hơn" trước khi trả lời. Thay vì respond ngay, model sẽ generate một chuỗi reasoning steps ẩn, sau đó mới đưa ra câu trả lời cuối cùng. Điều này tăng độ chính xác đáng kể cho các tasks phức tạp.
Khi nào nên bật Extended Thinking?
- Debug production issues: Model phân tích stack trace + code context sâu hơn
- System design: Đánh giá trade-offs kỹ lưỡng
- Math/Logic: Giảm hallucination cho bài toán phức tạp
- Refactoring: Xem xét tất cả dependencies trước khi suggest changes
Cấu hình Extended Thinking trên OpenClaw
{
"providers": {
"izzi": {
"type": "openai-compatible",
"baseURL": "https://api.izziapi.com/v1",
"apiKey": "izzi-YOUR_KEY_HERE"
}
},
"agents": {
"thinker": {
"model": {
"primary": "izzi/claude-sonnet-4-20250514"
},
"parameters": {
"thinking": {
"type": "enabled",
"budget_tokens": 10000
}
}
}
}
}Sử dụng qua API trực tiếp (Python)
import anthropic
client = anthropic.Anthropic(
api_key="izzi-YOUR_KEY_HERE",
base_url="https://api.izziapi.com/anthropic"
)
response = client.messages.create(
model="claude-sonnet-4-20250514",
max_tokens=8000,
thinking={
"type": "enabled",
"budget_tokens": 10000
},
messages=[{
"role": "user",
"content": "Debug this Node.js memory leak: process RSS grows 50MB/hour under load..."
}]
)
# Access thinking steps
for block in response.content:
if block.type == "thinking":
print("Thinking:", block.thinking)
elif block.type == "text":
print("Answer:", block.text)Chi phí Extended Thinking
Thinking tokens được tính theo giá output token. Với budget 10,000 thinking tokens:
| Provider | Chi phí thinking/request |
|---|---|
| Anthropic trực tiếp | $0.15 |
| Izzi API | $0.105 |
Tiết kiệm 30% trên mỗi request có Extended Thinking. Với 100 requests/ngày: $4.5/ngày thay vì $15/ngày.
Tips sử dụng
- Budget tokens: 5,000 là đủ cho hầu hết tasks. Chỉ tăng lên 10,000-20,000 cho system design
- Không dùng cho mọi request: Simple Q&A không cần thinking — tốn tokens vô ích
- Kết hợp với Sonnet 4: Sonnet 4 với thinking thường cho kết quả tốt hơn Opus 4 không thinking
