ai.wflab.web.id

Panduan koneksi API Key Claude AI

Drop-in replacement untuk OpenAI API. 6 model premium dari Anthropic. Bayar sekali, pakai sampai quota habis.

Setting koneksi (semua client sama)

Base URLhttps://api.wflab.web.id/v1
API KeyAPI Key yang Anda terima (sk-xxxx-xxxx-xxxx)
Auth headerAuthorization: Bearer <api-key>
FormatOpenAI-compatible (drop-in replacement)
Cek pemakaianhttps://api.wflab.web.id/usage

Pilih model

Weight = pengali credit per token. Lebih besar = lebih boros credit.

Model IDWeightCocok untuk
kr/claude-sonnet-4.6 Termurah Chat ringan, summary, edit teks, default daily use
kr/claude-sonnet-4.6-thinking Reasoning ringan, refactor sederhana
kr/claude-opus-4.6 Coding standar, analisa data, review
kr/claude-opus-4.6-thinking Coding kompleks, debug rumit
kr/claude-opus-4.7 Coding terbaik (non-thinking), production work
kr/claude-opus-4.7-thinking Terpintar Problem solving rumit, deep reasoning, planning
Rumus credit: credit dipotong = (prompt_tokens + completion_tokens) × weight model

Strategi hemat credit

  • Default pakai kr/claude-sonnet-4.6 (1×) untuk semua hal ringan
  • Naik ke kr/claude-opus-4.6 (2×) kalau Sonnet kurang pintar
  • Pakai *-thinking cuma kalau perlu reasoning panjang
  • Hindari kr/claude-opus-4.7-thinking (5×) untuk pertanyaan singkat — boros

Setup per client

🎨 Cursor
  1. Settings (Ctrl/Cmd+,) → Models+ Add Custom Model
  2. Model name: kr/claude-sonnet-4.6
  3. Scroll ke OpenAI API Key → centang Override OpenAI Base URL
  4. Base URL: https://api.wflab.web.id/v1
  5. API Key: paste sk-xxx
  6. Klik Verify → muncul checkmark
  7. Tambah model lain dengan repeat step 2 (cuma ganti model name)
💻 Continue (VS Code / JetBrains)

Edit ~/.continue/config.json:

{
  "models": [
    {
      "title": "Sonnet 4.6 (cheap)",
      "provider": "openai",
      "model": "kr/claude-sonnet-4.6",
      "apiBase": "https://api.wflab.web.id/v1",
      "apiKey": "sk-xxxx-xxxx-xxxx"
    },
    {
      "title": "Opus 4.7 Thinking",
      "provider": "openai",
      "model": "kr/claude-opus-4.7-thinking",
      "apiBase": "https://api.wflab.web.id/v1",
      "apiKey": "sk-xxxx-xxxx-xxxx"
    }
  ]
}
🔧 Cline / Roo / Kilo
  • Provider: OpenAI Compatible
  • Base URL: https://api.wflab.web.id/v1
  • API Key: sk-xxx
  • Model: pilih dari 6 model id di tabel atas
🌐 OpenWebUI
  1. Login admin → SettingsConnections
  2. + Add OpenAI Connection
  3. URL: https://api.wflab.web.id/v1, Key: sk-xxx
  4. Save → refresh halaman → 6 model muncul di dropdown chat
🐍 Python (OpenAI SDK)

Install: pip install openai

from openai import OpenAI

client = OpenAI(
    base_url="https://api.wflab.web.id/v1",
    api_key="sk-xxxx-xxxx-xxxx",
)

resp = client.chat.completions.create(
    model="kr/claude-sonnet-4.6",
    messages=[{"role": "user", "content": "Halo"}],
)
print(resp.choices[0].message.content)
📦 Node.js / TypeScript

Install: npm install openai

import OpenAI from "openai";

const client = new OpenAI({
  baseURL: "https://api.wflab.web.id/v1",
  apiKey: "sk-xxxx-xxxx-xxxx",
});

const resp = await client.chat.completions.create({
  model: "kr/claude-opus-4.7",
  messages: [{ role: "user", content: "Tulis fungsi fibonacci" }],
});
console.log(resp.choices[0].message.content);
🦜 LangChain (Python)
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(
    base_url="https://api.wflab.web.id/v1",
    api_key="sk-xxxx-xxxx-xxxx",
    model="kr/claude-opus-4.7-thinking",
)

print(llm.invoke("Jelaskan QED").content)
⚡ curl (test cepat)
curl https://api.wflab.web.id/v1/chat/completions \
  -H "Authorization: Bearer sk-xxxx-xxxx-xxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kr/claude-sonnet-4.6",
    "messages": [{"role":"user","content":"Halo"}]
  }'

Tambahkan "stream": true untuk streaming SSE.

🤖 Hermes Agent (WA + Telegram)

Hermes adalah agent yang menghubungkan AI ke channel WhatsApp dan Telegram. Untuk pakai API key kami sebagai LLM backend Hermes, isi konfigurasi LLM Provider di Hermes:

Provider typeopenai / OpenAI Compatible
Base URLhttps://api.wflab.web.id/v1
API Keysk-xxxx-xxxx-xxxx (key Anda)
Model (default)kr/claude-sonnet-4.6 (1× hemat credit)
Model (premium)kr/claude-opus-4.7-thinking (5× untuk reasoning)
Streamingaktifkan / stream: true (Hermes biasanya pakai streaming agar reply cepat tampil di chat)
Max tokens4096–8192 (sesuaikan dengan kebutuhan reply)
Timeout≥ 120 detik (model thinking butuh waktu lebih lama)

Contoh config (file YAML / env)

llm:
  provider: openai
  base_url: https://api.wflab.web.id/v1
  api_key: ${HERMES_LLM_API_KEY}     # set di env
  model: kr/claude-sonnet-4.6
  fallback_model: kr/claude-opus-4.6
  stream: true
  max_tokens: 4096
  timeout: 180

Tips integrasi Hermes

  • Pakai sonnet-4.6 sebagai default untuk reply cepat dan hemat credit. Naik ke opus kalau buyer minta reasoning kompleks.
  • Aktifkan streaming supaya Hermes bisa kirim chunk ke WA/Telegram secara progresif. Endpoint kami https://api.wflab.web.id/v1/chat/completions support SSE penuh.
  • Active IP slot: Hermes biasanya jalan dari 1 server VPS dengan IP tetap, jadi tidak akan kena too_many_active_locations. Kalau Hermes dipindah server, IP lama TTL 5 menit lalu auto-rotate.
  • Concurrent limit: kalau Hermes melayani banyak user WA/Telegram bersamaan, pilih plan dengan concurrent yang cukup. Sultan = 4 paralel cukup untuk ~50 user aktif (asumsi 8% concurrent peak).
  • Fallback model: set fallback ke model lain dengan weight lebih kecil. Kalau primary kena 502/504 sementara, Hermes auto-retry ke fallback tanpa user merasakan.
  • Cek pemakaian rutin di https://api.wflab.web.id/usage untuk memastikan credit Hermes tidak habis di tengah bulan.
Kalau Hermes Anda support multi-provider, tambahkan kami sebagai provider tambahan (bukan replace). Beberapa permintaan ringan bisa diarahkan ke provider lain yang lebih murah, dan permintaan complex (Opus 4.7 Thinking) diarahkan ke kami.

Cek pemakaian

Web (paling mudah): buka https://api.wflab.web.id/usage → paste API Key → klik Check.

Yang ditampilkan: plan, status, used / quota credit, request count, total token, breakdown per model, dan 30 request terakhir.

Programmatic (JSON)

curl https://api.wflab.web.id/api/usage \
  -H "Authorization: Bearer sk-xxxx-xxxx-xxxx"

Error message

Response selalu OpenAI-shape JSON dengan field error.code.

HTTPCodeArtiTindakan
401 invalid_api_key API Key salah / typo Cek paste lengkap
401 no_plan Key tidak punya plan Hubungi seller
403 quota_exhausted Credit habis Beli paket baru
403 manual_disabled Di-disable seller Hubungi seller
403 expired Plan expired (kalau di-set) Beli paket baru
429 rate_limit_exceeded Lewat rate per menit Tunggu sesuai Retry-After
429 too_many_concurrent_requests Request paralel terlalu banyak Kurangi paralel sesuai paket
429 too_many_active_locations IP berbeda terlalu banyak (5min TTL) Pakai dari IP yang sudah aktif
502 bad_gateway Upstream sementara down Retry beberapa detik kemudian
504 upstream_timeout Upstream lambat Retry, kalau sering laporkan

Checklist first day

  1. Paste API Key di https://api.wflab.web.id/usage → muncul plan + 0% used
  2. Pilih client (Cursor / Continue / dll)
  3. Set Base URL = https://api.wflab.web.id/v1
  4. Paste API Key
  5. Pilih model kr/claude-sonnet-4.6 untuk test pertama (paling murah)
  6. Kirim 1 prompt → dapat response
  7. Refresh /usage → request muncul + credit berkurang

Kalau gagal, error message self-explanatory. Biasanya cuma typo Base URL (jangan lupa /v1 di akhir) atau API Key tidak komplet.