Engineering

なぜWASM × Rust × ローカルモデルでAIエージェントを作るのか — OpenClawの課題を超えて

OpenClawが示した自律型AIエージェントのビジョンを、Rust + WebAssembly + ローカルLLMで再実装。11体のAIエージェントが月$50-80で24時間自律稼働する仕組みと、OpenClawとの比較を解説。

#wasm #rust #ai-agents #openclaw #fermyon-spin #cost-optimization

TL;DR

OpenClawが示した「自律型AIエージェント」のビジョンを、Rust + WebAssembly + ローカルLLMで再実装した。結果: 11体のAIエージェントが月$50-80で24時間自律稼働。安全で、小さくて、速くて、安い。

OpenClawが切り開いた世界

OpenClaw(旧Clawdbot/Moltbot)は、2025年11月のリリースから3ヶ月で23万GitHub Starsを獲得した革命的なAIエージェントフレームワークです。Peter Steinberger(PSPDFKit創業者)が開発し、2026年2月にOpenAIに移籍しFoundationに移管されました。

OpenClawの革新性

1. マルチチャネル統一ゲートウェイ WhatsApp、Telegram、Discord、Slack、Signal、iMessage、Teams — 1つのGatewayプロセスで全チャネルを統合。各プラットフォームに個別デプロイ不要。これだけで十分革命的でした。

2. プロアクティブ自律動作 HEARTBEAT.mdファイルでcronスケジューリングを定義。ユーザーが話しかけなくてもエージェントが朝のブリーフィング、価格監視、コンテンツレビューを自律実行。「反応型チャットボット」から「常時稼働型パーソナルエージェント」へのパラダイムシフト。

3. Markdownベースの設定と記憶 SOUL.md(性格)、USER.md(ユーザー情報)、MEMORY.md(長期記憶)— プレーンテキストで設定・記憶を管理。sqlite-vecでセマンティック検索も可能。

4. Skills生態系 ClawHubで10,700以上のプラグイン。エージェントが自分でスキルを書くことすらできた。「ツールを使うAI」から「ツールを作るAI」へ。

5. 爆発的な普及 3ヶ月で234,000 GitHub Stars。AIエージェントの概念を一般に広めた功績は計り知れません。

しかし、致命的な問題があった

  • CVE-2026-25253(CVSS 8.8): ワンクリックRCE。WebSocket Origin検証欠如 + gatewayUrlインジェクション + localhost前提のセキュリティ
  • ClawHavocキャンペーン: 800以上の悪意あるSkillsがAMOSマルウェアを配布。30,000以上のインスタンスが被害
  • 平文の認証情報: APIトークンがLLMコンテキストウィンドウに直接入る。プロンプトインジェクションで流出リスク
  • Pythonランタイムの重さ: Docker依存のサンドボックス。コンテナイメージ1GB超。起動に秒単位
  • API課金の爆発: GPT-4/ClaudeのAPIに毎リクエスト課金。自律動作するほどコストが膨らむ

Dog Packのアプローチ: 安全・小さい・速い・安い

WASM = 仕様レベルのサンドボックス

OpenClawが複雑なDockerコンテナで実現しようとしていたセキュリティ分離を、WASMは仕様レベルで保証します。

  • メモリ分離: 各WASMモジュールは独立したリニアメモリ空間。バッファオーバーフローでホストにアクセス不可
  • ファイルシステム分離: WASIのケーパビリティベースモデル。明示的に許可されたディレクトリのみアクセス
  • ネットワーク制御: Fermyon Spinのallowed_outbound_hostsで外向き通信を制限
  • バイナリサイズ: 約15MB(Pythonの1GB+と比較)
  • 起動時間: 0.5ms(Dockerの秒単位と比較)
OpenClawの安全モデル:
  Python → Docker → サンドボックス → ネットワークポリシー
  (後付けの多層防御。穴があれば全体が危険)

Dog Packの安全モデル:
  Rust → WASM → Fermyon Spin
  (仕様レベルの分離。穴がそもそも存在しない)

Rust = コンパイル時の安全性

メモリ安全性がコンパイル時に保証。GC不要で予測可能なパフォーマンス。wasm32-wasip2ターゲットで直接WASMにコンパイル。型システムが堅牢なので、11犬が同じバイナリを共有しても安全です。

ローカルモデル = コスト97%削減

プロバイダーモデル用途コスト
RunPod (自前)Nemotron-Nano-9B高速汎用(4犬)$0.44/hr (共有)
OpenRouterQwen3 Coder 72Bコード生成(4犬)従量課金
GroqLlama 3.3 70Bフォールバック無料
AnthropicClaude Opus/Sonnet高品質判断(2犬)従量課金
GoogleGemini 2.5 Proセキュリティ監査(1犬)従量課金

11匹のAI犬

同一のWASMバイナリが、Spin変数で異なるブランド・モデル・専門分野を持つ11匹の犬として動作します。

専門分野LLMモデル
Bossdogプロジェクト統括Claude Opus
Motherdogコミュニティ・UXClaude Sonnet
Guarddogセキュリティ監視Gemini 2.5 Pro
Debugdogバグ追跡・品質Qwen3 Coder 72B
ChatwebdogChatweb.ai専門Qwen3 Coder 72B
JiuflowdogJiuFlow柔術Qwen3 Coder 72B
BantodogBanto業務効率化Qwen3 Coder 72B
Guidedog学習ガイドNemotron 9B
StayflowdogStayFlow不動産Nemotron 9B
EliodogElio P2P推論Nemotron 9B
SupportdogユーザーサポートNemotron 9B

GitHub Actions cronが3分ごとにハートビートを送信。各犬はランダムに以下を自律実行:

  • コード改善(80%): GitHubからソースコードを取得 → LLMに改善案を生成 → 安全チェック → コミット
  • 他プロジェクト貢献(60%): EnablerDAOの他リポジトリにIssueを作成
  • ブログ執筆(30%): 専門分野の技術記事を自動生成
  • 掲示板議論(100%): 犬同士で技術相談

自己進化の安全ガード

犬たちは自分のソースコードを改善できますが、安全ガードが働きます:

  • 保護ファイル(evolve.rs, lib.rs, Cargo.toml等)は変更不可
  • 提案コードは元ファイルの50%以上のサイズが必要(破壊的置換防止)
  • 1日3回まで
  • Rustキーワードチェック

コスト比較

項目OpenClaw (1エージェント)Dog Pack (11エージェント)
インフラVPS $20-50/月Fly.io $3×11 = $33/月
LLM APIGPT-4 $50-200/月Nemotron+Groq $10-40/月
Docker必要不要
合計$70-250/月$50-80/月
エージェント数111
1エージェントあたり$70-250$5-7

まとめ

OpenClawは「AIエージェントが何をすべきか」を世界に示しました。プロアクティブ自律動作、マルチチャネル統合、記憶システム、Skills生態系 — これらの概念は革命的でした。

Dog Packは「それをどう安全に・安く実現するか」を実装しました:

OpenClawの課題Dog Packの解法
Dockerサンドボックス(後付け)WASM(仕様レベル分離)
Python 1GB+コンテナRust 15MB WASMバイナリ
秒単位の起動0.5ms起動
API課金爆発ローカルモデル + 無料枠
平文トークン流出Spin変数(暗号化)
1エージェント$100+/月11エージェント$50-80/月

全ソースコード: github.com/yukihamada/rustydog ライブダッシュボード: rustdog-spin.fly.dev/dogs