Claude Code導入とAI駆動開発の始動
株式会社Spectee / monokaai
メンバー / バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
| 利用プラン | 利用機能 | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
|---|---|---|---|---|
Team Premium | カスタムスキルによるルーティン作業の計画・実行、仕様策定と組み合わせたコーディングの自動化、GitHub Projects/Notion上のチケット管理の簡略化など | 11名〜50名 | 2026年2月 | B to B |
| 利用プラン | Team Premium |
|---|---|
| 利用機能 | カスタムスキルによるルーティン作業の計画・実行、仕様策定と組み合わせたコーディングの自動化、GitHub Projects/Notion上のチケット管理の簡略化など |
| ツールの利用規模 | 11名〜50名 |
| ツールの利用開始時期 | 2026年2月 |
| 事業形態 | B to B |
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
GitHub Copilotを利用していましたがコーディング補助にとどまっており、更なる効率化を図りたい思いがありました。
Devinも導入していて、こちらは自律的に動いてくれる時間が長く作業の移譲がしやすい一方で「最初に与えるプロンプトの質が出力の質に直結するにも関わらず、結果確認までのタイムラグが大きい」「調査・実装以外のフローまで自動化できるわけではない」という点では課題感がありました。
どのような状態を目指していたか
仕様策定からテスト・レビューまで開発プロセス全体をAI駆動に転換し、業務効率を大幅に向上させることを目指しました。具体的には以下の状態です。
- MUST: エンジニアがAIの提案を検証・判断する役割にシフトし、開発サイクルを加速させる
- WANT: チーム間でのナレッジ共有を促進し、属人化を防ぐ
- WANT: 仕様書ベースでAIが一貫した実装・テスト・レビューを行えるワークフローの確立
比較検討したサービス
- GitHub Copilot
- Devin
比較した軸
- 開発プロセス全体への適用範囲: コード補完だけでなく、仕様策定・テスト生成・レビューまでカバーできるか
- カスタマイズ性: チームごとの開発ルールやコーディング規約を柔軟に反映できるか
- セキュリティ: コードの外部送信やアクセス権限の制御が適切にできるか
選定理由
やはり、開発プロセス全体に介入できるエージェント型ツールであった点です。導入が進んだチームではチケット管理といったコーディング以外の領域まで自動化し、開発速度の大幅な向上ができ始めています。
加えて、プロジェクト固有のコンテキスト管理や開発フローのカスタマイズ性の高さも選定理由です。チームごとに異なる開発ルールを設定ファイルとしてGit管理でき、テンプレートとして他チームに展開もできる点が組織的な導入に適していました。
導入の成果
改善したかった課題はどれくらい解決されたか
パイロットチーム(4名+マネージャー)で4週間のメトリクスを計測し、以下の改善を確認しました。
| 指標 | 導入前 | 導入後(3週目) | 変化 |
|---|---|---|---|
| Issueクローズ数 | 8件/週 | 27件/週 | 3.4倍 |
| 平均クローズ日数 | 14.9日 | 4.9日 | 67%短縮 |
| PRマージ数 | 7件/週 | 18件/週 | 2.6倍 |
| 平均PRサイズ | 2,136行 | 987行 | 54%縮小 |
ただし、チーム立ち上げ直後でコンテキスト整備が容易であり、効果が即座に出やすい条件が整っていた状況でした。仕様駆動開発の導入と並行して自動テスト・CI/CDを整備したため、すべてがツール単体の効果とも言い切れません。
どのような成果が得られたか
定量面に加え、開発プロセスの質的な変化が大きかったです。
- テストファーストの定着: 仕様書にテスト要件を含めるフローをClaudeのスキルで組み込んだことで、「まずテストを書く」が自然に実行されるようになりました。テストが通っている安心感があるからこそ、速いサイクルでのマージ・デプロイが可能になっています
- PRサイズの縮小: 平均2,136行→987行と54%縮小。小さく頻繁にデリバリーするスタイルへの移行が進みました
- レビュー認知負荷の適正化: AIの1stレビューにより、人間は仕様適合性やアーキテクチャ判断に集中できるようになりました
現在の活用状況
自チームではClaude Code + OpenSpec(仕様駆動開発フレームワーク)を組み合わせた開発フローを確立しています。仕様策定→実装→AIレビュー→人間レビューの一気通貫フローが日常的に回っている状態です。
タスク管理も、あらゆる場面で自動化が進み、短時間で要求・要件を整理することができつつあります。
全社的には、パイロット導入の成果をもとに他チームへの展開を進めている段階です。スクラムマスター達と連携しながら、各チームの状況に合わせた導入支援を行っていく予定です。 また今後の展望として、エンジニアに留まらず社内ドキュメントの集約を進め、問い合わせや要件定義のコミュニケーションコストを大幅に低減したいと考えています。
導入時の苦労・悩み
- 全社一律の導入が難しい: 当初は全社一括導入のロードマップを組んでいましたが、チームごとに技術スタック・開発フロー・課題感・ツール移行へのモチベーションが異なるため、一律のルールでは回りませんでした。結局、自チームでパイロット導入して成功事例を作り、その実績をもとに他チームへ広げる戦略に軌道修正しています。導入後のヒアリングでは、多くのエンジニアがほぼ毎日利用していることを確認できています。
- テンプレート配布のマージ率が低迷: 設定テンプレートファイルをCI/CDで社内の全リポジトリに自動配布しましたが、マージ率は数%にとどまりました。「情報量が多すぎてどこから手をつけていいか分からない」「自チームには関係ない設定も多い」というフィードバックがあり、またプロジェクト状況的にAI駆動開発に即座に転換することが難しかったチームもありました。そのため、テンプレートよりもSlackでのTips配信やハンズオンの実施といった情報提供の方がポジティブなフィードバックを得られました。
- レビュー体制の混乱: AIレビューと人間レビューの役割分担が不明瞭であったことも相まって、新しい開発フローに習熟するまでは一時的にPRマージが停滞しました。AIによる1stレビューを必須化・自動化し、レビュイーの2ndチェック後にPR提出するレビューモデルを整備することで改善しています。
- 仕様書の整備に関する合意: 開発の重心がコーディングから仕様策定・チーム間コラボレーションに移っていくことや、AI・人間双方のシステム理解のため、必要十分な仕様書を整備する必要がある点など、広く社内理解を求めることは今後の課題です。Claude Codeに限らず、AI駆動開発にあたってはドキュメントを適切に整備してAI社員をオンボーディングする必要性を感じています。
導入に向けた社内への説明
上長・チームへの説明
私自身はClaude Codeの導入には関わっておらず、決定後に活用の推進者として手を挙げた形でした。
ただ、前述の通りGitHub Copilotでは社内の開発プロセス全体の効率化には至っていないという認識がありました。Claude Codeを個人的に利用していたこともあり、移行が成功すればプロダクトのデリバリーが高速化するという感触は持っていました。
自チームに対しては、推進プロジェクトに手を挙げたのでパイロットケースになって欲しいと正直に伝えました。リソースに対してタスク量が多く効率化を余儀なくされていたため、歓迎ムードで取り組んでもらうことができました。
活用方法
チーム全員が日常的に利用しています。主な利用シーンはスクラム開発の各フェーズです。
- 仕様策定: ユーザーストーリーの受け入れ条件整理、抜け漏れの指摘をClaude Codeとの壁打ちで行う
- Issue管理: Google MeetのGeminiによる文字起こしから議事録を作成し、Claude CodeのスキルでGitHub ProjectsのIssue作成・管理
- 実装: OpenSpecで生成した変更に対する仕様書をもとにテストファーストで実装。テスト生成→実装→リファクタリングの流れ
- レビュー: AI 1stレビュー(セキュリティ・正確性・パフォーマンス等7カテゴリ)→人間2ndレビュー(仕様適合性・アーキテクチャ)の2層モデルで分担し、認知負荷を低減
- 運用監視: リリース・ロールバック手順書の作成、リリース後の動作確認のためのログ定期監視
よく使う機能
- CLAUDE.md / rules/
- プロジェクト固有のコンテキストやコーディング規約を定義。AIの出力品質に直結する最重要設定
- Skills
- スクラムの各フェーズに対応したカスタムスキルを定義。仕様策定・実装・レビュー・Issue管理を統合
- Hooks
- コミットやプッシュ前の確認必須化、静的解析の自動実行など、開発フローのガードレールとして活用
- Agent Teams
- 複数エージェントによる並列実行。リサーチ・実装・レビューの同時進行および品質向上に利用
- Memory.md, CLAUDE.local.md
- 個人的にClaude Codeに覚えてもらいたい内容や、個人的な設定の管理。個人的に試し、チームで適用する価値があると判断したら共有する流れが作りやすい
- Loop
- Claudeになんらかの作業を定期的に実行させられる(情報収集・運用監視など)。3日間の期限がある点と、トークン消費が激しくなる点には注意
ツールの良い点
- 開発プロセス全体をカバーできる: コード補完にとどまらず、仕様策定・テスト生成・レビューまで一気通貫で活用できる。仕様駆動開発との相性が特に良い
- カスタマイズ性の高さ: CLAUDE.md、Skills、Hooksにより、チーム固有の開発ルールやワークフローを柔軟に組み込める。設定がGit管理できるため、チーム間での共有・展開も容易
- 進化の速さ: worktree対応、Agent Teamsなど、開発者の要望に応える機能が次々とリリースされる。エコシステムの成長速度が速く、自前で作った機能が公式化されるケースもある
ツールの課題点
Claude Code自体の課題をあえて挙げるなら「スキルで利用するモデル(Opus/Sonnet/Haiku)を指定できるようにして、トークン消費量の管理をさらにしやすくして欲しい」と思います。
他のAIエージェントツールでもそうですが、ツール自体よりもそれを安全・円滑に利用できる環境整備の方がより重要と感じています。 それを前提として、導入当初は以下のような課題が出てくるかもしれません。
- 組織的な導入の難しさ: チームごとに開発フローや技術スタックが異なるため、テンプレートを一律配布してもフィットしない
- ガードレールの設計が難しい: LLMにファイル操作やCLI実行を委ねるため、破壊的なコマンドの実行リスクがある。防御層を設けても、すり抜けが発生しうることを前提に運用設計する必要がある(Claude Codeではask/deny設定は強制力が無いので、Hooksの活用が必須)
- 進化の速さが裏目に出ることもある: 自前でworktreeやMCPサーバー連携を実装したが、1ヶ月の間に公式から同等機能がリリースされ移行コストが発生した。急ぎで必要な機能以外は公式の発表を待つ方が賢いと学んだ
- レビュー体制の再設計が必要: AIレビューと人間レビューの役割分担を明確にしないと、かえって混乱する。導入初期に、できる限り理想の運用設計を固めておくことを推奨する
ツールを検討されている方へ
繰り返しになりますが、LLMに渡す要件の明確化をどのように実現するか、導入前または直後など早期に計画する必要があります。
最初から完璧な挙動を求めるのではなく、非常に優秀だが社内の暗黙知は何も理解していない新人エンジニアをオンボーディングするという認識・準備が必要になります。
従来の開発手法とはフローが根本的に変わるため、開発フローの再構築を許容できる組織文化の醸成にも同時に取り組むことになると思います。
弊社もチャレンジしている最中ですが、それらを乗り越えられればプロダクトの価値提供の迅速化に大きく貢献してくれるツールだと感じています。
今後の展望
パイロットチームでの成功事例をもとに、他チームへの展開を加速させていきます。チーム間でのナレッジ共有の仕組み化、特に仕様書の置き場所の統一やセキュリティガイドラインの整備が直近の課題です。
テストカバレッジの計測・可視化も未着手のため、CI組み込みから着手します。ツールも概念も日々進化しているため、「完成」を目指すのではなく変化に適応し続ける姿勢で推進を続けていきます。
株式会社Spectee / monokaai
メンバー / バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名
よく見られているレビュー
株式会社Spectee / monokaai
メンバー / バックエンドエンジニア / 従業員規模: 101名〜300名 / エンジニア組織: 11名〜50名

