Devin導入で“自律開発”に挑戦した半年のリアルと成果
株式会社Fusic / Daiki Urata
メンバー / フルスタックエンジニア
| 利用プラン | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
|---|---|---|---|
Team | 11名〜50名 | 2025年4月 | B to B |
| 利用プラン | Team |
|---|---|
| ツールの利用規模 | 11名〜50名 |
| ツールの利用開始時期 | 2025年4月 |
| 事業形態 | B to B |
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
既存のGitHub CopilotなどのAIコーディングツールは活用していたものの、役割はあくまで「人間がコードを書く際のアシスタント」に留まっていました。人間が常に手を動かし続ける必要があり、タスクを丸投げして自律的に完遂してもらうことはできませんでした。
どのような状態を目指していたか
人間が働いていない時間帯でもAIが自律的にシステム構築やタスクを完遂してくれる世界。 朝出社したらPRが出来上がっている、そんな働き方を実現したかったです。
導入の成果
改善したかった課題はどれくらい解決されたか
導入後、毎月Devinのセッション数は伸びており、2025年10月時点ではセッション数(Devinへのタスク依頼数)が248に到達。PR作成からマージに至るセッションは一部に限られるものの、実装だけでなく調査、見積もりの壁打ちなど幅広い用途で活用されています。
ただし、目的である「人間が働いていない時間帯でもAIが自律的にシステム構築やタスクを完遂してくれる世界。」はまだまだ実現できていないのが現状です。
どのような成果が得られたか
複数案件で実運用が始まり、「このタスクはDevinに任せる方が良い」という判断が生まれ、業務の進め方自体が変化している案件も出てきました。
導入時の苦労・悩み
クラウド実行への心理的ハードル
Devinはクラウド上で自律的に動作するため、Claude Codeのようにローカルで動作を逐次確認できる安心感がない点が導入初期の大きな障壁となりました。ローカル環境での作業に慣れたエンジニアにとって、クラウド上でAIに任せることへの抵抗感が一定数ありました。
導入に向けた社内への説明
上長・チームへの説明
会社方針としてAIへ投資しているフェーズだったため、費用対効果の厳密な試算は一旦置き、トライアル導入から開始しました。まず有志で試用を進め、Slack の #try-devin チャンネルで知見を共有しました。 勉強会も開催し、徐々に利用希望者が増えていきました。
活用方法
よく使う機能
Devin Session
ブラウザ/Slack 上で Devin とインタラクティブに対話しながら開発を進められる機能。複雑なタスクでも段階的に指示を出しながら進められるため、追加機能の実装や調査タスクで活用しています。
Ask Devin
Devinはコード全体を解析・インデックス化しており、コードベースを理解した上で質問に回答可能。新機能の実装相談、忘れている仕様の確認、見積もり工数の算出などに利用しています。
Playbooks
頻繁に行う定型作業をプロンプトとして保存・再利用できる機能。定期的に発生するメンテナンス作業を Devinに依頼しています。
ツールの良い点
自律的なタスク完遂
- 最大の特徴は「タスクを丸投げできる」こと
- 指示後、人間の離席中でもDevinが自律的に調査・実装・テストを進めます
- 途中でエラーが発生しても自己修正しながら前進します
Slackでタスクを依頼できる
- Slack から「このバグ直して」と依頼すると Devin が動き出します
- 人間は他作業に集中でき、質問や承認要求にはスレッドで回答し、完了通知を待つだけです
PRにコメントへの自動対応
- Devin が作成した PR にレビューコメントを付けると、自動で修正します
- 通常の人間同士のやり取りに近い感覚で使えます
ナレッジ蓄積の仕組み
- Knowledge Suggestions により、やり取りの中で Devin 側からナレッジ追加を提案します
- 任せるほどナレッジが溜まり、Devin が育ち、期待する精度の結果が得られるようになります
ツールの課題点
クレジット消費の無駄
期待した結果が出ないままクレジットを消費するケースがあります。特に曖昧な指示は ACU(クレジット)の不必要な消費につながりやすいです。Lint を通すだけでも複数回の実行が必要になることがあり、余計なコストが発生します。ただし、指示の精緻化やナレッジ蓄積により改善は見込めます。
並列タスク対応の限界
Devinは並列でタスク依頼が可能ですが、タスクサイズ次第では大体15分以内で完了するため、依頼を多くしすぎるとコードレビューや動作確認の負荷が増えます。 Slack スレッドでの質疑・方針確認も多く発生し、管理側の精神的コストも一定数生じます。 一方で、テストで上がる細かなバグ修正はDevinが得意な領域のため、GitHub IssuesからDevinに自動アサインする仕組みにより実装側の負荷軽減効果が出ています。
ツールを検討されている方へ
まずは試用をおすすめしたいです。Devinの開発体験や精度は、実際に使ってみないと実感しづらいです。 クラウド型のAIコーディングエージェントの導入を検討しているなら、ぜひ一度Devinを試してみてほしいです。
今後の展望
クラウド上で自律的に動作するAIエージェントの領域は急速に進化しています。Claude Code、OpenAI Codex、GitHub Copilotなどもクラウドで動くエージェント機能をリリースし始めており、競争はさらに激化すると予想されます。 今後も各ツールの進化をウォッチし、プロジェクトやタスクの特性に応じて最適なツールを選択できる体制を整えていきたいです。
株式会社Fusic / Daiki Urata
メンバー / フルスタックエンジニア
よく見られているレビュー
株式会社Fusic / Daiki Urata
メンバー / フルスタックエンジニア
レビューしているツール
目次
- 導入の背景・解決したかった問題
- 活用方法


