【AI Engineering Summit Tokyo 2025】AIコーディング時代に「ちゃんと」やること ~toB LLMプロダクト開発舞台裏~
2025年12月26日、ファインディ株式会社が主催するイベント「AI Engineering Summit Tokyo 2025」が開催されました。
本記事では株式会社ELYZAの村山卓朗さんと齋藤暢郎さんによるセッション「AIコーディング時代に「ちゃんと」やること ~toB LLMプロダクト開発舞台裏~」の内容をお届けします。
AIツールの導入によりコーディング速度が上がっても、検証コストが膨らめば全体の生産性は停滞します。そのような中、株式会社ELYZAでは、稼働率99.93%という極めて高い安定性を維持しながら、マージされるプルリクエスト(PR)数を約2倍に向上させることに成功しました。その舞台裏にあるのは、最先端技術の追求だけでなく、ドキュメントドリブン開発や自動化されたセキュリティレビューといった、エンジニアリングの基本を徹底する姿勢です。
本セッションでは、AIを開発プロセスに深く組み込み、スピードと信頼性を両立させるための具体的なマルチクラウド・アーキテクチャや自動化の仕組みを、お二人にご紹介いただきました。
■プロフィール
齋藤 暢郎
株式会社ELYZA
プロダクト事業部 ソフトウェア開発チーム マネージャー
LINE Fukuoka(現:LINEヤフーコミュニケーションズ株式会社)や株式会社メルカリでiOSアプリ開発に従事。2019年に株式会社ELYZAへ入社。フロントエンドからバックエンド、インフラ、社内 SDK まで幅広い開発を担い、現在はマネージャー職を務める。
村山 卓朗
株式会社ELYZA
プロダクト事業部 機械学習エンジニアチーム マネージャー
株式会社リクルートへ入社し、データサイエンティストとして人材領域のデータ活用を推進。2021年に株式会社ELYZAへ入社。ソフトウェアエンジニアを経て、現在は機械学習エンジニアのマネージャーを務める。
東大松尾研発のAIカンパニー

村山 卓朗です。よろしくお願いいたします。
まず弊社と、弊社が開発するプロダクトについて紹介をさせていただき、その後に開発上の取り組みについてお話いたします。
私たちELYZAは、2018年9月に東京大学の松尾研究室からスピンアウトしたAIカンパニーです。「未踏の領域で、あたりまえを創る」というミッションを掲げております。その先端技術を世に届けるために、研究開発からプロダクト開発までがシームレスに接続するバリューチェーンを構築することを目指しています。

研究開発からプロダクトへ:社会実装を加速させる3つの組織体制
社内は大きく三つの部署で構成されています。
まず、先端技術の探索を行う研究開発の部署では、LLMやAIエージェントといった次の技術の種を探っています。次にソリューション事業は、AIコンサルティングのような立場で、パートナー企業とともに研究開発組織が見つけた技術の種を社会実装する事例をつくり出しています。最後にAIプロダクト事業です。社内にノウハウが蓄積された段階で、それを広く社会にご利用いただくプロダクトとして昇華させています。
本日は弊社のAIプロダクト「ELYZA Works」の技術詳細、および開発における工夫についてお話いたします。
「現場で作れる。チームで使える。」を実現する「ELYZA Works」の戦略
生成AI活用の壁を打破するユーザー設計
「ELYZA Works」は、「現場で作れる。チームで使える。」をコアコンセプトにした生成 AI 活用ツールです。
現場で使えることを目指す際に、大きく二つの課題があると考えています。

一つ目は、AIツールだけ配布されてもAI活用スキルに個人差があるため、組織全体で業務効率化を行うことが難しい点です。
次に、二つ目の課題について。定型業務での利用を見据えると、チャット形式ではなく定型の入力と出力が可能なAIアプリケーションが欲しくなります。しかし作成には業務知識とAI知識の両面が求められます。もともと弊社はソリューション事業としてAIコンサルタントが伴走する形でこのハードルを乗り越えてきましたが、プロダクトとして顧客に自走してもらうためにはどうすれば良いかが大きな問いでした。
これらの解決策として、私たちは「ユーザーのスキルセットに応じて提供機能を分離する」という手法を取りました。
AI活用スキルがある方にアプリを作成する機能を提供し、それ以外の方にはアプリを利用する機能のみを提供します。
DX部署の方やチームのマネージャーが高品質なAIアプリを作成し、他のメンバーは所定のフォームにリクエストを投げるだけで利用できるようなイメージです。これによりハードルを下げ、チーム全体での利用を促進したいと考えています。
ゼロから設定する手間を省く「アプリビルダー」
また「ELYZA Works」では、高品質なアプリをより少ない手間で開発するために、アプリビルダーという機能を提供しています。ユーザーがAIで効率化したい業務内容を入力すると、AIが壁打ちして目的や出力形式を確認し、ベストプラクティスに沿ったプロンプトやフォーム形式のアプリケーションを自動生成します。
アプリ作成の際にはプロダクト側の制約なども正しく理解している必要がありますが、サービスを使い始めたばかりのユーザーが、必ずしもそのような知識を持っているとは限りません。そのため、背景知識を理解したうえでアプリを自動生成する機能を備えています。この状態では60点程度かもしれませんが、ゼロから設定する負担に比べると格段に楽に作成することが可能です。
またアプリの編集も自然言語で可能で、チャット欄に指示を出すとシステムプロンプトや出力形式をAIが編集してくれます。
このように「ELYZA Works」は、AIアプリの作成、現場利用、そして改善のサイクルをAIでフルにサポートすることをコア価値として提供し、AIコンサルタントが伴走していた部分をAIが代替することで顧客の自走を目指しています。
変化の激しいLLM時代を生き抜くために
次に、「ELYZA Works」とソリューション事業の使い分けについてです。
技術的難易度が高いケースや業務影響度が大きく、人が介在する必要がある場合は、引き続きAIソリューションが対応しています。しかし「ELYZA Works」としては、プロダクト単体で解決可能な領域を拡大していくことを目指しています。

スピードとポータビリティを両立するアーキテクチャ
次にアーキテクチャについてです。
アプリケーションとML処理のメインはAWSで、一部の基盤はGoogle Cloud側に切り離された状態になっています。LLMホスティングとエージェント基盤だけがGoogle Cloudになっているのは、技術の潮流が極めて速く、環境の移行やスクラップアンドビルドを見据えて独立性を高めるためです。

このエージェント基盤とLLMホスティング基盤について、さらに詳しく説明いたします。
まずエージェント基盤はVertex AIサービスのエコシステムを中心とした構成で、独自仕様を吸収するプロキシーレイヤーを加えることで、各エージェントはビジネスロジックを意識せず実装できるようになっています。
一方で、課題もあります。認証認可の仕組みをセキュアにするための自前実装が必要であったり、Vertex AIの一部機能がまだ実験的であったりするため、サードパーティーのサービスを併用している部分もあります。

LLMホスティング基盤はGKEベースの推論基盤を構築しており、Llamaや弊社のモデルを運用しています。GPUリソースの確保状況に合わせて環境を移行することを前提としているため、Kubernetesでポータビリティを担保しています。非常に大規模なモデルバイナリを扱うため、スケールアウトに時間がかかることや、日本国内のGPUリソースの確保が難しいことなどが課題として挙げられます。

「やって終わり」のPoCを防ぐ、プロダクトとソリューションの共生
「ELYZA Works」はプロダクトとしての側面だけでなく、ソリューション事業で作成したカスタムMLパイプラインを顧客に提供する窓口としての役割も、同じサービス上で担っています。
というのも、もともと「ELYZA Works」は成果物を顧客に提供するための社内プラットフォームサービスでした。そこから社外向けのSaaSとして切り出された形です。

プロダクトとソリューションが同居することで、既存の顧客がソリューションの潜在顧客になり得たり、PoCから実利用へシームレスに繋げられたりといったメリットがあります。
またプロダクト事業にとっては、エンゲージメントの高い機能検証パートナーがいる状態であり、社内のエキスパートからアドバイスをもらえることも大きなポイントです。顧客目線でも利用ハードルが低く、データを次の一手に活かしやすい状態になっています。
AIコーディングツールで生産性を倍増させるための、地道な開発プロセス
ただし、解決すべき課題も多く存在します。
プロダクトマネジメントの観点では、事業構造やKPIが異なる中で優先順位付けが難しく、責任境界が曖昧になりがちな点が挙げられます。また緊急度の高い割り込みタスクによって、ロードマップの予測可能性が低下することも懸念されます。
開発面でも課題があります。まず、特定の条件のみに提供する機能などの条件分岐が発生し、コードベースが複雑化して生産性が下がる問題。次に、組み合わせが爆発して QAカバレッジが下がる問題。そして、高いSLAやセキュリティ基準への対応といったハードルがあります。
ここからは、これらのハードルを乗り越えるための地道な取り組みについて、齋藤からお話しします。
コーディング速度向上と引き換えに増大する「検証コスト」

齋藤と申します。ここからは、開発における課題をどのように解決していくかについてお話します。
まず開発の生産性について。AIコーディングツールを導入するとコーディング速度は間違いなく上がりますが、それと引き換えに検証の比重が高くなってしまいます。勤務時間のうち、コーディング以外の検証などの割合が増え、そこが非効率だと全体の生産性は上がりません。そのため、検証の効率化や開発全体の再現性が重要になります。
AIの精度を最大化する「ドキュメントドリブン開発」と環境の自動化

弊社の開発チームでは、週ごとにマージしたプルリクエストの量を計測しています。AIツールを導入してから生産量はおおむね1.5~1.6倍程度で推移し、向上できています。
これをどのように実現しているかご説明します。まず弊社では、ドキュメントドリブンの開発を進めています。PDMが書いたユーザーストーリーからエンジニアがデザインドックを起こし、APIドキュメントを定義した上でコード生成を行っています。APIドキュメントからクライアントやハンドラを生成し、その先の実装をAIに担わせることで効率化します。

またLintとFormatを徹底しており、コーディング規約は設けずFormatとして実装しています。AIでフォーマッターを新しく追加することも容易になり、ライブラリのインポートの仕方を最適化するようなルールも入れています。
ブランチ戦略としてgit-flowを採用しており、main、develop、feature、workの四段階構成で、それぞれプロダクション・ステージング・開発・ローカル環境に対応させます。各ブランチでのマージ条件やQA基準を明確に分けることで、健全性を保っています。

さらに、プルリクエストごとに専用の開発環境が自動で立ち上がる仕組みをTerraformで構築しており、PullRequestの番号を付与したURLでQAや動作確認が行えるようにしています。

稼働率99.93%を支える品質保証と、AI×セキュリティによる「守り」の自動化
AIによる「チクチク」が品質を守る- 自動レビューとテストの徹底
日々の業務はClaude Codeでカスタムコマンド化し、セルフレビューやQA項目の作成、リリースチェックなどをボタン一つで終わるようにして、再現性を高めています。品質維持については、AIによるコードレビューでテストの不足を指摘される仕組みをつくり、テストケースを落とさないよう取り組んでいます。

直近1年間の稼働率は99.93%を維持しており、目標を上回る成果が出ています。E2EテストやMLRegressionテストといった自動化にも取り組んでおり、モデルの代替わりの際の影響確認などを迅速に行えるようにしています。
設計段階から脆弱性を防ぐ「AIセキュリティレビュー」の導入
セキュリティについても、Dependabot Auto MergeやAIによるセキュリティレビュー、DesignDocAIレビューなどを実施しています。特にデザインドックの段階でセキュリティ基準に基づいたチェックを自動で行うことで、設計段階での脆弱性を防いでいます。
また、外部サービスを用いた静的・動的診断もリリースごとや月次で実施しており、設計・実装・成果物のすべてにおいて自動レビューができる状態を目指しています。
そして私たち自身もRedashのクエリ作成や障害報告書作成などに、自社のプロダクト「ELYZA Works」を活用しています。

このようにAIとの協業では、地道に「ちゃんとやる」ことの積み重ねが大切です。ご清聴ありがとうございました。
アーカイブ動画・発表資料
イベント本編は、アーカイブ動画を公開しています。また、当日の発表資料も掲載しています。あわせてご覧ください。
▼動画・資料はこちら
AI Engineering Summit Tokyo 2025
※動画の視聴にはFindyへのログインが必要です。






