『株式会社ずんだもん技術室AI放送局 podcast 20250807』のカバーアート

株式会社ずんだもん技術室AI放送局 podcast 20250807

株式会社ずんだもん技術室AI放送局 podcast 20250807

無料で聴く

ポッドキャストの詳細を見る

このコンテンツについて

関連リンク Introducing Open SWE: An Open-Source Asynchronous Coding Agent ソフトウェア開発におけるAIの利用は、数年の間に大きく進化しました。最初はコードの自動補完から始まり、やがてIDE(開発環境)でコード作成を支援するCopilotのような存在へ。そして今、クラウド上で非同期に動き、より自律的にソフトウェア開発のタスク全体をこなす「AIエージェント」へと進化しています。 今回発表された「Open SWE」は、この次世代AIエージェントの先駆けとなるオープンソースプロジェクトです。これは、まるでチームの新しいメンバーのように働く非同期型のコーディングエージェントで、主に以下のような特徴を持っています。 Open SWEは、GitHubリポジトリと直接連携し、GitHubのIssueからタスクを受け取ることができます。コードベースの調査、詳細な実行計画の立案、コードの記述、テストの実行、自己レビュー、そして最終的にプルリクエスト(PR)の作成まで、一連の開発プロセスを自動で実行します。 特に新人エンジニアにとっても嬉しいポイントは、AI任せにしない「人間参加型」の仕組みです。Open SWEが計画を立てた際に、その計画をレビューして承認したり、途中で指示を変更したり、新しい要望を追加したりすることが可能です。これにより、AIが勝手に進めてしまうことへの不安がなく、AIと協力しながら開発を進められます。 また、Open SWEはGitHubの既存ワークフローに深く統合されます。例えば、GitHubのIssueに特定のラベルを付けるだけで、Open SWEがタスクを開始し、完了時には自動でPRを作成してくれます。さらに、各タスクは隔離された安全な環境(サンドボックス)で実行されるため、セキュリティ面も安心です。クラウド上で非同期に動作するため、あなたのローカルPCのリソースを消費することなく、複数のタスクを並行して処理させることが可能です。 Open SWEの内部では、計画役(Planner)とレビュー役(Reviewer)といった専門のエージェントが連携して動いています。これにより、いきなりコードを書き始めるのではなく、まずはしっかり計画を立て、コードを書いた後も自己レビューとテストを行うため、高品質で動作するコードを生成しやすいのが強みです。 現時点では、複雑で時間のかかる開発タスクに向いていますが、今後は簡単なバグ修正やスタイル調整にも対応できるバージョンが開発される予定です。Open SWEはオープンソースとして公開されており、開発者が自由に拡張・カスタマイズできるため、AIと人間が協調する未来のソフトウェア開発の基盤となることが期待されています。 引用元: https://blog.langchain.com/introducing-open-swe-an-open-source-asynchronous-coding-agent/ 強化学習で効率の良い検索を実現するRAGの手法 この記事では、AIが賢く情報を探すための新しい技術「GraphRAG-R1」について解説しています。 皆さんご存知の通り、ChatGPTのようなLLM(大規模言語モデル)は、質問に答える能力が非常に高いです。しかし、LLMは学習した時点までの情報しか持っていないため、最新の情報や特定の専門知識については苦手な場合があります。そこで活躍するのが、RAG(Retrieval Augmented Generation)という技術です。RAGは、LLMが外部のデータベースなどから必要な情報を検索して「参照」しながら、より正確で詳細な回答を生成する仕組みです。 最近のRAGの主流は、一度に全ての情報を探すのではなく、質問の内容に応じて必要な情報が見つかるまで、何度も検索を繰り返す「繰り返し検索」という方法です。この方法には、「必要な情報を見つけきれない(検索不足)」ことや、「もう十分なのに探し続けてしまう(検索過多)」といった課題がありました。これらの課題は、LLMが適切な「コンテキスト」(回答に必要な情報)を得ることを妨げていました。 今回紹介されている「GraphRAG-R1」は、この「繰り返し検索」の精度を大幅に高めるための画期的な手法です。強化学習という、コンピューターが試行錯誤しながら最適な行動を学ぶ技術(例えば、ゲームのAIがプレイを重ねるうちに上手くなるようなイメージです)をRAGに適用しています。これにより、RAGは「どんな情報を、...
まだレビューはありません