vonxai blog

最新記事

長期的なタスクを実行するAIエージェントの最新アーキテクチャを解説。外部の制御基盤（ハーネス）とモデル最適化の共進化という視点から、エージェントの実装手法、安全性、運用の課題を整理します。

GitHub CopilotがセキュリティAPI利用に与える影響をプロの開発者44名を対象に調査。機能的な正確性は大幅に向上した一方、セキュリティ上の誤用は改善されず、開発者の過信という課題が明らかになりました。

AIエージェントの操作ツールをコード実行のみに制限した場合の影響を調査した研究を紹介。タスクの成功率を維持したまま、多くのケースで約20〜25%のコスト削減を達成できる一方、タスクの性質やモデルの設計によっては例外的なコスト増加も確認されました。

マサチューセッツ大学などの検証で、AI生成テストの誤りを見抜ける確率は49%と判明。不完全な解説が過信を誘発する傾向も明らかになりました。エンジニア86名の実験データから、AI支援レビューの限界と注意点を解説します。

航空企業における4万件超のGitHub Advanced Securityアラートを分析した論文から、深刻度が高い脆弱性ほど修正が遅れ、却下されやすいという「逆転現象」と実務上の対策を解説します。

LLMを用いたマルチエージェント開発チームにおける性格と感情プロファイルの影響を調査。適切な役割特化型の設定が性能を向上させる一方、恐怖や高い誠実性は過剰な修正とコスト増加を招くことが明らかになりました。

Microsoftの研究チームが448名の社内エンジニアを対象に、SDLCの各タスクでAIに許容する自律性レベルとその決定要因を調査した論文を解説。開発者が判断権限を保持する境界線と、意味ある職務設計のポイントが分かります。

LLMのコード生成でテスト駆動開発（TDD）はセキュリティや品質の向上に有効か？最新の研究に基づき、標準プロンプティングとの比較実験結果を解説。TDDの制約がセキュリティ不備を誘発するリスクや、開発実務における注意点を紹介します。

AI生成コードの普及に伴い、長期的な保守性や技術的負債への懸念が高まっています。スウェーデン・ブレイキンゲ工科大学の調査論文に基づき、プロの開発者が直面する「既存コードとの統合の難しさ」や「理解の負担」といった課題と、その具体的な対策を解説します。

GitHubやJiraのメタデータから抽出した5つの指標をもとに、3つの開発チームの導入パターンと生産性・レビュー負荷への影響を分析した研究結果をもとに、効果的な導入方法を解説します。

安全な認証手段として普及が進むパスキーですが、アカウントが一度侵害されると復旧が極めて困難になる罠が存在します。ユーザー調査から明らかになった、悪用されたパスキーの発見を妨げるUIの課題と、サービス提供者が取り組むべきデザインの改善策を解説します。

AIコード生成ツールの普及は開発者の責任感にどう影響するでしょうか。研究に基づき、開発者が「心理的所有感」を保ち、100%の責任を負うための「システムの守護者」としての役割や、チームの認知的関与を維持する具体的なマネジメント手法を解説します。