Anthropic「Dreaming」——Claudeエージェントがセッション間で自己改善する仕組みとHarveyの6倍効果
Anthropicが2026年5月6日に発表したClaude Managed Agentsの新機能「Dreaming」。モデル重みを変更せず、過去セッションを非同期で分析して失敗パターン・確立ワークフロー・チーム嗜好をプレイブックに整理し自動的に改善する。法律AIのHarveyでタスク完了率が6倍に。
Anthropicが2026年5月6日に発表したClaude Managed Agentsの新機能「Dreaming」。モデル重みを変更せず、過去セッションを非同期で分析して失敗パターン・確立ワークフロー・チーム嗜好をプレイブックに整理し自動的に改善する。法律AIのHarveyでタスク完了率が6倍に。
Google Threat Intelligence Groupが、ハッカーがAIモデルを使って2FA回避のゼロデイPythonスクリプトを生成・大規模悪用を企てたことを確認。AI生成コードの特徴的マーカーと、Googleがベンダーと連携して被害を未然に防いだ経緯を解説。
ペンシルバニア大学が提案するMollifier Layersは、1940年代の数学的概念を物理インフォームドMLに転用し、逆偏微分方程式(逆PDE)学習における高階自動微分のメモリ消費と不安定性を6〜10倍改善する。NeurIPS 2026採択論文の仕組みと応用を解説。
Sakana AIがICLR 2026で発表した7BのConductorモデルは、強化学習でGPT-5・Claude Sonnet 4・Gemini 2.5 Proを動的にオーケストレーションしGPQA-Diamond 87.5%・LiveCodeBench 83.93%を達成。商用製品Fugu(ベータ)の技術的仕組みを解説。
元OpenAI CTO ミラ・ムラーティが率いるThinking Machines Labが276B MoEモデルTML-Interaction-Smallを発表。0.40秒応答・マルチモーダル連続処理でOpenAI Realtime APIに挑む新アーキテクチャを解説。
OpenAI DaybreakはCodex Securityで脅威モデル生成・攻撃パス検証・パッチ提案を自動化するAIサイバーセキュリティ基盤。GPT-5.5-Cyber搭載、数百企業が参加。2026/5/12発表。
OpenAI Realtime API GA(2026/5/8)。GPT-5.5クラスの推論・128KコンテキストのGPT-Realtime-2と、70言語翻訳・ライブ文字起こしの専用2モデルが追加された。
2026年5月11日リリースのFigma Make Skills機能。Markdownで書いた規約・ワークフローをスラッシュコマンドで呼び出すことで、チームの設計基準に沿ったプロトタイプをより少ないプロンプトで生成できる。
OpenAIが2026年5月11日に企業向けAI展開専門の子会社を設立。TPG主導で$4B以上を調達、Tomoro買収で150名のFDEを確保。顧客組織に常駐しAIを本番稼働させるPalantir型モデル。
2026年5月5日、OpenAIがGPT-5.5 InstantをChatGPTのデフォルトモデルとして展開。幻覚52.5%削減、回答30%短縮、Gmail/記憶統合でパーソナライゼーション強化。APIはchat-latestで自動ルーティング。
中国のMoonshot AIがMeituan主導で$20B評価額・$2B調達を完了。Kimi K2.6はSWE-Bench Proでスコア58.6を記録しGPT-5.4(57.7)を上回る。API・モデル仕様・開発者への影響を解説。
AnthropicのARRが2026年4月にOpenAIを超えて$300億に達した。会計論争・成長ドライバー・Claude Codeの爆発的採用を解説。AI APIビジネスを構築するための実践的示唆。
Cloudflareが2026年4月にAIエージェント向け20以上の新機能を発表。安全なコード実行・永続メモリ・Gitストレージ・統合推論ゲートウェイで本番エージェントインフラの全体像を解説。
AnthropicがClioツールで100万件のClaude.ai会話を解析。個人向け相談の6%を占め、関係相談の25%・スピリチュアル相談の38%でお世辞的回答が検出された。Opus 4.7での改善手法と、AIプロダクト開発者への示唆を解説する。
2026年5月5日、Microsoft・Google・xAIが米商務省CAISIとフロンティアAIの事前評価協定に署名。OpenAI・Anthropicに続き全主要ラボが参加し、公開前に安全対策を削減した状態でのモデル審査体制が確立した。
2026年4月30日、GUARD Actが米上院司法委員会を全会一致で通過し全上院へ。18歳未満へのAIコンパニオン提供禁止・年齢確認義務・非人間開示要件の技術的含意と、EFFが指摘する過剰立法リスクを整理する。
2026年5月4日、AIチップメーカーCerebrasが評価額$40Bに更新したIPO申請を提出。OpenAIとの$20B超の取引関係と収益構造を解説する。
2026年4月30日、Featherless.aiがAMD Ventures・Airbus Ventures主導で$20M Series Aを調達。30,000以上のHugging Faceモデルをサーバーレス・月額定額で提供するホットスワップ技術の詳細と、プロプライエタリAIへの代替として開発者が今すぐ使う方法を解説。
2026年4月27日、DeepMind元RL主任David SilverのIneffable Intelligenceが欧州史上最大$1.1Bシード(評価額$5.1B)を調達。強化学習で人間データなしに新知識を発見する「スーパーラーナー」の構想と開発者・研究者への意味を解説。
2026年4月29日、MistralがMedium 3.5(128B・256Kコンテキスト・SWE-bench 77.6%)とVibe Remote Agentsを発表。PRを自動作成するクラウドコーディングエージェントの仕組みと開発者への影響を解説する。
2026年4月27〜28日、MicrosoftとOpenAIの独占契約が終了し翌日にOpenAIがAWS Bedrockへ参入。GPT-5.5・Codex・Managed Agentsが標準BedrockAPIから利用可能になった意味を整理する。
2026年4月21日、HackerOneはh1 Validationを発表。AIモデルが脆弱性発見を加速し報告件数が76%急増、高深刻度の割合が32%に上昇する中、発見から修正までのギャップを埋めるAI+人間のハイブリッド検証サービスの仕組みと開発チームへの影響を解説。
22,000以上のGitHubスターを持つLLMゲートウェイLiteLLMで、認証前に悪用可能なSQLインジェクション(CVSS 9.3)が発見・悪用された。OpenAI・Anthropic・AWS BedrockのAPIキーが窃取対象。対応バージョン1.83.7-stableへの即時アップグレードが必要。
Metaが4月5日にリリースしたLlama 4 Scout(MoE 17B/109B、Llama Community License)は10Mトークンコンテキストを謳うが、実際の制約は多い。$0.08/M入力トークンのAPI運用と、Apple Silicon・H100でのローカル展開の現実的な限界を整理する。
Googleが2026年4月にICLR 2026で発表したTurboQuantは、LLM推論の最大ボトルネックであるKVキャッシュをトレーニングなしで6倍圧縮しながら精度損失ゼロを達成した。PolarQuantとQJLを組み合わせた2段階アルゴリズムで、GemmaとMistralで検証済み。
Sony AIが開発した自律ロボット「Ace」がNature誌(2026年4月23日)に掲載された。エリート選手に3勝2敗、3月には新たな3名のプロ選手全員から少なくとも1勝。8関節アームと高速カメラネットワークによる物理AIが卓球という競技でついて人間のプロ級に達した初のシステム。
GitHubは2026年4月20日にCopilot個人プランの新規申込を一時停止し、Opus 4.7をPro+のみに制限。6月1日からリクエスト定額課金を廃止しトークン消費量ベースの従量課金へ移行する。エージェントワークフローが1ユーザーあたりのAPI呼び出し数を2024年比で数十倍に押し上げ、月額固定モデルが維持不可能になったと公式に認めた形だ。
JetBrainsが2026年4月27日に公開した年次ハイライトとAIツール調査(n=数万人)は開発者のAIツール採用の急変を示す。90%が常用、Claude Codeの職場利用率は18%と前年比6倍増。GitHub Copilotは認知度76%・利用率29%ながら成長が鈍化。専用AIコーディングツールの採用率は74%に達した。
カナダCohereがドイツAleph Alphaを買収し、評価額約200億ドルの合弁企業を設立。Schwarz Group(Lidl親会社)が6億ドルのSeries Eを主導。欧州AI主権需要への戦略的対応を解説。
Crunchbase Q1 2026レポート:グローバルVC投資は3,000億ドルで過去最高、80%がAI。OpenAI $1,220億が全体の40%超。AI/非AI間の評価格差拡大と資金調達環境の変化を整理。
VS Code 1.117がCopilot BYOKを一般公開。OpenRouter・Ollama・Google・OpenAIなど任意APIキーでVS Codeチャットのモデルを切り替え可能に。Claude CodeのエージェントCLI検出も追加。
内部コード名『Spud』のOpenAI次世代モデルが3月24日にPretraining完了。予測市場で4月23日公開の確率75%超と算出される中、確認済み情報と未確認情報を切り分けて整理する。
Metaが2026年のAI設備投資を1,150〜1,350億ドルと発表。2025年比約2倍の数字が示すインフラ競争の構造と、クラウド・ツール選定への波及を解説。
Stanford HAIの2026年AIインデックスレポートを開発者・ビジネス視点で読み解く。能力向上・企業採用の実態から、透明性低下と地政学的変化まで整理。
Google DeepMindがGemma 4を2026年4月にリリース。E2B〜31B Dense まで4サイズ、Apache 2.0ライセンスでマルチモーダル対応。オープンモデルの勢力図が塗り変わった。
2026年のNature報告によると、最新AIエージェントは複雑な科学タスクで人間科学者に大きく負ける。一方でAIは研究者の生産性を飛躍的に高める。この矛盾に開発者が向き合うべき理由とは。
690万人規模のr/programmingが2026年4月、LLM関連投稿を一時禁止。AIノイズで埋まったコミュニティが技術的な本質を取り戻そうとする動きの背景を読み解く。
4130万本の論文を分析したNature研究が明らかにした逆説。AIツールを使う研究者は論文数3倍・被引用数4.8倍になるが、科学全体の研究多様性は22%低下する。
MIT CSAILらが発表したCompreSSMは、状態空間モデルを訓練後ではなく訓練中に圧縮し、Mambaで4倍の速度向上と精度維持を両立。ICLR 2026採択論文の解説。
690万人のr/programmingが2026年4月にLLM関連投稿を一時禁止。AIノイズへの疲弊が示す、開発者コミュニティの知的ニーズの変化と技術発信への実践的な教訓。
同じ指示を3回書いたら永続化する、というベテランClaude Code使いの鉄則。CLAUDE.md / Skills / Hooks / subagent のどこに昇格させるかの判断軸を実例で整理します。
Claude Codeの月額が重い最大要因は「Haikuで足りるタスクまでSonnet/Opusで処理している」ことです。探索・要約・grep的作業を専用Haikuサブエージェントに固定してコストを桁で下げる実践パターンを紹介します。
Claude CodeをAnthropic公式ドキュメントの指示通りに動かすための運用原則・コンテキスト設計・Hooks/Skills/MCP連携を、2026年4月時点のバージョン2.1系ベースで整理します。
公式ドキュメントはPlan Modeを安全装置として説明しますが、達人は「実装案に反論させる場」として使います。最良1案ではなく2案+トレードオフを引き出すプロンプト型を紹介します。
Claude Codeの出力がおかしいと思った時に、言い訳を聞いたり修正を依頼したりするより即座に `/rewind` で巻き戻す方が速くて正確、というベテラン共通の鉄則と、/clear, /compact との使い分けを整理します。
公式ドキュメントは1〜2セッション例しか示さないが、重いタスクを回している個人開発者やシニアは常時3〜5セッションを並列運用しています。実務の泥臭い構成・Hook・コスト管理をまとめます。
数ヶ月の議論を経てLinuxカーネルコミュニティがAI生成コードの貢献ルールを正式合意。GitHub Copilot等は条件付き許可、「AIスロップ」は禁止、投稿者が全責任を負うという枠組みを解説します。
2026年Q1のグローバルVC投資総額が2970億ドルと過去最高を更新。OpenAI 1220億ドルを筆頭にAI企業が全体の80%を占め、前年同期比2.5倍超の急成長。バブルリスクと共に解説。
Stanford HAIが発表したAI Index 2026の主要知見を解説。SWE-benchはほぼ満点、米中の差は消滅、組織採用率88%に達する一方で公衆の信頼は過去最低水準に。
GitHub ActionsとAI(Claude Opus 4.6・GPT-5.4)を組み合わせてPRのコードレビューを自動化する方法を解説。セキュリティチェック・バグ検出・スタイル一貫性の維持をAIに任せます。
JetBrains・Pragmatic Engineer調査によると74%の開発者がAIツールを採用し、95%が週1回以上使用。Claude Code・Cursor・GitHub Copilotのシェアと満足度データを整理します。
3大AIコーディングツールを実用的な観点から比較。コンテキスト理解・マルチファイル編集・価格・IDEサポートなど具体的な違いを整理し、選択の基準を提示します。
MLOps(Machine Learning Operations)の基本概念から実践まで解説。モデルの訓練・評価・デプロイ・監視のパイプライン構築、主要ツール(MLflow・BentoML・Seldon)の使い方を紹介します。
Ollamaを使ってLLM(大規模言語モデル)をローカルで動かす方法を解説。インストールからLlama・Mistral・Gemmaの実行、OpenAI互換APIの活用、RAGへの応用まで紹介します。
LLMから高品質な出力を引き出すプロンプト技術を解説。Chain-of-Thought・Few-shot・XML構造化・System Promptの設計など、実践で使えるパターンを網羅します。
RAGの仕組みから実装まで解説。テキストのチャンキング・Embeddingによるベクトル化・類似検索・LLMへのコンテキスト注入まで、Node.jsの実例コードで紹介します。
「雰囲気でコードを書く」Vibe Codingが2025年に生まれ2026年に本格化。AIに要件を伝えてコードを生成させる開発スタイルの実態・メリット・リスクを整理します。