SJ blog
← タグ一覧

#ai (57 件)

ai

Anthropic「Dreaming」——Claudeエージェントがセッション間で自己改善する仕組みとHarveyの6倍効果

Anthropicが2026年5月6日に発表したClaude Managed Agentsの新機能「Dreaming」。モデル重みを変更せず、過去セッションを非同期で分析して失敗パターン・確立ワークフロー・チーム嗜好をプレイブックに整理し自動的に改善する。法律AIのHarveyでタスク完了率が6倍に。

security

史上初・AIが生成したゼロデイエクスプロイト——Google GTIGが2FA回避攻撃の未遂を報告

Google Threat Intelligence Groupが、ハッカーがAIモデルを使って2FA回避のゼロデイPythonスクリプトを生成・大規模悪用を企てたことを確認。AI生成コードの特徴的マーカーと、Googleがベンダーと連携して被害を未然に防いだ経緯を解説。

ai

Mollifier Layers——逆PDE学習の高階微分を6〜10倍高速化するペン大学の新手法(arXiv 2505.11682)

ペンシルバニア大学が提案するMollifier Layersは、1940年代の数学的概念を物理インフォームドMLに転用し、逆偏微分方程式(逆PDE)学習における高階自動微分のメモリ消費と不安定性を6〜10倍改善する。NeurIPS 2026採択論文の仕組みと応用を解説。

ai

Sakana AI「Conductor」——7BモデルがGPT-5・Claude Sonnet 4・Gemini 2.5 Proを指揮してSOTAを超える仕組み

Sakana AIがICLR 2026で発表した7BのConductorモデルは、強化学習でGPT-5・Claude Sonnet 4・Gemini 2.5 Proを動的にオーケストレーションしGPQA-Diamond 87.5%・LiveCodeBench 83.93%を達成。商用製品Fugu(ベータ)の技術的仕組みを解説。

ai

Thinking Machines TML-Interaction-Small——0.4秒応答・200msマイクロターンで「フル二重」AIが実現する新対話モデル

元OpenAI CTO ミラ・ムラーティが率いるThinking Machines Labが276B MoEモデルTML-Interaction-Smallを発表。0.40秒応答・マルチモーダル連続処理でOpenAI Realtime APIに挑む新アーキテクチャを解説。

devops

Cloudflare Agents Week 2026まとめ——Dynamic Workers・Agent Memory・Artifacts・AI Gatewayで「エージェントクラウド」のインフラが揃った

Cloudflareが2026年4月にAIエージェント向け20以上の新機能を発表。安全なコード実行・永続メモリ・Gitストレージ・統合推論ゲートウェイで本番エージェントインフラの全体像を解説。

ai

Anthropicが100万件の会話を分析——Claudeのお世辞問題は関係相談で25%発生し、Opus 4.7で半減した仕組みと開発者への教訓

AnthropicがClioツールで100万件のClaude.ai会話を解析。個人向け相談の6%を占め、関係相談の25%・スピリチュアル相談の38%でお世辞的回答が検出された。Opus 4.7での改善手法と、AIプロダクト開発者への示唆を解説する。

ai

全米主要AIラボがCAISI事前評価に合意——セーフガードを外したフロンティアモデルを政府が国家安全保障の観点で審査する仕組み

2026年5月5日、Microsoft・Google・xAIが米商務省CAISIとフロンティアAIの事前評価協定に署名。OpenAI・Anthropicに続き全主要ラボが参加し、公開前に安全対策を削減した状態でのモデル審査体制が確立した。

ai

米上院司法委員会がGUARD Actを全会一致で可決——未成年向けAIコンパニオン禁止と年齢確認義務がアプリ開発者に突きつけるもの

2026年4月30日、GUARD Actが米上院司法委員会を全会一致で通過し全上院へ。18歳未満へのAIコンパニオン提供禁止・年齢確認義務・非人間開示要件の技術的含意と、EFFが指摘する過剰立法リスクを整理する。

ai

Featherless.ai $20M調達——5秒ホットスワップで30,000以上のオープンモデルをサーバーレス化する仕組みと実際の使い方

2026年4月30日、Featherless.aiがAMD Ventures・Airbus Ventures主導で$20M Series Aを調達。30,000以上のHugging Faceモデルをサーバーレス・月額定額で提供するホットスワップ技術の詳細と、プロプライエタリAIへの代替として開発者が今すぐ使う方法を解説。

ai

Ineffable Intelligence——AlphaGo設計者が欧州史上最大$1.1Bを調達、「人間データ不要」強化学習スーパーラーナーが目指す次のフロンティア

2026年4月27日、DeepMind元RL主任David SilverのIneffable Intelligenceが欧州史上最大$1.1Bシード(評価額$5.1B)を調達。強化学習で人間データなしに新知識を発見する「スーパーラーナー」の構想と開発者・研究者への意味を解説。

ai

Mistral Medium 3.5+Vibe Remoteエージェント——128B開放重みモデルとクラウド非同期コーディングエージェントが変えるもの

2026年4月29日、MistralがMedium 3.5(128B・256Kコンテキスト・SWE-bench 77.6%)とVibe Remote Agentsを発表。PRを自動作成するクラウドコーディングエージェントの仕組みと開発者への影響を解説する。

security

HackerOne h1 Validation——AI主導で脆弱性報告が76%急増する中、「発見から修正まで」を高速化する新サービスの実態

2026年4月21日、HackerOneはh1 Validationを発表。AIモデルが脆弱性発見を加速し報告件数が76%急増、高深刻度の割合が32%に上昇する中、発見から修正までのギャップを埋めるAI+人間のハイブリッド検証サービスの仕組みと開発チームへの影響を解説。

security

LiteLLM CVE-2026-42208:開示36時間後に悪用が始まったCVSS 9.3 SQLインジェクション

22,000以上のGitHubスターを持つLLMゲートウェイLiteLLMで、認証前に悪用可能なSQLインジェクション(CVSS 9.3)が発見・悪用された。OpenAI・Anthropic・AWS BedrockのAPIキーが窃取対象。対応バージョン1.83.7-stableへの即時アップグレードが必要。

ai

Llama 4 Scout実践ガイド:10Mトークンコンテキストの現実と、ローカル・API運用の使い分け

Metaが4月5日にリリースしたLlama 4 Scout(MoE 17B/109B、Llama Community License)は10Mトークンコンテキストを謳うが、実際の制約は多い。$0.08/M入力トークンのAPI運用と、Apple Silicon・H100でのローカル展開の現実的な限界を整理する。

ai

GoogleのTurboQuantがLLM推論のKVキャッシュを6倍圧縮——ICLR 2026、3ビット量子化で精度ゼロ損失を実現

Googleが2026年4月にICLR 2026で発表したTurboQuantは、LLM推論の最大ボトルネックであるKVキャッシュをトレーニングなしで6倍圧縮しながら精度損失ゼロを達成した。PolarQuantとQJLを組み合わせた2段階アルゴリズムで、GemmaとMistralで検証済み。

ai

SonyのAIロボット「Ace」がプロ卓球選手を破る——Natureに掲載された物理AIの新マイルストーンと開発者への示唆

Sony AIが開発した自律ロボット「Ace」がNature誌(2026年4月23日)に掲載された。エリート選手に3勝2敗、3月には新たな3名のプロ選手全員から少なくとも1勝。8関節アームと高速カメラネットワークによる物理AIが卓球という競技でついて人間のプロ級に達した初のシステム。

tools

GitHub Copilot個人プラン大改訂——6月1日からトークン従量課金、新規申込停止とOpus 4.7制限が示す「エージェント時代の課金モデル限界」

GitHubは2026年4月20日にCopilot個人プランの新規申込を一時停止し、Opus 4.7をPro+のみに制限。6月1日からリクエスト定額課金を廃止しトークン消費量ベースの従量課金へ移行する。エージェントワークフローが1ユーザーあたりのAPI呼び出し数を2024年比で数十倍に押し上げ、月額固定モデルが維持不可能になったと公式に認めた形だ。

tools

JetBrains年次レポート2026——Claude Code利用率が1年で6倍増、GitHub Copilotは成長停滞:開発者AIツール採用の実態

JetBrainsが2026年4月27日に公開した年次ハイライトとAIツール調査(n=数万人)は開発者のAIツール採用の急変を示す。90%が常用、Claude Codeの職場利用率は18%と前年比6倍増。GitHub Copilotは認知度76%・利用率29%ながら成長が鈍化。専用AIコーディングツールの採用率は74%に達した。