LIVE · 04/30
agent-fwRELlangchain==1.2.16langchain==1.2.16[langchain-releases]local-llmGDPval設計思想:OpenAIが44職種×1,320タスクで測る経済価値の単位An analysis of OpenAI's GDPval evaluation framework, which measures economic value of LLM …[zenn-llm]tech-newsMetaのAR/VR部門、依然として巨額赤字を継続Meta is still burning money on AR/VR[techcrunch]tech-newsSatya Nadella、新たなOpenAIとの提携を「活用する」用意があると発言Satya Nadella says he’s ready to ‘exploit’ the new OpenAI deal[techcrunch]tech-newsMicrosoft、AI事業が年間売上370億ドル規模に到達、前年比123%増Just wrapped our quarterly earnings call.We are focused on delivering AI infrastructure and solutions that empower every business to eval-max their outcomes in this agentic computing era. Our AI business surpassed a $37 billion annual revenue run rate, up 123%. We are at the beginning of one of the most consequential platform shifts that will change the entire tech stack as we move from end-user driven workloads to workloads driven by end-users and agents. …You can read more about our results here…[microsoft-source]tech-newsMicrosoft、Copilot有料ユーザーが2,000万人を突破と発表Microsoft says it has over 20M paid Copilot users, and they really are using it[techcrunch]copilotGitHub Copilotの課金体系変更:2026年から「AIクレジット共有」導入GitHub Copilot will revamp its billing system in 2026, introducing shared AI credits acros…[zenn-copilot]tech-newsGoogle Cloudが四半期売上200億ドル突破、需要過多で容量逼迫Google Cloud surpasses $20B, but says growth was capacity-constrained[techcrunch]tech-newsMicrosoftのXbox収益が減少、クラウド事業は好調Microsoft reports sinking Xbox revenue as its cloud business climbs[the-verge]tech-newsGoogle検索クエリ数、前四半期に過去最高を記録Google Search queries hit an ‘all time high’ last quarter[the-verge]tech-newsMicrosoft、クラウドとAIの好調で第3四半期決算が大幅増収Microsoft Cloud and AI strength fuels third quarter results[microsoft-source]tech-newsMicrosoft、クラウドとAIの好調で第3四半期決算が伸長Microsoft Cloud and AI strength fuels third quarter results[microsoft-source]tech-newsABCはDisneyが戦う意思あればTrump政権FCCの免許剥奪脅迫に勝てるABC can beat Trump FCC's license threat if owner Disney is willing to fight[ars-technica]researchLLM 0.32a0、後方互換性を保つ大規模リファクタを実施LLM 0.32a0 is a major backwards-compatible refactor[simonw-blog]tech-newsMusk対Altman訴訟、これまでに公開された全証拠All the evidence unveiled so far in Musk v. Altman[the-verge]tech-newsUbuntuのAI機能導入計画にLinuxユーザーが「キルスイッチ」を要求Ubuntu’s AI plans have Linux users looking for a ‘kill switch’[the-verge]tech-news中東データセンターへのドローン攻撃でBig Tech計画停止Drone strikes on data centers spook Big Tech, halting Middle East projects[ars-technica]tech-newsMotorola、2026年Razrシリーズを発表 控えめな改良で値上げMotorola reveals 2026 Razr lineup with modest upgrades and higher prices[ars-technica]tech-newsNvidiaがGPUの8GB RAM問題を解決、ただし高額Nvidia fixes the 8GB RAM problem with one of its GPUs—if you can pay for it[ars-technica]tech-newsMotorola、Razr Foldの価格を発表 ― 高額設定に驚きMotorola just revealed the Razr Fold’s price and hoo boy[the-verge]tech-newsGoogle Photos、手持ちの服でAI試着機能を提供開始Google Photos launches an AI try-on feature for clothes you already have[the-verge]tech-newsGeminiでPDFやスプレッドシートなどのファイルを簡単生成可能にYou can now easily generate files in Gemini.[google-keyword]tech-newsOpenAIの未来を巡るMuskとAltmanの法廷闘争Live updates from Elon Musk and Sam Altman’s court battle over the future of OpenAI[the-verge]agent-fwRELlangchain-perplexity 1.2.0 リリースlangchain-perplexity==1.2.0[langchain-releases]
Today 98
Total 500
Major 22
Sources 41
Updated just now
Daily Summary

今日の更新

Today's Updates

Today 98 ▼ 33%
Yesterday 146
7-day 383
Last 7 days
28
25
7
20
59
146
98
04/24 04/25 04/26 04/27 04/28 04/29 04/30
主要な更新 Top stories 04/30 · 10 件
  1. 01 agent-fw REL langchain==1.2.16 langchain==1.2.16 Changes since langchain==1.2.15 release(langchain): 1.2.16 ( #37085 ) chore(docs): update x handle references ( #37081 ) release(anthropic): 1.4.2 ( #37061 ) perf(langchain): stop inlining agent state [langchain-releases]
  2. 02 local-llm GDPval設計思想:OpenAIが44職種×1,320タスクで測る経済価値の単位 An analysis of OpenAI's GDPval evaluation framework, which measures economic value of LLM … OpenAIが発表したGDPval評価フレームワークの設計思想を解説。44職種・1,320タスクで実世界の経済的価値を測定し、エージェントへの発注設計や成果物ベースの評価方法論を示す。LLMの実用性能評価の新基準として注目される。 An analysis of OpenAI's GDPval evaluation framework, which measures economic value of LLM agents across 44 occupations and 1,320 real-world tasks, proposing a deliverable-based methodology for assessing agent performance and task delegation design. [zenn-llm]
  3. 03 tech-news MetaのAR/VR部門、依然として巨額赤字を継続 Meta is still burning money on AR/VR MetaのReality Labs部門は引き続き巨額の損失を計上しており、AR/VR事業への多額の投資が収益化に至っていない状況が続いている。同社はメタバース戦略への注力を維持している。 Meta's Reality Labs division continues to post massive losses, as the company's heavy investments in AR/VR have yet to translate into meaningful revenue while it stays committed to its metaverse strategy. [techcrunch]
  4. 04 tech-news Satya Nadella、新たなOpenAIとの提携を「活用する」用意があると発言 Satya Nadella says he’s ready to ‘exploit’ the new OpenAI deal MicrosoftのCEOサティア・ナデラ氏は、再構築されたOpenAIとの提携契約を「最大限に活用する」準備が整っていると述べた。新契約はMicrosoftにOpenAIの技術へのアクセスを引き続き保証するものとなっている。 Microsoft CEO Satya Nadella said he is ready to 'exploit' the newly restructured deal with OpenAI, which secures Microsoft's continued access to OpenAI's technology and reshapes their long-standing partnership. [techcrunch]
  5. 05 tech-news Microsoft、AI事業が年間売上370億ドル規模に到達、前年比123%増 Just wrapped our quarterly earnings call.We are focused on delivering AI infrastructure and solutions that empower every business to eval-max their outcomes in this agentic computing era. Our AI business surpassed a $37 billion annual revenue run rate, up 123%. We are at the beginning of one of the most consequential platform shifts that will change the entire tech stack as we move from end-user driven workloads to workloads driven by end-users and agents. …You can read more about our results here… Satya Nadella氏が四半期決算を報告。MicrosoftのAI事業は年間売上換算で370億ドルを超え、前年比123%増を記録。エージェント型コンピューティング時代への移行が、エンドユーザー主導からエージェント駆動のワークロードへとテックスタック全体を変革する重大なプラットフォームシフトの始まりだと強調した。 Satya Nadella reported that Microsoft's AI business surpassed a $37 billion annual revenue run rate, up 123% year-over-year, marking the start of a major platform shift from end-user driven to agent-driven workloads. [microsoft-source]
  6. 06 tech-news Microsoft、Copilot有料ユーザーが2,000万人を突破と発表 Microsoft says it has over 20M paid Copilot users, and they really are using it Microsoftは有料のCopilotユーザーが2,000万人を超え、実際に積極的に利用されていると発表した。生成AIアシスタントの企業向け展開が本格的な普及段階に入ったことを示す数字となる。 Microsoft announced it has surpassed 20 million paid Copilot users, with the company emphasizing that these users are actively engaging with the AI assistant, signaling broader enterprise adoption of generative AI tools. [techcrunch]
  7. 07 copilot GitHub Copilotの課金体系変更:2026年から「AIクレジット共有」導入 GitHub Copilot will revamp its billing system in 2026, introducing shared AI credits acros… GitHub Copilotは2026年から課金体系を刷新し、Business/Enterpriseプランで組織内ユーザー間のAIクレジット共有を導入する。これにより使用量に応じた柔軟なリソース配分が可能となり、コスト管理の効率化が期待される。 GitHub Copilot will revamp its billing system in 2026, introducing shared AI credits across users in Business and Enterprise plans. This enables flexible resource allocation based on usage and improved cost management for organizations. [zenn-copilot]
  8. 08 tech-news Google Cloudが四半期売上200億ドル突破、需要過多で容量逼迫 Google Cloud surpasses $20B, but says growth was capacity-constrained Google Cloudが四半期売上200億ドルの大台を突破した。ただし同社は、AI需要の急増に対しデータセンター容量が追いつかず、成長が容量制約を受けたと明かした。 Google Cloud crossed $20B in quarterly revenue for the first time, but the company said its growth was constrained by limited data center capacity amid surging AI demand. [techcrunch]
  9. 09 tech-news MicrosoftのXbox収益が減少、クラウド事業は好調 Microsoft reports sinking Xbox revenue as its cloud business climbs Microsoftの最新四半期決算では、Xbox関連収益が減少した一方で、Azureを中心としたクラウド事業が引き続き成長を牽引した。ゲーミング部門の不振とクラウドの拡大という対照的な傾向が浮き彫りになっている。 Microsoft's latest quarterly earnings showed declining Xbox revenue while its cloud business, led by Azure, continued strong growth. The results highlight a contrast between weakening gaming performance and expanding cloud demand. [the-verge]
  10. 10 tech-news Google検索クエリ数、前四半期に過去最高を記録 Google Search queries hit an ‘all time high’ last quarter Alphabetの2026年第1四半期決算で、Sundar PichaiはGoogle検索のクエリ数が過去最高に達したと発表した。AIによる検索体験の変化が懸念される中、検索事業の堅調さを示す結果となった。 In Alphabet's Q1 2026 earnings, CEO Sundar Pichai announced Google Search queries reached an all-time high last quarter, signaling resilience for the search business amid concerns about AI disrupting traditional search. [the-verge]
🔥 Today's Top 3 importance × recency
  1. Zed v1.0.0 メジャーリリース公開 v1.0.0 zed-releases 13h ago
  2. Microsoft-OpenAIパートナーシップの次なる段階 The next phase of the Microsoft-OpenAI partnership microsoft-source 2d ago
  3. GDPval設計思想:OpenAIが44職種×1,320タスクで測る経済価値の単位 An analysis of OpenAI's GDPval evaluation framework, which measures economic value of LLM … zenn-llm 3h ago

Timeline 500 total · page 1/17

TODAY 30 entries
NEW paper research 1m ago · arxiv-cs-ai

適応型深層ニューラルネットワークにおけるUCBアルゴリズムの性能比較分析 A Comparative Analysis on the Performance of Upper Confidence Bound Algorithms in Adaptive Deep Neural Networks

AI要約 本論文は、適応型深層ニューラルネットワークにおけるUpper Confidence Bound (UCB) アルゴリズムの性能を比較分析する研究である。複数のUCB変種を評価し、探索と活用のバランスがモデル性能に与える影響を検証している。

EN This paper presents a comparative analysis of Upper Confidence Bound (UCB) algorithm variants in adaptive deep neural networks, evaluating how different exploration-exploitation strategies affect model performance.

arxiv.org
A Comparative Analysis on the Performance of Upper Confidence Bound Algorithms in Adaptive Deep Neural Networks og
NEW paper research 1m ago · arxiv-cs-ai

ADE: 適応的辞書埋め込みによる大規模言語モデルへのマルチアンカー表現拡張 ADE: Adaptive Dictionary Embeddings -- Scaling Multi-Anchor Representations to Large Language Models

AI要約 本論文は、複数のアンカーを用いた表現学習手法を大規模言語モデルに適用するための適応的辞書埋め込み(ADE)を提案する。動的に辞書を更新することで、スケーラブルかつ効率的にマルチアンカー表現を獲得し、下流タスクでの性能向上を示した。

EN This paper proposes Adaptive Dictionary Embeddings (ADE), a method for scaling multi-anchor representations to large language models by dynamically updating dictionaries, enabling scalable and efficient representation learning with improved downstream task performance.

arxiv.org
ADE: Adaptive Dictionary Embeddings -- Scaling Multi-Anchor Representations to Large Language Models og
NEW paper research 1m ago · arxiv-cs-ai

実資金下のオンチェーンLLMエージェント運用層制御 Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital

AI要約 実際の資金を扱うオンチェーン言語モデルエージェント向けに、運用層での安全制御機構を提案する研究。リスク管理やトランザクション実行の観点から、LLMエージェントが現実の資本を扱う際の制御手法を検討している。

EN This paper proposes operating-layer control mechanisms for onchain language-model agents handling real capital, addressing safety, risk management, and transaction execution concerns when LLM agents operate with actual financial assets.

arxiv.org
Operating-Layer Controls for Onchain Language-Model Agents Under Real Capital og
NEW paper research 1m ago · arxiv-cs-ai

Distill-Belief: 物理場における閉ループ逆問題による発生源の特定と特性推定 Distill-Belief: Closed-Loop Inverse Source Localization and Characterization in Physical Fields

AI要約 物理場(拡散・流れなど)における未知の発生源の位置と特性を推定する閉ループ逆問題手法Distill-Beliefを提案。信念分布を逐次的に蒸留・更新し、観測データから効率的に発生源を同定する枠組みを示している。

EN This paper introduces Distill-Belief, a closed-loop inverse method for localizing and characterizing unknown sources in physical fields by iteratively distilling and updating belief distributions from observations.

arxiv.org
Distill-Belief: Closed-Loop Inverse Source Localization and Characterization in Physical Fields og
NEW paper research 1m ago · arxiv-cs-ai

予測エージェントにおける戦略的推論の評価 Evaluating Strategic Reasoning in Forecasting Agents

AI要約 本論文は、予測タスクに従事するAIエージェントの戦略的推論能力を評価する手法を提案する。複数のエージェントが情報を収集・統合し将来事象を予測する際の意思決定プロセスを分析し、現行モデルの強みと限界を明らかにする。

EN This paper proposes methods to evaluate strategic reasoning capabilities in AI forecasting agents, analyzing how agents gather and integrate information to predict future events, and identifying strengths and limitations of current models.

arxiv.org
NEW paper research 1m ago · arxiv-cs-ai

Hierarchical Multi-Persona Induction from User Behavioral Logs: Learning Evidence-Grounded and Truthful Personas Hierarchical Multi-Persona Induction from User Behavioral Logs: Learning Evidence-Grounded and Truthful Personas

EN arXiv:2604.26120v1 Announce Type: new Abstract: Behavioral logs provide rich signals for user modeling, but are noisy and interleaved across diverse intents. Recent work uses LLMs to generate interpre

arxiv.org
NEW paper research 1m ago · arxiv-cs-ai

Apriori-based Analysis of Learned Helplessness in Mathematics Tutoring: Behavioral Patterns by Level, Intervention, and Outcome Apriori-based Analysis of Learned Helplessness in Mathematics Tutoring: Behavioral Patterns by Level, Intervention, and Outcome

EN arXiv:2604.26237v1 Announce Type: new Abstract: This study applied the Apriori algorithm to analyze behavioral interaction patterns associated with learned helplessness (LH) in mathematics tutoring sy

arxiv.org
NEW paper research 1m ago · arxiv-cs-ai

Auto-Relational Reasoning Auto-Relational Reasoning

EN arXiv:2604.26507v1 Announce Type: new Abstract: Background & Objectives: In the last decade, Machine learning research has grown rapidly, but large models are reaching their soft limits demonstrating

arxiv.org
NEW paper research 1m ago · arxiv-cs-ai

Human-in-the-Loop Benchmarking of Heterogeneous LLMs for Automated Competency Assessment in Secondary Level Mathematics Human-in-the-Loop Benchmarking of Heterogeneous LLMs for Automated Competency Assessment in Secondary Level Mathematics

EN arXiv:2604.26607v1 Announce Type: new Abstract: As Competency-Based Education (CBE) is gaining traction around the world, the shift from marks-based assessment to qualitative competency mapping is a m

arxiv.org
NEW blog local-llm 54m ago · qiita-llm

AI大規模モデルを学ぶなら、まず押さえたい10の基礎概念

AI要約 AIや大規模言語モデルについて学び始めると、次々に専門用語が出てきます。 「LLM」「プロンプト」「RAG」「Embedding」「Agent」……。 なんとなく聞いたことはあるけれど、きちんと説明しようとすると難しい。そんな人も多いのでは

qiita.com
NEW blog local-llm 1h ago · qiita-llm

Claude Code のトークン消費を半分にした5つのテクニック

AI要約 Claude Code のトークン消費を半分にした5つのテクニック 月末にAnthropicの請求書を開いて「え、また?」となった経験はないだろうか。 Claude Codeは強力だ。コードを書いてくれる、レビューしてくれる、バグを直してく

qiita.com
NEW blog claude 1h ago · qiita-claude

ClaudeCodeでシンプルカウンターをカスタマイズしてみた A hands-on report on customizing a simple counter app using ClaudeCode, sharing the author…

AI要約 ClaudeCodeを使ってシンプルなカウンターアプリのカスタマイズに挑戦した体験記。AIコーディング支援ツールとしてのClaudeCodeの実際の使い勝手や、開発フローにどのように組み込めるかを紹介している。

EN A hands-on report on customizing a simple counter app using ClaudeCode, sharing the author's experience with the AI coding assistant and how it integrates into a typical development workflow.

qiita.com
ClaudeCodeでシンプルカウンターをカスタマイズしてみた og
NEW blog local-llm 2h ago · qiita-llm

【ClaudeCode×Python】コード書けなくてもOK — AI が自分の職種を「何点」と見るか、GDPval を使って自己診断してみた

AI要約 OpenAI が2026年4月に発表した GDPval(AI に仕事をさせて何点か測るテスト)では、GPT-5.5 が44職種の平均で84.9点を取りました。この仕組みを使えば、「自分の職種は何点か」を試すことができます。Claude Co

qiita.com
NEW blog local-llm 3h ago · zenn-llm

RAGの脆弱性:Indirect Injection攻撃のリスクを初心者向けに解説 This article explains Indirect Prompt Injection attacks targeting RAG systems, where malic…

AI要約 RAGシステムが外部データを参照する仕組みを悪用したIndirect Prompt Injection攻撃について解説。検索対象文書に仕込まれた悪意のある指示によりLLMが操作されるリスクと、初心者向けの対策を紹介している。

EN This article explains Indirect Prompt Injection attacks targeting RAG systems, where malicious instructions embedded in retrieved documents can manipulate the LLM. It introduces the risks and basic countermeasures for beginners.

zenn.dev
RAGって実は攻撃される?Indirect Injectionのリスクを初心者向けに解説 og
NEW blog claude 3h ago · qiita-claude

「ノーコード対応は技術的に難しい」と言われても、やり方は必ずあると信じた A personal account of tackling a challenge labeled as technically difficult to implement n…

AI要約 ノーコード対応が技術的に困難と言われた状況でも、諦めずに実現方法を模索した経験を綴った記事。Claudeを活用しながら課題に挑んだ過程と、解決策を見出すための姿勢について語られている。

EN A personal account of tackling a challenge labeled as technically difficult to implement no-code support, sharing the author's belief that a solution always exists and their process of finding one with Claude's help.

qiita.com
「ノーコード対応は技術的に難しい」と言われた。それでも、やり方は必ずあると思った og
NEW blog claude 3h ago · qiita-claude

AIエージェントにWebアプリを巡回させ診断対象機能をCSV化 This article describes an experiment using an AI agent to automatically crawl a web applic…

AI要約 AIエージェントを使ってWebアプリケーションを自動巡回させ、セキュリティ診断対象となる機能の一覧をCSV形式で出力する試みを紹介。Claudeを活用し、診断準備工数の削減を目指す実践的な内容となっている。

EN This article describes an experiment using an AI agent to automatically crawl a web application and generate a CSV list of features to be assessed for security diagnostics, aiming to reduce manual preparation work.

qiita.com
AIエージェントにWebアプリを巡回させ、診断対象機能一覧をCSV化してみた og
NEW blog cursor 3h ago · zenn-cursor

Edge Functionのエラーをcursorで全自動対応する仕組み Introduces an automated system using Cursor and background agents to detect and fix Supaba…

AI要約 Supabase Edge Functionのエラーをcursorとbackground agentを使って全自動で検知・修正する仕組みを紹介。エラー発生時に自動でコード修正PRを作成し、運用負荷を軽減する実装例を解説している。

EN Introduces an automated system using Cursor and background agents to detect and fix Supabase Edge Function errors, automatically generating code fix PRs to reduce operational burden.

zenn.dev
Edge Functionのエラーを全自動で対応するんじゃ og
NEW blog local-llm 3h ago · zenn-llm

GDPval設計思想:OpenAIが44職種×1,320タスクで測る経済価値の単位 An analysis of OpenAI's GDPval evaluation framework, which measures economic value of LLM …

AI要約 OpenAIが発表したGDPval評価フレームワークの設計思想を解説。44職種・1,320タスクで実世界の経済的価値を測定し、エージェントへの発注設計や成果物ベースの評価方法論を示す。LLMの実用性能評価の新基準として注目される。

EN An analysis of OpenAI's GDPval evaluation framework, which measures economic value of LLM agents across 44 occupations and 1,320 real-world tasks, proposing a deliverable-based methodology for assessing agent performance and task delegation design.

zenn.dev
GDPval 設計思想を読む — OpenAI が 44職種×1,320タスクで測った「経済的価値の単位」とエージェント発注設計 og
NEW blog tech-news 3h ago · the-verge

法廷でElon Muskの最大の敵はElon Musk自身 Elon Musk’s worst enemy in court is Elon Musk

AI要約 OpenAIのSam Altmanに対するElon Muskの訴訟で、Musk自身の過去の発言や投稿が証拠として彼に不利に働いている。法廷ではMuskの衝動的な言動が最大の弱点となっており、訴訟の行方に影響を及ぼしている。

EN In Elon Musk's lawsuit against OpenAI's Sam Altman, Musk's own past statements and social media posts are being used against him in court, making his impulsive public behavior his biggest legal liability.

theverge.com
Elon Musk’s worst enemy in court is Elon Musk og
NEW blog tech-news 4h ago · techcrunch

証言台のElon Musk、自身のツイートから逃れられず On the stand, Elon Musk can’t escape his own tweets

AI要約 Elon Muskが法廷で証言し、過去の自身のツイートが証拠として突きつけられる場面が報じられた。彼の発言が法的責任の追及対象となり、SNS上の言動が再び裁判で重要な論点として浮上している。

EN Elon Musk took the stand and was confronted with his own past tweets as evidence, highlighting how his social media statements continue to create legal liability and serve as key exhibits in court proceedings against him.

techcrunch.com
On the stand, Elon Musk can’t escape his own tweets og