HomeAgent FrameworksAmazon SageMaker AI 非同期推論がインラインリクエストペイロードをサポート

Amazon SageMaker AI 非同期推論がインラインリクエストペイロードをサポート Amazon SageMaker AI Async Inference now supports inline request payloads

元記事を読む 鮮度 OK
AI 3 行サマリ
  • Amazon SageMaker AI の非同期推論が InvokeEndpointAsync API のリクエストボディへ直接ペイロードを送信できるインライン形式に対応。
  • S3 への事前アップロードが不要となり、ワークフローが簡素化される。
English summary
  • Amazon SageMaker AI Async Inference now supports inline payloads in the InvokeEndpointAsync API request body, removing the requirement to pre-upload inference data to Amazon S3 before each call.

Amazon SageMaker AI の非同期推論(Async Inference)に、InvokeEndpointAsync API のリクエストボディへ直接ペイロードを含められる「インラインペイロード」機能が追加されました。従来は推論データを Amazon S3 にアップロードしてから API を呼び出す必要がありましたが、本機能によりその手順が不要となります。

これにより開発・運用ワークフローが簡素化され、S3 への事前アップロードに伴うレイテンシやコストの削減が期待できます。特に中〜小規模ペイロードを扱うユースケースで利便性が高まると考えられます。

対応リージョン、ペイロードサイズの上限、料金への影響などの詳細は公式ブログおよび SageMaker ドキュメントにて確認することを推奨します。

Amazon SageMaker AI Async Inference has added support for inline request payloads, allowing customers to include inference data directly in the body of the InvokeEndpointAsync API call. Previously, the workflow required uploading payload data to Amazon S3 first and passing the S3 URI in the request, adding extra steps and potential latency to every inference job.

This change is expected to simplify integration for teams building asynchronous inference pipelines, reducing the overhead of mandatory S3 staging—especially for small to medium-sized payloads. Developers can now keep request logic more self-contained without managing intermediate object storage.

Details such as maximum inline payload size, Regional availability, and any associated pricing changes are not covered in the available context. Readers should consult the official AWS Machine Learning Blog post and the SageMaker Async Inference documentation for authoritative guidance before updating production workflows.

  • SourceAWS Machine Learning BlogT1
  • Source Avg ★ 2.0
  • Typeブログ
  • Importance ★ 通常 (top 98% in Agent Frameworks)
  • Half-life 🏛️ 長期 (アーキテクチャ)
  • LangEN
  • Collected2026/06/18 15:00

本ページの本文・要約は AI による自動生成です。正確性は元記事 (aws.amazon.com) をご確認ください。

🤖 Agent Frameworks の他の記事 もっと見る →

URL をコピーしました