HomeTags#on-device-ai

Tag timeline

#on-device-ai 19 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 19
Showing 19
Page 1/1
Updated 1h ago

Entries page 1/1 · 19 total

Thu, Jun 4 2 entries
NEW blog copilot 2w ago · microsoft-foundry

Foundry Local でエッジ AI 開発を加速する Accelerate Edge AI Development with Foundry Local

重要度 Medium Medium priority 重要度 Medium · 技術記事 · GitHub Copilot Medium priority · technical post · GitHub Copilot 公開 6月4日 Published Jun 4

AI要約 Microsoft Foundry Local を活用してエッジ AI 開発を効率化する方法を解説。アプリやデバイスへの AI 組み込みにおける応答性・プライバシー・オフライン動作の課題に対応する手法を紹介。

EN Why edge AI development is still hard AI is no longer confined to cloud experiments. Developers are increasingly expected to deliver AI inside apps, devices, and edge systems where responsiveness, pri

fallback
🔥 HOT blog tech-news 2w ago · google-keyword

Google、統合型エンコーダーレスマルチモーダルモデル「Gemma 4 12B」を発表 Introducing Gemma 4.12B: a unified, encoder-free multimodal model

重要度 High High priority 重要度 High · 技術記事 · Industry & Policy High priority · technical post · Industry & Policy 公開 6月4日 Published Jun 4

AI要約 Googleは、ラップトップ上で高性能なマルチモーダルAIを実現するオープンモデル「Gemma 4 12B」を発表した。エンコーダーを持たない統合アーキテクチャを採用し、テキストと画像を単一モデルで処理できる点が特徴だ。

EN An overview of Gemma 4 12B, a model designed to bring high-performance multimodal intelligence directly to your laptop.

Introducing Gemma 4 12B: a unified, encoder-free multimodal model media fallback
Wed, Jun 3 3 entries
blog local-llm 2w ago · zenn-llm

M1 Pro 32GBでQwen3.6-35B-A3Bを本気で使ってみた正直な話 A hands-on report on running Alibaba's Qwen3.6-35B-A3B sparse MoE model on an M1 Pro MacBo…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月3日 Published Jun 3

AI要約 AlibabaのQwen3.6-35B-A3BをM1 Pro 32GBのMacで実際に動かした検証レポート。35B総パラメータ・3Bアクティブのスパース MoEモデルながら、コンシューマー向けハードウェアでの実用性を率直に評価している。

EN A hands-on report on running Alibaba's Qwen3.6-35B-A3B sparse MoE model on an M1 Pro MacBook with 32GB of unified memory, offering an honest assessment of real-world usability on consumer hardware.

fallback
blog gemini 3w ago · google-developers

Gemma 4 12B をノートPCで動かす:Google AI Edge がローカルエージェントワークフローを解放 Bringing Gemma 4.12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 6月3日 Published Jun 3

AI要約 Google DeepMind の Gemma 4 12B モデルが、16GB RAM を搭載した一般的なノートPCでローカル動作可能になった。マルチモーダル対応とエージェント機能を組み合わせ、データをクラウドに送らずに視覚情報の解析や自律的なタスク実行が行える環境を実現する。

EN Google DeepMind’s Gemma 4 12B model brings agentic, multimodal AI capabilities to everyday laptops with 16GB of RAM, enabling local data processing and visual insight generation. Users can leverage th

Bringing Gemma 4 12B to your Laptop: Unlocking Local, Agentic Workflows with Google AI Edge og fallback
🔥 HOT blog gemini 3w ago · google-developers

Gemma 4 12B 開発者ガイド:コンシューマー向けローカル AI の新アーキテクチャ Gemma 4.12B: The Developer Guide

重要度 High High priority 重要度 High · 技術記事 · Gemini / Gemma High priority · technical post · Gemini / Gemma 公開 6月3日 Published Jun 3

AI要約 Google が新たにリリースした Gemma 4 12B は、エンコーダーレスのマルチモーダルアーキテクチャを採用した密結合モデルで、コンシューマー向けデバイスでの高性能なローカル AI 実行を目指して設計されている。開発者向けガイドでは実装方法や活用事例が詳しく解説されている。

EN The newly released Gemma 4 12B is a dense, multimodal model designed for high-performance local AI execution on consumer devices. By introducing a novel, encoder-free architecture, it bypasses traditi

fallback
Mon, Jun 1 3 entries
🔥 HOT blog tech-news 3w ago · microsoft-source

NVIDIA RTX Sparkが加速するWindows PCの新時代到来 Powerful new chapter for Windows PCs, accelerated by NVIDIA RTX Spark

重要度 High High priority 重要度 High · 技術記事 · Industry & Policy High priority · technical post · Industry & Policy 公開 6月1日 Published Jun 1

AI要約 MicrosoftはNVIDIA RTX Sparkを搭載したWindows PCの新展開を発表した。強力なローカルAI処理能力を武器に、Copilot+PC体験をさらに高いレベルへと引き上げることが期待される。

EN The post Powerful new chapter for Windows PCs, accelerated by NVIDIA RTX Spark appeared first on Source .

fallback
🔥 HOT blog tech-news 3w ago · microsoft-source

MicrosoftがNVIDIA RTX SparkをローカルAI推進の突破口と位置づけ、Build 2025で詳細発表へ Our goal is to deliver unmetered intelligence to every home and every desk with Windows. NVIDIA RTX Spark marks a real breakthrough toward that vision. Looking forward to sharing more with Jensen, who will be joining us live from Taiwan, at Build this week!

重要度 High High priority 重要度 High · 技術記事 · Industry & Policy High priority · technical post · Industry & Policy 公開 6月1日 Published Jun 1

AI要約 SatyaNadellaがLinkedInで、Windows上でのローカルAI普及を目指す構想を示し、NVIDIA RTX Sparkをその実現に向けた重要な一歩と評価した。今週開催のMicrosoft BuildではNVIDIAのJensen Huangが台湾からライブ参加し、さらなる詳細が共有される予定だ。

EN The post Our goal is to deliver unmetered intelligence to every home and every desk with Windows. NVIDIA RTX Spark marks a real breakthrough toward that vision. Looking forward to sharing more with Je

fallback
blog tech-news 3w ago · nvidia-blog

NVIDIAがRTX PCとDGX Sparkでローカルエージェント機能を強化 NVIDIA Levels Up Local AI Agents Across RTX PCs and DGX Spark

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Industry & Policy Medium priority · technical post · Industry & Policy 公開 6月1日 Published Jun 1

AI要約 NVIDIAはComputex 2025に合わせ、RTX PC・DGX Spark向けにローカルAIエージェント環境を大幅に拡充した。OpenClawやHermesなどオープンソースのエージェントフレームワークが急成長する中、同社はエッジでの推論性能と開発者エコシステムの両面を強化している。

EN Personal agents are exploding in popularity, with open source projects like OpenClaw and Hermes seeing rapid adoption by AI developer communities on GitHub. Built to adapt to individual preferences an

fallback
Fri, May 29 1 entries
🔥 HOT blog tech-news 3w ago · ars-technica

AppleがGeminiの巨大モデルをiPhoneに搭載し、新Siriを刷新へ Apple working to cram massive Gemini model into iPhone to power new Siri

重要度 High High priority 重要度 High · 技術記事 · Industry & Policy High priority · technical post · Industry & Policy 公開 5月29日 Published May 29

AI要約 AppleがGoogleのGeminiモデルを蒸留・圧縮しiPhone上で動作させる取り組みを進めており、新しいSiriの基盤として活用を検討している。クラウド併用も見込まれる。

EN As Apple tries to shrink Gemini for the iPhone, a cloud component is probably inevitable.

Apple working to cram massive Gemini model into iPhone to power new Siri og fallback
Thu, May 28 2 entries
blog local-llm 3w ago · qiita-llm

Pixel WatchでLLMを動かすGoogleのLiteRT-LM──オンデバイスAIの新ランタイム Google's LiteRT-LM runtime enables on-device LLM inference on constrained hardware like Pi…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月28日 Published May 28

AI要約 GoogleがエッジデバイスでLLMを効率実行するランタイム「LiteRT-LM」を公開。Pixel Watch 4のSmart ReplyやChromeの要約などがサーバ不要で動作する。

EN Google's LiteRT-LM runtime enables on-device LLM inference on constrained hardware like Pixel Watch, powering Smart Replies and Chrome summaries locally via Gemma models.

fallback
blog local-llm 3w ago · qiita-llm

iPhoneでローカルLLM、結局どのランタイムが速い? MLX / llama.cpp / LiteRT-LM / CoreML を実機ベンチした A hands-on benchmark comparing four on-device LLM runtimes—MLX, llama.cpp, LiteRT-LM, and …

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月28日 Published May 28

AI要約 iPhone実機でMLX・llama.cpp・LiteRT-LM・CoreMLの4ランタイムをベンチマークし、ローカルLLMの推論速度を比較検証した記事。

EN A hands-on benchmark comparing four on-device LLM runtimes—MLX, llama.cpp, LiteRT-LM, and CoreML—running on a physical iPhone to determine which delivers the fastest inference.

fallback
Tue, May 19 3 entries
blog gemini 1mo ago · google-developers

Google Tensor SDK ベータ版が LiteRT と統合、エッジ AI 開発を加速 Google Tensor SDK Beta with LiteRT

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 5月19日 Published May 19

AI要約 Google は Tensor SDK のベータ版を LiteRT(旧 TensorFlow Lite)と組み合わせて公開した。開発者はオンデバイス AI モデルをより効率的に構築・展開できるようになり、エッジ推論のパフォーマンス向上が期待される。

EN The Google Tensor ML SDK is graduating to its Beta phase, allowing developers to build and deploy high-performance machine learning models directly onto the TPU of Google Pixel 10 devices. By integrat

Google Tensor SDK Beta with LiteRT og fallback
blog gemini 1mo ago · google-developers

Google AI Edge Galleryが進化:MCP統合、通知、セッション継続性を追加 A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 5月19日 Published May 19

AI要約 Android向けGoogle AI Edge GalleryがオープンソースのMCPに実験的対応し、Gemma 4がオンデバイスでツール連携や会話継続を実現。

EN The Google AI Edge Gallery app has expanded its on-device AI capabilities by introducing experimental support for the open-source Model Context Protocol (MCP) on Android, allowing Gemma 4 to coordinat

A Smarter Google AI Edge Gallery: MCP integration, notifications, and session continuity og fallback
blog gemini 1mo ago · google-developers

LiteRT-LMでオンデバイスGenAIを超高速化 Blazing fast on-device GenAI with LiteRT-LM

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 5月19日 Published May 19

AI要約 Google AI EdgeのLiteRT-LMが、モバイル・エッジ環境でGemma 4を高度に最適化して実行するための本番対応インフラを提供。

EN Google AI Edge’s LiteRT-LM provides a production-proven, highly optimized infrastructure for running Gemma 4 across cross-platform mobile and edge environments. It actively unlocks the model's native

Blazing fast on-device GenAI with LiteRT-LM og fallback
Thu, May 14 1 entries
blog gemini 1mo ago · google-developers

ArmとGoogle AI Edgeが進めるオンデバイスAI高速化の最前線 Accelerating on-device AI: A look at Arm and Google AI Edge optimization

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 5月14日 Published May 14

AI要約 GoogleはArmと連携し、Google AI Edgeスタック上でオンデバイスAI推論を加速する取り組みを進めている。LiteRTやMediaPipeなどを通じ、ArmのCPU/GPU/NPU向け最適化により、モバイル端末でのLLM・生成AI実行を高速化する。

EN Integration of Arm Scalable Matrix Extension 2 (SME2) and the Google AI Edge software stack enables high-performance, on-device generative AI by turning the CPU into a powerful matrix-compute accelera

Accelerating on-device AI: A look at Arm and Google AI Edge optimization og fallback
Thu, May 7 1 entries
blog tech-news 1mo ago · apple-newsroom

今年のSwift Student ChallengeでAIとアクセシビリティが融合 AI meets accessibility in this year’s Swift Student Challenge

通常 Normal 深掘り候補 · 技術記事 · Industry & Policy Deep-dive candidate · technical post · Industry & Policy 公開 5月7日 Published May 7

AI要約 Appleは2026年のSwift Student Challengeの優勝者を発表した。学生開発者たちはSwiftやXcodeを駆使し、AIとアクセシビリティを組み合わせたアプリを制作。視覚障害者支援や学習補助など、社会課題に取り組むプロジェクトが評価された。

EN Meet four Swift Student Challenge winners who are creating innovative apps that leverage AI and focus on accessibility.

AI meets accessibility in this year’s Swift Student Challenge og fallback
Thu, Apr 23 1 entries
blog gemini 2mo ago · google-developers

LiteRTとNPUで実現するオンデバイスAIの実装 Building real-world on-device AI with LiteRT and NPU

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 4月23日 Published Apr 23

AI要約 GoogleはLiteRTにNPUサポートを拡張し、Qualcomm、MediaTek等のチップ上で機械学習モデルを高速かつ省電力で実行可能にした。早期アクセスプログラムを通じて開発者は実機での推論最適化を進められる。

EN LiteRT is a production-ready framework designed to help mobile developers unlock the power of Neural Processing Units (NPUs), overcoming the performance and battery limitations of traditional CPU or G

Building real-world on-device AI with LiteRT and NPU og fallback
Fri, Apr 3 1 entries
🔥 HOT NEW blog gemini 2mo ago · google-deepmind

Gemma 4登場: バイト単位で最高性能を謳うオープンモデル Gemma 4: Byte for byte, the most capable open models

重要度 High High priority 重要度 High · 技術記事 · Gemini / Gemma High priority · technical post · Gemini / Gemma 公開 4月3日 Published Apr 3

AI要約 Google DeepMindがオープンモデルの最新世代「Gemma 4」を発表。同規模のオープンモデルと比較してバイト単位で最も高性能だと主張し、研究者や開発者がローカル環境やカスタム用途で利用しやすい点を訴求している。

EN Gemma 4: Our most intelligent open models to date, purpose-built for advanced reasoning and agentic workflows.

Gemma 4: Byte for byte, the most capable open models media fallback
Mon, Feb 9 1 entries
🔥 HOT blog local-llm 4mo ago · huggingface-blog

Transformers.js v4 が NPM で正式リリース Transformers.js v4: Now Available on NPM!

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 2月9日 Published Feb 9

AI要約 Hugging Face が Transformers.js v4 を NPM でリリース。ブラウザや Node.js 上で動作する JavaScript 版 Transformers ライブラリの新メジャーバージョンで、機能強化とパフォーマンス改善が含まれる。

原文JA Hugging Face が Transformers.js v4 を NPM でリリース。ブラウザや Node.js 上で動作する JavaScript 版 Transformers ライブラリの新メジャーバージョンで、機能強化とパフォーマンス改善が含まれる。

fallback