Ollama v0.30.3 リリース — Gemma 4 12B モデルのサポートを追加 Ollama Releases v0.30.3
- Ollama がバージョン v0.30.3 をリリースした。
- 今回の更新では Google の Gemma 4 シリーズから 12B パラメータモデル(gemma4-12b)のサポートが新たに追加されており、ローカル環境での利用が可能となった。
English summary
- New models Gemma 4 12B : high-performance multimodal intelligence that runs directly on laptops, combining efficiency with advanced reasoning.
- What's Changed Added support for gemma4:12b .
- Full Change
Ollama は 2026 年 6 月 3 日、ローカル LLM ランタイムの最新版となる v0.30.3 を公開した。今回のリリースはパッチバージョンの更新ながら、Google の Gemma 4 シリーズにおける 12B パラメータモデルへの対応が盛り込まれており、ローカル環境でのモデル運用の選択肢がさらに広がった。
追加されたのは gemma4-12b と呼ばれるモデルで、コントリビューターの @pdevine によるプルリクエスト #16457 がマージされたことで実現した。Gemma 4 シリーズは Google DeepMind が開発するオープンウェイトの言語モデル群であり、消費者向け GPU でも動作可能なサイズ感が特徴だ。12B クラスのモデルは、推論性能とリソース消費のバランスが取りやすい規模として、個人開発者や研究者の間で人気が高い。
Ollama はローカルマシン上で大規模言語モデルを手軽に実行するためのツールとして広く利用されている。`ollama run` コマンド一つでモデルのダウンロードから推論までを完結できるシンプルな設計が支持されており、Mac・Linux・Windows に対応する。バックエンドには llama.cpp が採用されており、CPU のみの環境から NVIDIA・AMD GPU を活用した高速推論まで幅広い構成で動作する。
今回の更新では Google の Gemma 4 シリーズから 12B パラメータモデル(gemma4-12b)のサポートが新たに追加されており、ローカル環境での利用が可能となった。
Gemma 4 シリーズは 2025 年頃に登場した世代と見られ、前世代の Gemma 2 と比較してアーキテクチャや学習手法の改良が加えられているとされる。12B モデルは 7B と比較すると精度面での優位性が期待できる一方、24B 以上のモデルほどの高スペック GPU を必要としないため、VRAM 16GB 前後の環境でも動作できる可能性がある。
Ollama のモデルライブラリは継続的に拡充されており、Meta の Llama シリーズや Mistral、Microsoft の Phi シリーズなど多様なモデルが既に対応済みだ。今回の Gemma 4 12B 追加により、用途や環境に応じたモデル選択の幅がさらに広がることになる。ローカル LLM の活用はプライバシー保護やオフライン運用の観点からも注目されており、こうした細かなアップデートの積み重ねがエコシステム全体の成熟を支えている。
Ollama released version v0.30.3 on June 3, 2026, bringing a focused but meaningful update to its local LLM runtime: support for Google's Gemma 4 12B model. While the patch-level version bump might suggest a minor housekeeping release, the addition of gemma4-12b expands the roster of models available for local inference in a notable way.
The change was contributed by community member @pdevine via pull request #16457, reflecting the increasingly collaborative nature of Ollama's development. The gemma4-12b model belongs to Google DeepMind's Gemma 4 family, an open-weight series designed to run efficiently on consumer-grade hardware. The 12B parameter scale sits in a sweet spot that many developers and researchers favor — capable enough to handle complex reasoning tasks, yet manageable enough to run on systems with around 16GB of VRAM without requiring enterprise-class GPU infrastructure.
Ollama has become one of the go-to tools for running large language models locally, thanks to its straightforward CLI interface and cross-platform support across macOS, Linux, and Windows. Under the hood, it leverages llama.cpp as its inference backend, which enables everything from CPU-only inference to accelerated runs on NVIDIA and AMD GPUs. The `ollama run` command abstracts away model downloading, quantization selection, and runtime configuration, making it accessible even to users without deep ML engineering backgrounds.
The Gemma 4 series is understood to represent a generational improvement over Gemma 2, with refinements to both architecture and training methodology, though specifics vary by model size. Among the Gemma 4 lineup, the 12B variant offers a meaningful step up in capability compared to smaller 7B-class models, while stopping well short of the resource demands associated with 27B or larger configurations. This makes it a practical choice for local deployment scenarios where quality matters but hardware budgets are finite.
New models Gemma 4 12B : high-performance multimodal intelligence that runs directly on laptops, combining efficiency with advanced reasoning.
Ollama's model library already encompasses a broad range of popular open-weight models, including Meta's Llama series, Mistral, Microsoft's Phi family, and others. The steady pace of additions like this one reflects the vibrant open-weight model ecosystem that has taken shape over the past few years. For users prioritizing privacy, offline operation, or simply the ability to iterate quickly without API rate limits, each new model addition represents a concrete expansion of what's achievable on local hardware.
This release serves as a reminder that the local LLM space moves quickly, and tools like Ollama play a key role in making cutting-edge models accessible to a wide audience without cloud dependencies.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (github.com) をご確認ください。