Ollama v0.30.0 リリース Ollama Releases v0.30.0-rc29
- Ollama v0.30.0はアーキテクチャを刷新し、GGMLの上位層ではなくllama.cppを直接サポート。
- GGUFファイル形式との互換性も確保し、MLXによるアクセラレーションも導入。
English summary
- review comments
Ollama v0.30.0は、従来GGMLの上に構築されていたバックエンドアーキテクチャを大幅に見直し、llama.cppを直接サポートする構成へと移行します。これにより、llama.cppの最新機能や最適化を迅速に取り込みやすくなることが期待されます。
また、GGUFファイル形式との互換性が追加されており、広く普及しているモデル配布フォーマットをそのまま利用できるようになります。さらにAppleシリコン向けのMLXフレームワークを活用した推論アクセラレーションも導入されている模様です。
詳細な変更点や破壊的変更の有無については、公式リリースノート(GitHub)を直接ご確認ください。収集済みの情報は一部省略されている可能性があります。
Ollama v0.30.0 marks a significant architectural shift: rather than building on top of GGML as an abstraction layer, the runtime now directly integrates llama.cpp. This change is expected to reduce overhead and make it easier to track upstream llama.cpp improvements and new model support as they land.
The release also introduces compatibility with the GGUF file format, which has become the de facto standard for distributing quantized language models. This means users should be able to load GGUF model files more natively within the Ollama ecosystem. MLX acceleration support is also noted, likely targeting Apple Silicon hardware for faster local inference.
These details are drawn from a release candidate tag (v0.30.0-rc29) and the collected snippet, so some specifics may differ in the final release. Readers are encouraged to consult the official GitHub release notes for the complete changelog and any breaking changes.
本ページの本文・要約は AI による自動生成です。正確性は元記事 (github.com) をご確認ください。