HomeTags#apple-silicon

Tag timeline

#apple-silicon 10 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 10
Showing 10
Page 1/1
Updated 1h ago

Entries page 1/1 · 10 total

Wed, Jun 10 1 entries
blog local-llm 1w ago · qiita-llm

MacでローカルLLM!Ollama × ELYZAで構築するAI環境(ターミナル・API・WebUI) A Qiita tutorial showing how to run ELYZA, a Japanese-specialised LLM, on Apple Silicon Ma…

通常 Normal 深掘り候補 · 技術記事 · Local LLM / Open Models Deep-dive candidate · technical post · Local LLM / Open Models 公開 6月10日 Published Jun 10

AI要約 Mac(Apple Silicon)にOllamaと日本語特化LLM「ELYZA」を組み合わせ、ターミナル・REST API・WebUIの3通りでローカルAI環境を構築する手順を紹介した入門チュートリアル記事。

EN A Qiita tutorial showing how to run ELYZA, a Japanese-specialised LLM, on Apple Silicon Macs via Ollama, covering terminal commands, REST API integration, and WebUI chat access.

MacでローカルLLM!Ollama × ELYZAで構築するAI環境(ターミナル・API・WebUI) og fallback
Wed, Jun 3 1 entries
blog local-llm 2w ago · zenn-llm

M1 Pro 32GBでQwen3.6-35B-A3Bを本気で使ってみた正直な話 A hands-on report on running Alibaba's Qwen3.6-35B-A3B sparse MoE model on an M1 Pro MacBo…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月3日 Published Jun 3

AI要約 AlibabaのQwen3.6-35B-A3BをM1 Pro 32GBのMacで実際に動かした検証レポート。35B総パラメータ・3Bアクティブのスパース MoEモデルながら、コンシューマー向けハードウェアでの実用性を率直に評価している。

EN A hands-on report on running Alibaba's Qwen3.6-35B-A3B sparse MoE model on an M1 Pro MacBook with 32GB of unified memory, offering an honest assessment of real-world usability on consumer hardware.

fallback
Tue, Jun 2 3 entries
blog local-llm 2w ago · zenn-llm

Apple Neural Engine で Gemma 4 をうごかす A hands-on guide to running Google's Gemma 4 language model on Apple's Neural Engine (ANE)…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月2日 Published Jun 2

AI要約 Apple デバイスに内蔵される Neural Engine(ANE)上で、Google の大規模言語モデル Gemma 4 を動作させる手法を解説した記事。オンデバイス推論の可能性と ANE 活用の実践的なアプローチを紹介している。

EN A hands-on guide to running Google's Gemma 4 language model on Apple's Neural Engine (ANE), exploring on-device inference techniques and the practical steps needed to leverage ANE for local LLM execution.

fallback
release local-llm 2w ago · ollama-releases

Ollama v0.30.0リリース——llama.cppによる互換性とパフォーマンスを強化 Ollama Releases v0.30.0

重要度 Medium Medium priority 重要度 Medium · 公式リリース · Local LLM / Open Models Medium priority · official release · Local LLM / Open Models 公開 6月2日 Published Jun 2

AI要約 OllamaがバージョンV0.30.0をリリースした。llama.cppとの統合を改善し、互換性とパフォーマンスを向上させた。Apple SiliconのMLXエンジンを補完する形で、より幅広いハードウェアへのサポートを拡大している。

EN Ollama 0.30 is now available, with improved compatibility and performance using llama.cpp . This augments the MLX engine on Apple Silicon, bringing support to a wider range of hardware. This release b

Ollama Releases v0.30.0 media fallback
🔥 HOT release local-llm 2w ago · ollama-releases

Ollama v0.30.0リリース――llama.cpp直接サポートとGGUF互換性を実現 v0.30.0-rc32: llama-server followups (#16353)

重要度 High High priority 重要度 High · 公式リリース · Local LLM / Open Models High priority · official release · Local LLM / Open Models 公開 6月2日 Published Jun 2

AI要約 OllamaがバージョンのV0.30.0をリリースし、アーキテクチャをGGML上のラッパーからllama.cppの直接サポートへと刷新。GGUFファイル形式との互換性を確保し、Apple SiliconではMLXによる高速化も導入された。

EN llama-server followups Misc fixes for #16031 Add back dropped ROCm build flag for multi-GPU support on windows Fix amdhip64_*.dll version detection for "latest" selection Fix embeddings API for consis

v0.30.0-rc32: llama-server followups (#16353) media fallback
Fri, May 29 2 entries
🔥 HOT release local-llm 2w ago · ollama-releases

Ollama v0.30.0 リリース Ollama Releases v0.30.0-rc31

重要度 High High priority 重要度 High · 公式リリース · Local LLM / Open Models High priority · official release · Local LLM / Open Models 公開 5月29日 Published May 29

AI要約 Ollama v0.30.0はアーキテクチャを刷新し、GGMLの上位レイヤーではなくllama.cppを直接サポート。GGUFファイル形式との互換性も確保し、MLXによるアクセラレーションを導入。

EN ci fix - non-shallow MLX checkout

Ollama Releases v0.30.0-rc31 media fallback
🔥 HOT release local-llm 3w ago · ollama-releases

Ollama v0.30.0 リリース Ollama Releases v0.30.0-rc29

重要度 High High priority 重要度 High · 公式リリース · Local LLM / Open Models High priority · official release · Local LLM / Open Models 公開 5月29日 Published May 29

AI要約 Ollama v0.30.0はアーキテクチャを刷新し、GGMLの上位層ではなくllama.cppを直接サポート。GGUFファイル形式との互換性も確保し、MLXによるアクセラレーションも導入。

EN review comments

Ollama Releases v0.30.0-rc29 media fallback
Tue, May 26 1 entries
blog local-llm 3w ago · zenn-llm

M5 Max のローカル LLM ベンチ — MoE は GPU 性能、Dense はメモリ帯域幅がボトルネック、発熱の影響も調査 A benchmark report on running local LLMs on Apple M5 Max, finding that MoE models are GPU-…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月26日 Published May 26

AI要約 M5 Max 上でローカル LLM を実行し、MoE モデルは GPU 演算、Dense モデルはメモリ帯域幅がそれぞれボトルネックになることを検証。発熱による性能低下も測定した後編レポート。

EN A benchmark report on running local LLMs on Apple M5 Max, finding that MoE models are GPU-bound while Dense models are memory-bandwidth-bound, with thermal throttling effects also measured.

M5 Max のローカル LLM ベンチ — MoE は GPU 性能、Dense はメモリ帯域幅がボトルネック、発熱の影響も調査 og fallback
Sat, May 23 1 entries
🔥 HOT release local-llm 3w ago · ollama-releases

Ollama v0.30.0 リリース Ollama Releases v0.30.0-rc23

重要度 High High priority 重要度 High · 公式リリース · Local LLM / Open Models High priority · official release · Local LLM / Open Models 公開 5月23日 Published May 23

AI要約 Ollama v0.30.0はアーキテクチャを刷新し、GGMLの上位層ではなくllama.cppを直接サポート。GGUFファイル形式との互換性を確保し、MLXによるアクセラレーションも導入。

EN lint fix

Ollama Releases v0.30.0-rc23 media fallback
Thu, Apr 16 1 entries
blog local-llm 2mo ago · huggingface-blog

TransformersモデルをMLXへ自動移植するPRボット The PR you would have opened yourself

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月16日 Published Apr 16

AI要約 Hugging FaceがTransformersモデルをApple SiliconネイティブのMLX形式へ自動変換し、PRを開くボットを公開。重み変換・実装移植・テストを自動化し、Mac上での高速ローカル推論を容易にする取り組み。

EN The PR you would have opened yourself

fallback