HomeTags#moe

Tag timeline

#moe 12 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 12
Showing 12
Page 1/1
Updated 1m ago

Entries page 1/1 · 12 total

YESTERDAY 1 entries
NEW release local-llm 1d ago · ollama-releases

v0.31.1: MLX バックエンドの Gemma4 MoE ローディングコードを改善 Ollama Releases v0.31.1

重要度 Medium Medium priority 重要度 Medium · 公式リリース · Local LLM / Open Models Medium priority · official release · Local LLM / Open Models 公開 7月1日 Published Jul 1

AI要約 Ollama v0.31.1 では、MLX バックエンドにおける Gemma4 の MoE モデルのローディングコードが整理・強化された。Apple Silicon 環境での Gemma4 MoE モデルの読み込み安定性が向上する。

EN Ollama v0.31.1 refines the MLX backend's Gemma4 mixture-of-experts model loading code, improving stability and reliability when running Gemma4 MoE models on Apple Silicon.

Ollama Releases v0.31.1 media fallback
Sun, Jun 21 1 entries
blog local-llm 1w ago · qiita-llm

新世代Qwen3.6を4070で測ったら「前世代の半速」に見えた。だが犯人はモデルではなかった On an RTX 4070, Qwen first looked half as fast as the prior generation, but offloading MoE…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月21日 Published Jun 21

AI要約 RTX 4070でQwenのMoEモデルを測ると当初は前世代の半速に見えたが、原因はモデルでなく構成にあり、エキスパートをCPUにオフロードすると2.8倍速い34.6 tok/sを達成し、標準7問で全問正解した。

EN On an RTX 4070, Qwen first looked half as fast as the prior generation, but offloading MoE experts to the CPU gave a 2.8x speedup to 34.6 tok/s with 7/7 correct, proving the config—not the model—was the culprit.

fallback
Wed, Jun 17 1 entries
NEW release local-llm 2w ago · ollama-releases

Ollama v0.30.9 リリース Ollama Releases v0.30.9

重要度 Medium Medium priority 重要度 Medium · 公式リリース · Local LLM / Open Models Medium priority · official release · Local LLM / Open Models 公開 6月17日 Published Jun 17

AI要約 Cohere2Moeアーキテクチャのサポートを追加し、thinkingが出力されない場合のLFM2パーサー/レンダリングのバグを修正した。Claudeなど各種コーディングエージェント起動時の問題も解消されている。

EN Ollama v0.30.9 adds support for the Cohere2Moe architecture, fixes LFM2 parser/render behavior when thinking is not emitted, and resolves issues launching Claude and other coding agents.

Ollama Releases v0.30.9 media fallback
Tue, Jun 16 1 entries
blog local-llm 2w ago · zenn-llm

RX6800 vs Radeon 890M iGPU — llama.cpp Vulkan ベンチマーク比較:MoE が帯域を活かす Benchmarks AMD's Vulkan backend for local LLM inference with llama.cpp, comparing the RX68…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月16日 Published Jun 16

AI要約 ローカルLLM推論におけるAMD GPUのVulkanバックエンドの実用性を、RX6800(16GB)とRadeon 890M iGPUの実機ベンチマークで検証し、MoEモデルがメモリ帯域を活かして高速化することを示した記録である。

EN Benchmarks AMD's Vulkan backend for local LLM inference with llama.cpp, comparing the RX6800 GPU against the Radeon 890M iGPU and showing that MoE models leverage memory bandwidth for better speed.

fallback
Fri, Jun 5 1 entries
blog local-llm 3w ago · qiita-llm

ローカルで動く"賢いMoE":Gemma4 26B A4B の推論環境を完全セットアップしてみた FPT Smart Cloud Japan details how to fully set up an inference environment for the MoE-bas…

通常 Normal 深掘り候補 · 技術記事 · Local LLM / Open Models Deep-dive candidate · technical post · Local LLM / Open Models 公開 6月5日 Published Jun 5

AI要約 FPTスマートクラウドジャパンが、MoE構成のGemma4 26B A4BをローカルやクラウドGPU環境で正しく動かすための推論環境のセットアップ手順を、必要なツールや設定とともに具体的に解説している。

EN FPT Smart Cloud Japan details how to fully set up an inference environment for the MoE-based Gemma4 26B A4B model, so it runs properly on local or cloud GPU hardware.

fallback
Wed, Jun 3 1 entries
blog local-llm 4w ago · zenn-llm

M1 Pro 32GBでQwen3.6-35B-A3Bを本気で使ってみた正直な話 A hands-on report on running Alibaba's Qwen3.6-35B-A3B sparse MoE model on an M1 Pro MacBo…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月3日 Published Jun 3

AI要約 AlibabaのQwen3.6-35B-A3BをM1 Pro 32GBのMacで実際に動かした検証レポート。35B総パラメータ・3Bアクティブのスパース MoEモデルながら、コンシューマー向けハードウェアでの実用性を率直に評価している。

EN A hands-on report on running Alibaba's Qwen3.6-35B-A3B sparse MoE model on an M1 Pro MacBook with 32GB of unified memory, offering an honest assessment of real-world usability on consumer hardware.

fallback
Thu, May 28 1 entries
paper research 1mo ago · arxiv-cs-ai

Laguna M.1/XS.2 テクニカルレポート Laguna M.1/XS.2 Technical Report

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月28日 Published May 28

AI要約 長期的なエージェント型コーディング向けに設計されたMixture-of-Experts基盤モデル、Laguna M.1(2258億パラメータ)とXS.2を発表。自律的にコードを書くエージェント構築の新たな選択肢を提供する。

EN Introduces Laguna M.1 (225.8B params) and XS.2, two Mixture-of-Experts foundation models purpose-built for long-horizon, agentic coding, offering new options for building autonomous coding agents.

Laguna M.1/XS.2 Technical Report og fallback
Tue, May 26 1 entries
blog local-llm 1mo ago · zenn-llm

M5 Max のローカル LLM ベンチ — MoE は GPU 性能、Dense はメモリ帯域幅がボトルネック、発熱の影響も調査 A benchmark report on running local LLMs on Apple M5 Max, finding that MoE models are GPU-…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月26日 Published May 26

AI要約 M5 Max 上でローカル LLM を実行し、MoE モデルは GPU 演算、Dense モデルはメモリ帯域幅がそれぞれボトルネックになることを検証。発熱による性能低下も測定した後編レポート。

EN A benchmark report on running local LLMs on Apple M5 Max, finding that MoE models are GPU-bound while Dense models are memory-bandwidth-bound, with thermal throttling effects also measured.

M5 Max のローカル LLM ベンチ — MoE は GPU 性能、Dense はメモリ帯域幅がボトルネック、発熱の影響も調査 og fallback
Fri, Apr 24 1 entries
🔥 HOT NEW blog local-llm 2mo ago · huggingface-blog

DeepSeek-V4登場、エージェントが実用可能な100万トークン文脈を実現 DeepSeek-V4: a million-token context that agents can actually use

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 4月24日 Published Apr 24

AI要約 DeepSeek-V4は最大100万トークンの長文脈を扱うオープンなMoEモデルとして公開。単なる長さ拡張ではなく、エージェントが膨大な履歴や文書を検索・推論で実際に活用できる性能を狙った設計が特徴で、長文エージェント用途の実用化に近づく。

EN DeepSeek-V4 ships as an open MoE model with a one-million-token context aimed at agents, prioritizing retrieval and reasoning that stay reliable at scale rather than just claiming length, pushing long-context agent workflows toward practical use.

fallback
Wed, Mar 18 1 entries
NEW blog local-llm 3mo ago · huggingface-blog

Hugging Faceが示す2026年春のオープンソースAI動向 State of Open Source on Hugging Face: Spring 2026

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月18日 Published Mar 18

AI要約 Hugging Faceが2026年春のオープンソースAIの現状を総括。中国勢のLLM主導、マルチモーダル・動画生成モデルの拡大、推論・量子化基盤の成熟、コミュニティの急成長を示し、エコシステム全体の方向性を俯瞰している。

EN Hugging Face's spring 2026 report maps open-source AI: Chinese-led LLMs, surging multimodal and video models, a maturing inference and quantization stack, and rapidly expanding community growth.

fallback
Wed, Jan 28 1 entries
NEW blog local-llm 5mo ago · huggingface-blog

中国オープンソースAIエコシステムの設計思想:DeepSeekを超えて Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 1月28日 Published Jan 28

AI要約 DeepSeek登場から1年、中国発オープンソースAIモデルが採用するMoE・長文脈処理・マルチモーダル・推論などのアーキテクチャ選択を俯瞰し、エコシステム全体がどう進化したかを分析している。

EN A one-year retrospective analyzing the architectural choices—MoE, long context, multimodal, and reasoning—across China's open-source AI models, showing how the ecosystem has evolved well beyond DeepSeek.

fallback
Tue, Aug 5 1 entries
🔥 HOT NEW blog local-llm 11mo ago · huggingface-blog

OpenAIが新オープンソースモデルファミリー「GPT OSS」を発表 Welcome GPT OSS, the new open-source model family from OpenAI!

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 8月5日 Published Aug 5

AI要約 OpenAIがMoEアーキテクチャを採用したオープンソースモデルファミリー「GPT OSS」を公開した。Hugging FaceやTransformersと統合済みでローカル環境でも動かせ、クローズドモデルに対するオープンな選択肢が広がる点で重要だ。

EN OpenAI released GPT OSS, an open-source model family built on a Mixture-of-Experts architecture and fully integrated with Hugging Face and Transformers, enabling local deployment and expanding open alternatives.

fallback