HomeTags#mixture-of-experts

Tag timeline

#mixture-of-experts 5 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 5
Showing 5
Page 1/1
Updated 1h ago

Entries page 1/1 · 5 total

Tue, Jun 2 1 entries
paper research 2w ago · arxiv-cs-lg

BitsMoE: スペクトルエネルギーを活用したMoE LLMの効率的ビット割り当て量子化 BitsMoE: Efficient Spectral Energy-Guided Bit Allocation for MoE LLM Quantization

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 6月2日 Published Jun 2

AI要約 BitsMoEは、MoE(Mixture-of-Experts)大規模言語モデルの量子化において、重み行列のスペクトルエネルギー分布を指標にビット幅を層ごとに動的配分する手法を提案する。メモリ効率を高めながら精度低下を抑えることを目指した研究論文。

EN arXiv:2606.00079v1 Announce Type: new Abstract: Mixture-of-Experts (MoE) large language models reduce per-token computation through sparse expert activation, but their deployment remains memory-intens

BitsMoE: Efficient Spectral Energy-Guided Bit Allocation for MoE LLM Quantization og fallback
Thu, May 28 1 entries
paper research 3w ago · arxiv-cs-ai

Laguna M.1/XS.2 テクニカルレポート Laguna M.1/XS.2 Technical Report

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 5月28日 Published May 28

AI要約 長期的なエージェント型コーディング向けに設計されたMixture-of-Experts基盤モデル、Laguna M.1(2258億パラメータ)とXS.2を発表。

EN arXiv:2605.27605v1 Announce Type: new Abstract: We present Laguna M.1 and Laguna XS.2, two Mixture-of-Experts foundation models built for long-horizon, agentic coding: M.1 has $225.8$B total parameter

Laguna M.1/XS.2 Technical Report og fallback
Wed, Feb 4 1 entries
blog local-llm 4mo ago · huggingface-blog

H CompanyのHolo2-235B-A22BがUIローカライゼーションで首位を獲得 H Company's new Holo2 model takes the lead in UI Localization

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月4日 Published Feb 4

AI要約 H Companyが公開したHolo2-235B-A22BはUI要素の特定タスクで最高性能を達成し、GUIエージェント分野で前世代・競合モデルを上回った。

EN H Company's new Holo2 model takes the lead in UI Localization

fallback
Wed, Jan 28 1 entries
blog local-llm 4mo ago · huggingface-blog

中国オープンソースAIエコシステムの設計思想:DeepSeekを超えて Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 1月28日 Published Jan 28

AI要約 DeepSeek登場から1年、中国発オープンソースAIモデルのアーキテクチャ選択——MoE・長文処理・マルチモーダル・推論——を俯瞰分析。

EN Architectural Choices in China's Open-Source AI Ecosystem: Building Beyond DeepSeek

fallback
Tue, Aug 5 1 entries
🔥 HOT blog local-llm 10mo ago · huggingface-blog

OpenAIが新オープンソースモデルファミリー「GPT OSS」を発表 Welcome GPT OSS, the new open-source model family from OpenAI!

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 8月5日 Published Aug 5

AI要約 OpenAIがMoEアーキテクチャを採用したオープンソースモデル群GPT OSSを公開。Hugging FaceやTransformers等と統合済みでローカル環境でも利用可能。

EN Welcome GPT OSS, the new open-source model family from OpenAI!

fallback