HomeTags#huggingface

Tag timeline

#huggingface 51 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 51
Showing 30
Page 1/2
Updated 1h ago

Entries page 1/2 · 51 total

Tue, Jun 2 1 entries
blog local-llm 2w ago · zenn-llm

一番安いGPUでも動くLLM「bitnet-b1.58-2B-4T」をT4で試す 一番安いGPUでも動くLLM bitnet-b1.58-2B-4T

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月2日 Published Jun 2

AI要約 MicrosoftがリリースしたBitNet b1.58 2B 4Tは、重みを1.58ビットに量子化した軽量LLMで、Google ColabのT4など安価なGPUでも快適に動作する。HuggingFace Transformersから数行のコードで利用可能で、ローカルLLM入門として注目されている。

EN Microsoft's BitNet b1.58 2B 4T is a heavily quantized LLM that runs comfortably on budget GPUs like the T4, and can be loaded in just a few lines via HuggingFace Transformers, making it an accessible entry point for local LLM experimentation.

fallback
Wed, May 20 1 entries
blog local-llm 4w ago · huggingface-blog

OlmoEarth v1.1: より効率的な地球観測モデルファミリーが登場 OlmoEarth v1.1: A more efficient family of Earth observation models

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月20日 Published May 20

AI要約 Allen AIが地球観測向けモデル「OlmoEarth v1.1」を公開した。前バージョンと比較して推論効率が大幅に向上しており、衛星画像の解析や環境モニタリングなどのタスクに特化した設計が特徴となっている。

EN OlmoEarth v1.1: A more efficient family of Earth observation models

OlmoEarth v1.1: A more efficient family of Earth observation models og fallback
Fri, May 15 1 entries
blog local-llm 1mo ago · huggingface-blog

IBM Granite Embedding Multilingual R2、32K対応の小型多言語埋め込み Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月15日 Published May 15

AI要約 IBMがApache 2.0ライセンスで公開した多言語埋め込みモデル「Granite Embedding Multilingual R2」は、100M未満のパラメータ規模ながら32Kトークンの長文コンテキストに対応。12言語をサポートし、同規模帯では最高水準の検索品質を達成したという。

EN Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality

Granite Embedding Multilingual R2: Open Apache 2.0 Multilingual Embeddings with 32K Context — Best Sub-100M Retrieval Quality og fallback
Thu, May 7 1 entries
blog local-llm 1mo ago · huggingface-blog

vLLM V0からV1へ:RLにおける修正より正確性を優先 vLLM V0 to V1: Correctness Before Corrections in RL

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月7日 Published May 7

AI要約 ServiceNow AIがvLLMをV0からV1へ移行した際、強化学習トレーニングで生じた数値的な不一致と再現性の問題を分析。修正を急ぐ前に、ロジット計算やバッチ処理の正確性を検証する重要性を示した。

EN vLLM V0 to V1: Correctness Before Corrections in RL

vLLM V0 to V1: Correctness Before Corrections in RL og fallback
Wed, May 6 1 entries
blog local-llm 1mo ago · huggingface-blog

Open ASR Leaderboardにベンチマーク不正対策の非公開データセットを追加 Adding Benchmaxxer Repellant to the Open ASR Leaderboard

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月6日 Published May 6

AI要約 Hugging FaceがOpen ASR Leaderboardに非公開テストセットを導入し、ベンチマークの過剰最適化(benchmaxxing)を防ぐ仕組みを追加した。これによりモデルの真の汎化性能を測定でき、公開データへの過学習を見抜けるようになる。

EN Adding Benchmaxxer Repellant to the Open ASR Leaderboard

fallback
Thu, Apr 30 1 entries
blog local-llm 1mo ago · huggingface-blog

IBM Granite 4.1 LLMの設計と構築手法を解説 Granite 4.1 LLMs: How They’re Built

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月30日 Published Apr 30

AI要約 IBMがオープンソースLLM「Granite 4.1」の構築手法を公開。Mamba-Transformerハイブリッドアーキテクチャを採用し、長文処理の効率とコスト削減を実現。エンタープライズ用途を意識した学習データやファインチューニング手法も紹介されている。

EN Granite 4.1 LLMs: How They’re Built

Granite 4.1 LLMs: How They’re Built og fallback
Wed, Apr 29 1 entries
blog local-llm 1mo ago · huggingface-blog

NVIDIA、長文・音声・動画対応の統合AI「Nemotron 3 Nano Omni」を発表 Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月29日 Published Apr 29

AI要約 NVIDIAは文書、音声、動画を統合的に処理できるマルチモーダルモデル「Nemotron 3 Nano Omni」を公開した。長文コンテキスト対応により、エージェント用途での文書解析やメディア理解を一つのモデルで担えることが特徴とされる。

EN Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents

Introducing NVIDIA Nemotron 3 Nano Omni: Long-Context Multimodal Intelligence for Documents, Audio and Video Agents og fallback
Fri, Apr 24 1 entries
🔥 HOT blog local-llm 1mo ago · huggingface-blog

DeepSeek-V4登場、エージェントが実用可能な100万トークン文脈を実現 DeepSeek-V4: a million-token context that agents can actually use

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 4月24日 Published Apr 24

AI要約 DeepSeek-V4は最大100万トークンの長文コンテキストを扱えるオープンモデルとして公開された。単なる長さの拡張に留まらず、エージェント用途で実際に有効活用できる検索・推論性能を狙った設計が特徴とされる。

EN DeepSeek-V4: a million-token context that agents can actually use

fallback
Tue, Apr 21 1 entries
blog local-llm 1mo ago · huggingface-blog

QIMMA: 品質重視のアラビア語LLMリーダーボード公開 QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月21日 Published Apr 21

AI要約 TII (Technology Innovation Institute) がアラビア語LLM評価のための新リーダーボード「QIMMA」を公開した。品質を最優先に、文化的・言語的特性を反映したベンチマークでモデルを評価し、アラビア語圏での実用性を可視化する。

EN QIMMA قِمّة ⛰: A Quality-First Arabic LLM Leaderboard

fallback
Thu, Apr 16 3 entries
blog local-llm 2mo ago · huggingface-blog

Ecom-RLVE: ECチャット型エージェント向け検証可能な強化学習環境 Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月16日 Published Apr 16

AI要約 Hugging Faceブログで紹介されたEcom-RLVEは、Eコマースの対話エージェントを訓練するための適応的かつ検証可能な強化学習環境である。実際の購買シナリオに基づき、エージェントの応答を客観的に評価できる報酬設計を採用し、対話品質と業務遂行能力の両立を狙う。

EN Ecom-RLVE: Adaptive Verifiable Environments for E-Commerce Conversational Agents

fallback
blog local-llm 2mo ago · huggingface-blog

TransformersモデルをMLXへ自動移植するPRボット The PR you would have opened yourself

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月16日 Published Apr 16

AI要約 Hugging FaceがTransformersモデルをApple SiliconネイティブのMLX形式へ自動変換し、PRを開くボットを公開。重み変換・実装移植・テストを自動化し、Mac上での高速ローカル推論を容易にする取り組み。

EN The PR you would have opened yourself

fallback
blog local-llm 2mo ago · huggingface-blog

Sentence Transformersでマルチモーダル埋め込み・再ランカーを学習 Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月16日 Published Apr 16

AI要約 Hugging FaceがSentence Transformers v5系を用いて、テキストと画像を扱うマルチモーダル埋め込みモデルおよび再ランカーモデルを学習・微調整する方法を解説。CLIPなどのビジョン言語モデルを基盤に、損失関数やデータ準備、評価まで実践的に紹介する。

EN Training and Finetuning Multimodal Embedding & Reranker Models with Sentence Transformers

fallback
Thu, Apr 9 2 entries
blog local-llm 2mo ago · huggingface-blog

Waypoint-1.5登場、家庭用GPUでも動く高精細インタラクティブ世界モデル Waypoint-1.5: Higher-Fidelity Interactive Worlds for Everyday GPUs

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月9日 Published Apr 9

AI要約 Decartが発表したWaypoint-1.5は、コンシューマー向けGPUでもリアルタイム動作するインタラクティブな世界モデル。前バージョンより解像度と一貫性が向上し、オープンワールド的な探索体験をローカル環境で実現する。

EN Waypoint-1.5: Higher-Fidelity Interactive Worlds for Everyday GPUs

fallback
blog local-llm 2mo ago · huggingface-blog

Sentence Transformersでマルチモーダル埋め込みとリランカーをサポート Multimodal Embedding & Reranker Models with Sentence Transformers

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月9日 Published Apr 9

AI要約 Sentence Transformersが画像やマルチモーダル入力に対応するよう拡張された。CLIPやSigLIPなどのモデルを共通APIで扱え、テキスト・画像横断の埋め込みやリランキングが可能になり、検索やRAGの構築が容易になる。

EN Multimodal Embedding & Reranker Models with Sentence Transformers

fallback
Wed, Apr 8 1 entries
blog local-llm 2mo ago · huggingface-blog

SafetensorsがPyTorch Foundationに参加 Safetensors is Joining the PyTorch Foundation

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月8日 Published Apr 8

AI要約 Hugging Faceが開発した安全で高速なテンソル保存形式Safetensorsが、PyTorch Foundationに寄贈された。これによりオープンガバナンス下で運営され、エコシステム全体で標準フォーマットとしての普及が加速する見通し。

EN Safetensors is Joining the PyTorch Foundation

fallback
Thu, Apr 2 1 entries
🔥 HOT blog local-llm 2mo ago · huggingface-blog

Gemma 4登場: オンデバイスで動くフロンティア級マルチモーダルAI Welcome Gemma 4: Frontier multimodal intelligence on device

重要度 High High priority 重要度 High · 技術記事 · Local LLM / Open Models High priority · technical post · Local LLM / Open Models 公開 4月2日 Published Apr 2

AI要約 GoogleがオープンモデルファミリーGemma 4を公開。オンデバイス動作を視野に入れたマルチモーダル対応で、画像・テキストを統合的に扱える。Hugging Face上で重みが配布され、各種推論フレームワークにday-0で統合された。

EN Welcome Gemma 4: Frontier multimodal intelligence on device

fallback
Wed, Apr 1 3 entries
blog local-llm 2mo ago · huggingface-blog

TIIがFalcon Perceptionを公開、軽量マルチモーダルモデルを提供 Falcon Perception

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月1日 Published Apr 1

AI要約 アブダビのTechnology Innovation Institute(TII)が、Falconシリーズの新たなマルチモーダルモデル「Falcon Perception」を公開した。視覚と言語を統合し、軽量かつエッジ展開を意識した設計で、オープンウェイトとして提供される。

EN Falcon Perception

fallback
blog local-llm 2mo ago · huggingface-blog

Gradioのバックエンドを任意のフロントエンドから利用可能に Any Custom Frontend with Gradio's Backend

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月1日 Published Apr 1

AI要約 Gradioが新たに提供するサーバー機能により、React、Vue、Svelteなど任意のフロントエンドからGradioで構築したPythonバックエンドを呼び出せるようになった。MLアプリのUIとロジックを分離した開発が容易になる。

EN Any Custom Frontend with Gradio's Backend

fallback
blog local-llm 2mo ago · huggingface-blog

IBM、企業文書向け軽量マルチモーダルモデルGranite 4.0 3B Visionを公開 Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 4月1日 Published Apr 1

AI要約 IBMが企業文書処理に特化した軽量マルチモーダルモデルGranite 4.0 3B Visionを発表。3Bパラメータながら文書理解やOCR、表・図解析で大規模モデルに匹敵する性能を示し、Apache 2.0で公開された。エンタープライズ用途を意識した設計が特徴。

EN Granite 4.0 3B Vision: Compact Multimodal Intelligence for Enterprise Documents

fallback
Tue, Mar 31 1 entries
blog local-llm 2mo ago · huggingface-blog

TRL v1.0公開: 進化に追従するポストトレーニングライブラリ TRL v1.0: Post-Training Library Built to Move with the Field

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月31日 Published Mar 31

AI要約 Hugging FaceがLLMポストトレーニング用ライブラリTRLのv1.0を公開。SFT/DPO/GRPOなど主要手法を統合し、APIの安定化、vLLM連携、マルチノード分散学習、VLM対応強化など、実運用に耐える成熟版に到達した。

EN TRL v1.0: Post-Training Library Built to Move with the Field

fallback
Tue, Mar 24 1 entries
blog local-llm 2mo ago · huggingface-blog

音声エージェント評価の新フレームワーク EVA を ServiceNow が公開 A New Framework for Evaluating Voice Agents (EVA)

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月24日 Published Mar 24

AI要約 ServiceNow AI が音声エージェント評価のための新フレームワーク EVA を発表した。会話品質や音声特性、タスク達成度を統合的に測定し、従来のテキストベース評価では捉えきれない実運用上の課題に対応することを目指す。

EN A New Framework for Evaluating Voice Agents (EVA)

fallback
Wed, Mar 18 1 entries
blog local-llm 3mo ago · huggingface-blog

Hugging Faceが示す2026年春のオープンソースAI動向 State of Open Source on Hugging Face: Spring 2026

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月18日 Published Mar 18

AI要約 Hugging Faceが2026年春時点のオープンソースAIの状況をまとめた。中国勢のLLM主導、マルチモーダルや動画生成モデルの台頭、推論・量子化エコシステムの成熟が示され、コミュニティ規模も急拡大している。

EN State of Open Source on Hugging Face: Spring 2026

fallback
Tue, Mar 17 1 entries
blog local-llm 3mo ago · huggingface-blog

Holotron-12B登場 - 高スループットなコンピュータ操作エージェント Holotron-12B - High Throughput Computer Use Agent

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月17日 Published Mar 17

AI要約 H Companyが12BパラメータのコンピュータUse向けエージェントモデルHolotron-12Bを公開。GUI操作タスクを高スループットで処理し、ブラウザやデスクトップ自動化を想定した設計で、オープンモデルとして提供される。

EN Holotron-12B - High Throughput Computer Use Agent

fallback
Tue, Mar 10 2 entries
blog local-llm 3mo ago · huggingface-blog

Hugging Face Hub、組織向けStorage Bucketsを導入 Introducing Storage Buckets on the Hugging Face Hub

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月10日 Published Mar 10

AI要約 Hugging Faceは、組織がリポジトリのデータを自社のクラウドストレージ(AWS S3等)に保存できるStorage Buckets機能を発表した。データ主権やコンプライアンス要件に対応しつつ、Hub上のUIやAPIをそのまま利用できる点が特徴。

EN Introducing Storage Buckets on the Hugging Face Hub

fallback
blog local-llm 3mo ago · huggingface-blog

オープンソースRLライブラリ16種に学ぶ非同期学習の現状 Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月10日 Published Mar 10

AI要約 Hugging Faceが16のオープンソース強化学習ライブラリを比較調査し、LLM向けRL訓練における非同期化やトークン生成効率化の課題と設計パターンを整理。スループット向上のための学習・推論分離やオフポリシー対応の動向を解説する。

EN Keep the Tokens Flowing: Lessons from 16 Open-Source RL Libraries

fallback
Mon, Mar 9 2 entries
blog local-llm 3mo ago · huggingface-blog

Ulysses Sequence Parallelism: 100万トークン文脈の学習を可能に Ulysses Sequence Parallelism: Training with Million-Token Contexts

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月9日 Published Mar 9

AI要約 Hugging Faceがブログで紹介したUlysses Sequence Parallelismは、長文脈LLM学習向けの並列化手法。アテンションヘッドをGPU間で分割することで通信量を抑え、100万トークン級の文脈長での訓練を現実的にする。

EN Ulysses Sequence Parallelism: Training with Million-Token Contexts

fallback
blog local-llm 3mo ago · huggingface-blog

LeRobot v0.5.0リリース、ロボット学習基盤を全方位で拡張 LeRobot v0.5.0: Scaling Every Dimension

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月9日 Published Mar 9

AI要約 Hugging Faceがオープンソースのロボット学習ライブラリLeRobot v0.5.0を公開した。新たなプロセッサパイプライン、async推論、RLサポート、SmolVLA等の最新方策、ハードウェア互換性の拡充など、研究から実機運用までを通貫する大規模アップデートとなっている。

EN LeRobot v0.5.0: Scaling Every Dimension

fallback
Thu, Mar 5 2 entries
blog local-llm 3mo ago · huggingface-blog

NXP組込みプラットフォームへのロボットAI移植: データ収集とVLAの微調整・最適化 Bringing Robotics AI to Embedded Platforms: Dataset Recording, VLA Fine‑Tuning, and On‑Device Optimizations

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月5日 Published Mar 5

AI要約 Hugging FaceとNXPが、ロボティクス向けVision-Language-Action(VLA)モデルを組込みプラットフォームへ展開する取り組みを紹介。LeRobotを用いたデータセット収集、SmolVLAの微調整、i.MXシリーズ上での推論最適化までの実践的ワークフローを解説する。

EN Bringing Robotics AI to Embedded Platforms: Dataset Recording, VLA Fine‑Tuning, and On‑Device Optimizations

fallback
blog local-llm 3mo ago · huggingface-blog

Hugging Face、拡散パイプラインを部品化するModular Diffusersを発表 Introducing Modular Diffusers - Composable Building Blocks for Diffusion Pipelines

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月5日 Published Mar 5

AI要約 Hugging Faceは、拡散モデルのパイプラインをブロック単位で組み立てられる新フレームワーク「Modular Diffusers」を発表した。再利用可能なPipelineBlockを組み合わせることで、独自ワークフローの構築や既存コンポーネントの共有が容易になる。

EN Introducing Modular Diffusers - Composable Building Blocks for Diffusion Pipelines

fallback
Wed, Mar 4 1 entries
blog local-llm 3mo ago · huggingface-blog

PRX Part 3: 24時間で学習するテキスト画像生成モデル PRX Part 3 — Training a Text-to-Image Model in 24h!

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 3月4日 Published Mar 4

AI要約 Photoroomが公開したPRXシリーズ第3弾。効率的なDiTアーキテクチャと最適化技術により、テキストから画像を生成するモデルを24時間という短時間で学習させる手法を解説する。

EN PRX Part 3 — Training a Text-to-Image Model in 24h!

fallback