HomeTags#fine-tuning

Tag timeline

#fine-tuning 12 total

同じキーワードで束ねられた更新を確認できます。カテゴリをまたいだ関連ニュースや実装トピックの追跡に使えます。

Total 12
Showing 12
Page 1/1
Updated 1h ago

Entries page 1/1 · 12 total

Thu, Jun 11 1 entries
blog local-llm 1w ago · qiita-llm

Turing世代のGPU「RTX 2070」1台でローカルQLoRAファインチューニングに挑む(進行中) A work-in-progress account of running QLoRA fine-tuning locally on a single RTX 2070 (8 GB…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 6月11日 Published Jun 11

AI要約 VRAM 8GBのRTX 2070(Turing世代)1台を使い、個人データをクラウドに送らずローカル環境でQLoRAファインチューニングを行う試みを記録した進行中の実験記事。

EN A work-in-progress account of running QLoRA fine-tuning locally on a single RTX 2070 (8 GB VRAM, Turing architecture), keeping all personal training data on-device without any cloud upload.

fallback
Tue, Jun 2 1 entries
paper research 2w ago · arxiv-cs-lg

一般化レイリー商最適化による基盤モデルの能力保持型ファインチューニング Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 6月2日 Published Jun 2

AI要約 基盤モデルをファインチューニングすると事前学習で獲得した汎用能力が損なわれる問題に対し、一般化レイリー商最適化を用いて下流タスクへの適応と基盤能力の保持を両立する手法を提案した研究。

EN arXiv:2606.00132v1 Announce Type: new Abstract: While finetuning effectively adapts foundation models to specialized downstream tasks, it can degrade nontarget capabilities acquired during pretraining

Foundation-Preserving Adaptation via Generalized Rayleigh-Quotient Optimization og fallback
Mon, Jun 1 2 entries
paper research 2w ago · arxiv-cs-lg

大規模言語モデルの逐次ポストトレーニングにおける表現崩壊 Representation Collapse in Sequential Post-Training of Large Language Models

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 6月1日 Published Jun 1

AI要約 複数段階のポストトレーニングを順番に適用すると、LLMの内部表現が崩壊する現象を分析した論文。単一の命令チューニングでは見られないこの問題のメカニズムと対策を論じている。

EN arXiv:2605.30524v1 Announce Type: new Abstract: Large language models are now adapted through chains of post-training stages rather than through a single instruction-tuning pass. This paper studies wh

fallback
paper research 2w ago · arxiv-cs-lg

LLMファインチューニングにおけるデータ選択の長期的影響 The Long-Term Effects of Data Selection in LLM Fine-Tuning

重要度 Medium Medium priority 重要度 Medium · 論文/研究 · Papers / Benchmarks Medium priority · paper/research · Papers / Benchmarks 公開 6月1日 Published Jun 1

AI要約 LLMのファインチューニングコスト削減を目的としたデータ選択手法が注目される中、本論文はサンプル優先度付けが学習の長期的な性能にどう影響するかを分析した研究。短期的な効率改善が長期性能と必ずしも一致しない可能性を示唆している。

EN arXiv:2605.30537v1 Announce Type: new Abstract: Data selection is increasingly used to reduce the cost of large language model (LLM) fine-tuning, with recent methods prioritizing samples by current ut

fallback
Sun, May 31 1 entries
blog local-llm 2w ago · zenn-llm

「自社AIを育てる」前に — ローカルLLM+RAGで検証したら、ファインチューニングは要らなかった A hands-on experiment using bge-m3, LanceDB, and Ollama (gemma) found that a local RAG pip…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月31日 Published May 31

AI要約 「自社を理解するAI」の実現手段として注目されるファインチューニングだが、bge-m3・LanceDB・Ollamaを組み合わせたローカルRAG構成を検証したところ、多くのユースケースではRAGだけで十分な精度が得られることが示された。コストと運用負荷の観点からも、まずRAGを試すべきという知見は実務に直結する。

EN A hands-on experiment using bge-m3, LanceDB, and Ollama (gemma) found that a local RAG pipeline can match the practical needs of company-specific AI without fine-tuning, challenging the common assumption that training on proprietary data is necessary.

fallback
Sat, May 30 1 entries
blog local-llm 2w ago · zenn-ai

gemma-skills へようこそ!Gemma でスキルを拡張する新しいフレームワーク A new framework called gemma-skills has been introduced to extend the capabilities of Goog…

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 5月30日 Published May 30

AI要約 Google のオープンモデルファミリー Gemma を活用したスキル拡張フレームワーク「gemma-skills」が公開された。軽量ながら高性能な Gemma の「チューニングのしやすさ」を活かし、個人プロジェクトからエンタープライズ用途まで幅広い応用を想定している。

EN A new framework called gemma-skills has been introduced to extend the capabilities of Google's Gemma open model family, leveraging its lightweight design and strong tunability for use cases ranging from personal projects to enterprise applications.

`gemma-skills` へようこそ! og fallback
Fri, May 29 1 entries
blog tech-news 3w ago · ars-technica

明示的な警告後もLLMは誤った情報を信じ込む——研究が示すバイアスの根深さ LLMs believe false statements even after explicit warnings that they're false

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Industry & Policy Medium priority · technical post · Industry & Policy 公開 5月29日 Published May 29

AI要約 ファインチューニング実験により、LLMは虚偽と明示されても誤情報を真実として自信を持って出力するバイアスがあることが判明した。

EN Fine-tuning tests show "bias... toward confidently representing the claims as true."

LLMs believe false statements even after explicit warnings that they're false og fallback
Thu, May 28 1 entries
blog gemini 3w ago · google-developers

コミュニティがTunixとTPUを使ってGemmaに「思考」を学ばせた方法 How the community trained Gemma to "Think" with Tunix and TPUs

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Gemini / Gemma Medium priority · technical post · Gemini / Gemma 公開 5月28日 Published May 28

AI要約 KaggleのGoogle Tunixハッカソンで、開発者たちが小規模な非推論ベースモデルをTPUと限られた計算リソースで汎用推論エンジンへと変換した。

EN The Google Tunix Hackathon on Kaggle challenged developers to transform small, non-reasoning base models into general reasoning engines using Kaggle TPUs and a limited compute budget. The winning team

fallback
Fri, Feb 20 1 entries
blog local-llm 3mo ago · huggingface-blog

UnslothとHugging Face Jobsで無料AIモデル学習 Train AI models with Unsloth and Hugging Face Jobs for FREE

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 2月20日 Published Feb 20

AI要約 Hugging FaceがUnslothとJobsを組み合わせた無料のAIモデル微調整環境を提供。Pro/Team/Enterpriseユーザーは月額クレジットでGPUを利用でき、ローカル環境構築なしにLoRAやQLoRAによる効率的な学習を実行できる。

EN Train AI models with Unsloth and Hugging Face Jobs for FREE

fallback
Wed, Jan 28 1 entries
blog local-llm 4mo ago · huggingface-blog

ClaudeでCUDAカーネルを自動生成し、オープンモデルへ蒸留する取り組みをHugging Faceが公開 We Got Claude to Build CUDA Kernels and teach open models!

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 1月28日 Published Jan 28

AI要約 Hugging FaceがClaudeを用いてCUDAカーネルを自動生成し、その知識をオープンモデルへ蒸留するワークフローを公開した。

EN We Got Claude to Build CUDA Kernels and teach open models!

fallback
Tue, Jan 27 1 entries
blog local-llm 4mo ago · huggingface-blog

GPT-OSSにエージェント型RL学習を適用する実践的振り返り Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective

重要度 Medium Medium priority 重要度 Medium · 技術記事 · Local LLM / Open Models Medium priority · technical post · Local LLM / Open Models 公開 1月27日 Published Jan 27

AI要約 LinkedInがGPT-OSSモデルへのエージェント型強化学習適用を振り返り、訓練パイプライン構築・安定化の工夫・課題と解決策を解説。

EN Unlocking Agentic RL Training for GPT-OSS: A Practical Retrospective

fallback
Mon, Oct 6 1 entries
🔥 HOT blog codex 8mo ago · openai-blog

OpenAI、AgentKit・新Evals・エージェント向けRFTを発表 Introducing AgentKit, new Evals, and RFT for agents

重要度 High High priority 重要度 High · 技術記事 · OpenAI / Codex High priority · technical post · OpenAI / Codex 公開 10月6日 Published Oct 6

AI要約 OpenAIがエージェント開発を加速する3つの新ツール「AgentKit」「拡張Evals」「エージェント向けRFT」をリリースし、プロトタイプから本番運用までを一貫支援する。

EN Today, we’re releasing new tools to help developers go from prototype to production faster: AgentKit, expanded evals capabilities, and reinforcement fine-tuning for agents.

fallback