疑似量子コンピュータ(QUBO)でLLMを高速化できるか RTX 4090とDeepSeek-V2-Liteで検証 An experimental article testing whether QUBO-based pseudo-quantum computing can accelerate…
AI要約 RTX 4090上でDeepSeek-V2-Liteを用い、QUBO形式の疑似量子計算でLLMの推論を高速化できるかを検証した実験記事。Mixture of Expertsのルーティング部分などにQUBOを適用し、従来手法との比較結果を報告している。
EN An experimental article testing whether QUBO-based pseudo-quantum computing can accelerate LLM inference, using DeepSeek-V2-Lite on an RTX 4090 GPU and applying QUBO to MoE routing, comparing results against conventional methods.
zenn.dev →
og