対数領域Sinkhorn最適輸送のワープレベルGPU高速化 Fast Log-Domain Sinkhorn Optimal Transport with Warp-Level GPU Reductions
AI要約 GPU上で対数領域Sinkhornアルゴリズムを高速化する手法を提案。ワープレベルのリダクションを活用して数値安定性を保ちつつ最適輸送計算を効率化し、従来実装に比べ大幅な高速化を達成した。
EN This paper presents a fast log-domain Sinkhorn algorithm for optimal transport on GPUs, leveraging warp-level reductions to maintain numerical stability while significantly accelerating computation compared to prior implementations.
og