HomeTags#dataset

#dataset page 1/1 · 4 total

YESTERDAY 4 entries
paper research 1d ago · arxiv-cs-cl

韓国語の法律チャットボット向け学習データセット生成手法 Generating training datasets for legal chatbots in Korean

AI要約 本研究は韓国語の法律分野チャットボットを学習させるためのデータセット構築手法を提案する。法律相談などの専門ドメインで不足するQAペアを効率的に生成し、対話モデルの精度向上を狙う。

EN This paper proposes a methodology for generating training datasets for Korean-language legal chatbots, addressing the scarcity of domain-specific QA pairs needed to train accurate conversational models in the legal field.

arxiv.org
paper research 1d ago · arxiv-cs-se

エージェント型AIコーディングツールの設定データセット A Dataset of Agentic AI Coding Tool Configurations

AI要約 本論文は、Cursor や GitHub Copilot などのエージェント型AIコーディングツールに与える設定ファイル(ルールやプロンプト)を収集したデータセットを提示する。開発者がAIエージェントをどう制御しているかを実証的に分析する基盤を提供する。

EN This paper introduces a dataset of configuration files (rules and prompts) used to steer agentic AI coding tools like Cursor and GitHub Copilot, enabling empirical study of how developers customize and constrain AI coding agents.

arxiv.org
A Dataset of Agentic AI Coding Tool Configurations og
paper research 1d ago · arxiv-cs-se

CppPerf: C++性能改善コミットの自動収集パイプラインとデータセット CppPerf: An Automated Pipeline and Dataset for Performance-Improving C++ Commits

AI要約 研究者らは、GitHub上のC++リポジトリから性能改善を目的としたコミットを自動的に抽出・検証するパイプライン「CppPerf」と、それに基づくデータセットを公開した。LLMによるコード最適化研究の基盤として活用が期待される。

EN Researchers introduce CppPerf, an automated pipeline that mines and validates performance-improving commits from C++ repositories on GitHub, along with a curated dataset intended to support LLM-based code optimization research.

arxiv.org
blog tech-news 1d ago · microsoft-source

Microsoft、米国48州の送電網データセットを電力研究向けに公開 Microsoft releases dataset covering electricity grid in 48 US states to aid power systems research

AI要約 Microsoft Researchが米国48州を網羅する現実的な送電網データセットを公開した。公開情報から構築されたこのデータは、電力系統の解析やAI研究、再生可能エネルギー統合の検討に活用できると見られる。

EN Microsoft Research has released a large-scale, realistic synthetic dataset of the US electric transmission grid covering 48 states, built from open data sources to support power systems research, AI modeling, and renewable integration studies.

microsoft.com
Microsoft releases dataset covering electricity grid in 48 US states to aid power systems research og