大規模言語モデル(LLM)の安全な利活用を支援する学習用データセットの開発に着手
生成AI活用の急速な利用拡大に合わせて、安全な仕様でのLLM利活用を支援すべく、「有害情報の入力検出」および「安全性評価基準の策定」に有効なAIデータの開発を開始いたしました。
生成AI活用の拡大する一方で、生成AIの安全な利活用という点ではまだまだ多くの課題が山積しております。株式会社APTO(本社:東京都渋谷区、代表取締役:高品良 以下、APTO)は、こうした課題に直面している生成AI基盤開発事業者、および生成AIを活用する生活者の潜在的な安全性ニーズに応えるべく、有害情報や不適切なプロンプトを判別する精度向上を目的とした「LLMセーフカードデータセット」の開発に着手いたしました。
これにより、国内外の様々なセーフガードモデルの精度向上を支援し、安全で安心して活用できる生成AIの社会実装をバックアップして参ります。

開発中のLLMセーフガードデータセットの主なラベル項目
- 暴力的な表現
- 差別的な表現
- 性的な表現
- 冒涜、毀損表現
- 法規制の悪用
- 税制・会計基準の悪用
- 個人情報の悪用
- コマンドの悪用
- 政治・選挙活動に影響を与える表現
- 身体的・精神的障がいおよび自傷行為にかかわる表現
データセットの公開
開発したデータセットは、Hugging Face および株式会社APTOの公式サイト内で年内に公開予定です。当社のメールマガジンで先行配信する場合がございますので、予めご了承ください。
過去に配信したデータセットの無料公開分
株式会社APTOは、これまでに生成AIの精度向上を目的とした様々なデータセットを公開してきました。いずれも当社のデータセット開発チームによって制作されており、いずれも権利クリアなデータセットとなっております。公開しているものは一部になりますので、ご興味がございましたら是非お問い合わせください。

指示追従精度向上を目的としたLLMデータセット
通常の指示に加え、複雑な指示を含んだ、Instruction データセットです。「質問」「回答」、会話の内容を示す「ジャンル」タグに加え、質問内の指示内容を抽出した「指示内容」、および「指示数」で構成されています。これらは合成データを人手で品質管理した上で、全量から222件を厳選して公開したものとなります。

数理推論能力を高めるLLM学習用データセット
自動生成と人手検証を組み合わせたJSONL形式の数理推論データです。PRM(Process/Preference Reward Model)学習を想定し、問題文、正解、生成解答に加え、思考過程(Chain-of-Thought)と各ステップの評価情報を含めています。これにより、単なる正誤判定だけでなく推論プロセスの質的評価を可能にしています。