用語集 · 日本語

QLoRA

量子化LoRA: LoRAを4ビット量子化と組み合わせて、コンシューマGPUで大規模モデルをファインチューニング。

日本語 · Japanese

定義

QLoRAはベースモデルを4ビットに量子化し、その上にLoRAアダプターを適用します。これにより、単一のハイエンドコンシューマGPUで70Bパラメータモデルのファインチューニングが可能になります。品質のトレードオフはほとんどのドメインで小さいです。

単一のA100でQLoRAでLlama 3 70Bをファインチューニングし、メモリ要件を280GBから80GB未満に削減。

クライアントのコンピューティングが制約されている場合、またはデータセットの変動を素早く反復する場合に使用されます。

プロジェクトでお困りですか QLoRA?

3つの文章でプロジェクトについてお聞かせください。

カテゴリ内の他の用語 AI

3つの文章でプロジェクトについてお聞かせください。