- コード例やワークフローについては、Google Colab ノートブックを参照してください。
- Serverless RL の API エンドポイントについては、Serverless RL API リファレンスを参照してください。
Serverless RL の使い方
OpenPipe の ART フレームワークと Serverless RL API を使用して、強化学習向けにモデルを事後トレーニングします。
OpenPipe の ART フレームワーク と Serverless RL API を使用して Serverless RL を利用できます。
Serverless RL を使い始めるには、まず W&B ツールを使用するための前提条件を満たし、その後 ART のクイックスタートを進めてください。