Kubernetes Engine के साथ Gemma चलाना

Google Cloud Kubernetes Engine, Gemma मॉडल को डिप्लॉय करने के लिए कई विकल्प उपलब्ध कराता है. इनकी मदद से, पसंदीदा डेवलपमेंट फ़्रेमवर्क का इस्तेमाल करके, बेहतर परफ़ॉर्मेंस और कम इंतज़ार के साथ मॉडल चलाए जा सकते हैं. जीपीयू पर Hugging Face, vLLM, और TensorRT-LLM के साथ-साथ JetStream की मदद से TPU पर एग्ज़ीक्यूशन के लिए, डिप्लॉयमेंट से जुड़ी ये गाइड देखें. साथ ही, ऐप्लिकेशन और ट्यूनिंग से जुड़ी गाइड भी देखें:

डिप्लॉय और दिखाना

डेटा का विश्लेषण करना

फ़ाइन-ट्यून करना