HFOpenHathi
भारत में निर्मितSarvam AI का ओपन-वेट Hindi LLM जो क्यूरेटेड भारतीय वेब डेटा पर प्रशिक्षित है। हिंदी NLP प्रयोग के लिए सामुदायिक बेस मॉडल।
सबसे अच्छा उपयोग
- •fine-tuning के लिए मजबूत भारतीय बेस मॉडल चाहने वाले हिंदी NLP शोधकर्ता।
सीमाएँ
- •Base model — requires fine-tuning for most production tasks.
- •Context window is limited to 4K tokens.
- •Not instruction-tuned out of the box.
सावधानी कब रखें
- •जब बॉक्स से बाहर instruction-following या chat-ready मॉडल चाहिए।
त्वरित शुरुआत
- OpenHathi repo क्लोन करें और Hugging Face से weights डाउनलोड करें।
- Hindi और देवनागरी लिपि के लिए अनुकूलित शामिल tokenizer उपयोग करें।
- कुशल adaptation के लिए LoRA से अपने Hindi डेटासेट पर fine-tune करें।
सेटअप चेकलिस्ट
- • API कुंजी आवश्यक: नहीं
- • SDK गुणवत्ता: medium
- • सेल्फ-होस्ट कठिनाई: medium
उपयोग नोट्स
- • रोलआउट से पहले अपने बेंचमार्क स्लाइस पर मॉडल व्यवहार सत्यापित करें।
- • पुनरुत्पादनीय आउटपुट के लिए वर्शन/प्रदाता रूट्स पिन करें।
- • उच्च-वॉल्यूम वर्कलोड के लिए लॉगिंग + फ़ॉलबैक रूट्स जोड़ें।
मूल्य निर्धारण (INR)
इनपुट / 1M
₹0.00
आउटपुट / 1M
₹0.00
मासिक
-
क्षमताएं
- contextTokens4096
- openWeightहाँ
- indicLanguages1
बेंचमार्क
indic N L U
69.8
hindi Perplexity
12.4
tokenizer Efficiency
85.2
समुदाय समीक्षाएँ
0 reviews • avg —
अभी तक कोई समीक्षा नहीं।
नमूने
textHindi text completion
भारत एक विविध → (completion continues in Hindi).
अनुपालन
- लाइसेंस: apache-2.0
- व्यावसायिक उपयोग: allowed
उत्पत्ति
- अंतिम सत्यापन: 2/3/2026
- स्रोत: https://www.sarvam.ai