ಭಾರತ ಸರ್ಕಾರ ಆಯ್ಕೆ ಮಾಡಿದೆ ಸರ್ವಂ ಎಐ ಏಪ್ರಿಲ್ 2025 ರಲ್ಲಿ, ರಾಷ್ಟ್ರದ ಮೊದಲ ಸ್ವಾಯತ್ತ ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಯನ್ನು ರಚಿಸಲು IndiaAI ಮಿಷನ್ನ ಭಾಗವಾಗಿ. ದಿ ಹಿಂದೂ ಬ್ಯುಸಿನೆಸ್ ಲೈನ್ ವರದಿ ಮಾಡಿರುವಂತೆ ಸರ್ವಮ್ ಜೊತೆಗೆ, ಭಾರತದ AI ಪರಿಸರ ವ್ಯವಸ್ಥೆಯನ್ನು ಮತ್ತಷ್ಟು ಹೆಚ್ಚಿಸಲು ಇತರ 11 ವ್ಯವಹಾರಗಳನ್ನು ಸಹ ಆಯ್ಕೆ ಮಾಡಲಾಗಿದೆ.
ಮಾದರಿ ಸಾಮರ್ಥ್ಯಗಳು ಮತ್ತು ವಾಸ್ತುಶಿಲ್ಪ
30-ಬಿಲಿಯನ್-ಪ್ಯಾರಾಮೀಟರ್ ಮಾದರಿ ಮತ್ತು 150-ಬಿಲಿಯನ್-ಪ್ಯಾರಾಮೀಟರ್ ಮಾದರಿ – ಸರ್ವಂ ಪ್ರಕಾರ, ತಮಿಳು-ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಹಿಂಗ್ಲಿಷ್ನಂತಹ ಕೋಡ್-ಮಿಶ್ರಿತ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಭಾರತದ ಭಾಷಾ ವೈವಿಧ್ಯತೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಡೇಟಾಸೆಟ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಇಬ್ಬರಿಗೂ ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ. ಈ ಪ್ರಯತ್ನವು ಡೇಟಾ ಸಾರ್ವಭೌಮತ್ವವನ್ನು ಸುಧಾರಿಸಲು ಮತ್ತು ವಿದೇಶಿ AI ವ್ಯವಸ್ಥೆಗಳ ಮೇಲಿನ ಅವಲಂಬನೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ.
ದಿ ಸರ್ವಮ್-30B ಮಾದರಿಯು ಕಡಿಮೆ ಸುಪ್ತತೆ ಮತ್ತು ಆರ್ಥಿಕ ಅನುಷ್ಠಾನವನ್ನು ನೀಡುತ್ತದೆ, ಇದು ನೈಜ-ಸಮಯದ ಸಂಭಾಷಣೆಯ ಬಳಕೆಯ ಪ್ರಕರಣಗಳಿಗೆ ಸೂಕ್ತವಾಗಿದೆ. ಸರ್ವಂ-105ಬಿ ಮಾದರಿಯು ಸುಧಾರಿತ ಕಾರ್ಪೊರೇಟ್ ಕಾರ್ಯಾಚರಣೆಗಳು ಮತ್ತು ಸಂಕೀರ್ಣ ತಾರ್ಕಿಕತೆಯ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ.
ಎರಡೂ ಮಾದರಿಗಳು ದಕ್ಷತೆ ಮತ್ತು ಸ್ಕೇಲೆಬಿಲಿಟಿಯನ್ನು ಗರಿಷ್ಠಗೊಳಿಸಲು ಮತ್ತು ಕಂಪ್ಯೂಟೇಶನಲ್ ಅವಶ್ಯಕತೆಗಳಲ್ಲಿ ಅನುಗುಣವಾದ ಹೆಚ್ಚಳವಿಲ್ಲದೆ ಹೆಚ್ಚಿದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲು ಮಿಶ್ರಣ-ತಜ್ಞರ (MoE) ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತವೆ.
ಇದನ್ನೂ ಓದಿ | ಬೆಂಗಳೂರು ಮೂಲದ Gnani.ai ಭಾರತ AI ಶೃಂಗಸಭೆಯಲ್ಲಿ ಧ್ವನಿಯಿಂದ ಧ್ವನಿ AI ಮಾದರಿಯನ್ನು ಅನಾವರಣಗೊಳಿಸಿದೆ
ತಾಂತ್ರಿಕ ವಿಶೇಷಣಗಳು ಸೇರಿವೆ:
ಸರ್ವಂ-30B: 16 ಟ್ರಿಲಿಯನ್ ಟೋಕನ್ಗಳಲ್ಲಿ ಪೂರ್ವ-ತರಬೇತಿಯೊಂದಿಗೆ ಸಮರ್ಥವಾದ ನಿರ್ಣಯಕ್ಕಾಗಿ 32,000-ಟೋಕನ್ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋ.
ಸರ್ವಂ-105B: 9 ಬಿಲಿಯನ್ ಸಕ್ರಿಯ ಪ್ಯಾರಾಮೀಟರ್ಗಳು ಮತ್ತು 128,000-ಟೋಕನ್ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋವನ್ನು ಒಳಗೊಂಡಿದೆ, ಆಳವಾದ ತಾರ್ಕಿಕ ಮತ್ತು ದೀರ್ಘ-ರೂಪದ ಕಾರ್ಯಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.
ತಜ್ಞರ ವಾಸ್ತುಶಿಲ್ಪದ 30B ಮಾದರಿ ಸಂಯೋಜನೆ
30B ಮಾದರಿಯು 16 ಟ್ರಿಲಿಯನ್ ಟೆಕ್ಸ್ಟ್ ಟೋಕನ್ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಮೊದಲಿನಿಂದಲೂ ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ಪರಿಣಿತರ ವಾಸ್ತುಶಿಲ್ಪದ ಮಿಶ್ರಣವಾಗಿದೆ. ಇದು ಒಂದು ಬಿಲಿಯನ್ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳನ್ನು ಹೊಂದಿದೆ. ಈ ಮಾದರಿಯು ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ ಮತ್ತು ಬಳಕೆದಾರ-ಮುಖಾಮುಖಿ ಸಂಭಾಷಣೆಯ ಅನುಭವಗಳನ್ನು ನೀಡುತ್ತದೆ, ಇದು ಉತ್ಪಾದನಾ ಅಪ್ಲಿಕೇಶನ್ಗಳಿಗೆ ನೈಜ-ಸಮಯದ ಸಂವಾದಾತ್ಮಕ ಎಂಜಿನ್ ಮಾಡುತ್ತದೆ.
ಸರ್ವಮ್ 30B ಗಣಿತ, ಕೋಡಿಂಗ್ ಮತ್ತು ಜ್ಞಾನ ಕಾರ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ವಿವಿಧ ಜಾಗತಿಕ ಮಾನದಂಡಗಳ ಮೇಲೆ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು OpenAI ನ GPT-OSS-20B, Alibaba Cloud’s Qwen3-30B, Mistral-3-2-24B, HumanEval ಮತ್ತು MBPP, ಲೈವ್ ಕೋಡ್ ಬೆಂಚ್ v6, ಮತ್ತು Google ನ Gemma 27B ನಂತಹ ಮಾದರಿಗಳೊಂದಿಗೆ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಅಥವಾ ಸ್ಪರ್ಧಾತ್ಮಕವಾಗಿರುತ್ತದೆ.
105B ಮಾದರಿಯು ಸಂಕೀರ್ಣ ತಾರ್ಕಿಕ ಕಾರ್ಯಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ
105B ಮಾದರಿಯು ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ತಾರ್ಕಿಕ ಕಾರ್ಯಗಳಿಗಾಗಿ ಉದ್ದೇಶಿಸಲಾಗಿದೆ. ಇದು 30B ಮಾದರಿಗಿಂತ ಎರಡು ಪಟ್ಟು ಹೆಚ್ಚು ರನ್ ಆಗುತ್ತದೆ ಮತ್ತು ಒಂಬತ್ತು ಬಿಲಿಯನ್ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತದೆ ಎಂದು ಅಂದಾಜಿಸಲಾಗಿದೆ. ಇದು ತನ್ನ ವರ್ಗದಲ್ಲಿ ಉನ್ನತ ಮುಕ್ತ-ಮೂಲ ಮತ್ತು ಮುಚ್ಚಿದ-ಮೂಲದ ಗಡಿ ಮಾದರಿಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ, ಗಣಿತ, ಕೋಡಿಂಗ್ ಮತ್ತು ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು ಕೋಡ್ ಉತ್ಪಾದನೆ ಮತ್ತು ದೋಷ ಪರಿಹಾರಗಳಂತಹ ಸಾಫ್ಟ್ವೇರ್ ಎಂಜಿನಿಯರಿಂಗ್ ಉದ್ಯೋಗಗಳನ್ನು ಮತ್ತಷ್ಟು ಬೆಂಬಲಿಸುತ್ತದೆ.
ಇದನ್ನೂ ಓದಿ: SarvamAI ‘Sarvam Kaze’ ಕನ್ನಡಕಗಳೊಂದಿಗೆ ಧರಿಸಬಹುದಾದ ವಸ್ತುಗಳಲ್ಲಿ ತೊಡಗಿಸಿಕೊಂಡಿದೆ; ಚಾಟ್ ಅನ್ನು ಸಹ ಪ್ರಾರಂಭಿಸಲು
ಶೃಂಗಸಭೆಯಲ್ಲಿ ಮಾತನಾಡಿದ ಸರ್ವಮ್ ಸಹಸಂಸ್ಥಾಪಕ ಪ್ರತ್ಯೂಷ್ ಕುಮಾರ್, ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಕಾರ್ಯಕ್ಷಮತೆಯಲ್ಲಿ ಸರ್ವಂ 105 ಬಿ ಜೆಮಿನಿ 2.5 ಫ್ಲ್ಯಾಶ್ನಂತಹ ದೊಡ್ಡ, ದುಬಾರಿ ಸಾಧನಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ ಎಂದು ಹೇಳಿದರು.
ಈ ಮಾದರಿಯು ಒಂದು ವರ್ಷದ ಹಿಂದೆ ಬಿಡುಗಡೆಯಾದ 600B ಪ್ಯಾರಾಮೀಟರ್ ಮಾದರಿಯಾದ DeepSeek-R1 ಅನ್ನು ಹೆಚ್ಚಿನ ಬೆಂಚ್ಮಾರ್ಕ್ಗಳಲ್ಲಿ ಮೀರಿಸುತ್ತದೆ.
ಸರ್ವಮ್ನ ಮಾದರಿಗಳು ಭಾರತೀಯ ಭಾಷಾ ಸಂದರ್ಭವನ್ನು ನಿರ್ವಹಿಸುವಲ್ಲಿ ಉತ್ತಮವಾಗಿವೆ, ನಿರ್ದಿಷ್ಟವಾಗಿ ಹಿಂಗ್ಲಿಷ್ನಂತಹ ಕೋಡ್-ಮಿಶ್ರಿತ ರೂಪಗಳು ಮತ್ತು ಜೆಮಿನಿಯಂತಹ ದೊಡ್ಡ ಮಾದರಿಗಳನ್ನು ಮೀರಿಸಿವೆ. ಡೆವಲಪರ್ಗಳು ಮತ್ತು ಸರ್ಕಾರಿ ಏಜೆನ್ಸಿಗಳ ನಡುವೆ ಅಳವಡಿಕೆಯನ್ನು ವೇಗಗೊಳಿಸಲು ಮಾದರಿಗಳನ್ನು ಮುಕ್ತ ಮೂಲವಾಗಿ ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡಲು ಕಂಪನಿಯು ಉದ್ದೇಶಿಸಿದೆ.
