Advertisement
Advertisement

ಸರ್ವಂ AI ಭಾರತದ ಸಾರ್ವಭೌಮ ನಿಯೋಜನೆಗೆ ಶಕ್ತಿ ನೀಡಲು ಸ್ಥಳೀಯ 30B ಮತ್ತು 105B LLM ಗಳನ್ನು ಪ್ರಾರಂಭಿಸುತ್ತದೆ

Sarvam ai 2026 02 b7ea39dbfe5a9d84fd709c185b2141b0.jpg


ಬೆಂಗಳೂರು ಮೂಲದ ಸ್ಟಾರ್ಟಪ್ ಸರ್ವಮ್ ಎಐ ಎರಡು ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಗಳನ್ನು (ಎಲ್‌ಎಲ್‌ಎಂ) ಪರಿಚಯಿಸಿದೆ-ಸರ್ವಂ-30ಬಿ ಮತ್ತು ಸರ್ವಂ-105ಬಿ-ಇವುಗಳು ಭಾರತದಲ್ಲಿ ಸಂಪೂರ್ಣವಾಗಿ ಅಭಿವೃದ್ಧಿಗೊಂಡಿವೆ. ಸರ್ಕಾರ, ಕಂಪನಿಗಳು ಮತ್ತು ಡೆವಲಪರ್‌ಗಳಾದ್ಯಂತ ಬಹುಭಾಷಾ, ಭಾರತ-ಕೇಂದ್ರಿತ ನಿಯೋಜನೆಗಳಿಗೆ ಸಹಾಯ ಮಾಡಲು ಅಭಿವೃದ್ಧಿಪಡಿಸಲಾಗಿದೆ, ಈ ಮಾದರಿಗಳನ್ನು ಇಂಡಿಯಾ AI ಇಂಪ್ಯಾಕ್ಟ್ ಶೃಂಗಸಭೆ 2026 ರಲ್ಲಿ ಪ್ರಾರಂಭಿಸಲಾಯಿತು.

ಭಾರತ ಸರ್ಕಾರ ಆಯ್ಕೆ ಮಾಡಿದೆ ಸರ್ವಂ ಎಐ ಏಪ್ರಿಲ್ 2025 ರಲ್ಲಿ, ರಾಷ್ಟ್ರದ ಮೊದಲ ಸ್ವಾಯತ್ತ ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಯನ್ನು ರಚಿಸಲು IndiaAI ಮಿಷನ್‌ನ ಭಾಗವಾಗಿ. ದಿ ಹಿಂದೂ ಬ್ಯುಸಿನೆಸ್ ಲೈನ್ ವರದಿ ಮಾಡಿರುವಂತೆ ಸರ್ವಮ್ ಜೊತೆಗೆ, ಭಾರತದ AI ಪರಿಸರ ವ್ಯವಸ್ಥೆಯನ್ನು ಮತ್ತಷ್ಟು ಹೆಚ್ಚಿಸಲು ಇತರ 11 ವ್ಯವಹಾರಗಳನ್ನು ಸಹ ಆಯ್ಕೆ ಮಾಡಲಾಗಿದೆ.

ಮಾದರಿ ಸಾಮರ್ಥ್ಯಗಳು ಮತ್ತು ವಾಸ್ತುಶಿಲ್ಪ
30-ಬಿಲಿಯನ್-ಪ್ಯಾರಾಮೀಟರ್ ಮಾದರಿ ಮತ್ತು 150-ಬಿಲಿಯನ್-ಪ್ಯಾರಾಮೀಟರ್ ಮಾದರಿ – ಸರ್ವಂ ಪ್ರಕಾರ, ತಮಿಳು-ಇಂಗ್ಲಿಷ್ ಮತ್ತು ಹಿಂಗ್ಲಿಷ್‌ನಂತಹ ಕೋಡ್-ಮಿಶ್ರಿತ ಭಾಷೆಗಳನ್ನು ಒಳಗೊಂಡಂತೆ ಭಾರತದ ಭಾಷಾ ವೈವಿಧ್ಯತೆಯನ್ನು ಪ್ರತಿನಿಧಿಸುವ ಡೇಟಾಸೆಟ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಇಬ್ಬರಿಗೂ ಮೊದಲಿನಿಂದ ತರಬೇತಿ ನೀಡಲಾಗಿದೆ. ಈ ಪ್ರಯತ್ನವು ಡೇಟಾ ಸಾರ್ವಭೌಮತ್ವವನ್ನು ಸುಧಾರಿಸಲು ಮತ್ತು ವಿದೇಶಿ AI ವ್ಯವಸ್ಥೆಗಳ ಮೇಲಿನ ಅವಲಂಬನೆಯನ್ನು ಕಡಿಮೆ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತದೆ.

ದಿ ಸರ್ವಮ್-30B ಮಾದರಿಯು ಕಡಿಮೆ ಸುಪ್ತತೆ ಮತ್ತು ಆರ್ಥಿಕ ಅನುಷ್ಠಾನವನ್ನು ನೀಡುತ್ತದೆ, ಇದು ನೈಜ-ಸಮಯದ ಸಂಭಾಷಣೆಯ ಬಳಕೆಯ ಪ್ರಕರಣಗಳಿಗೆ ಸೂಕ್ತವಾಗಿದೆ. ಸರ್ವಂ-105ಬಿ ಮಾದರಿಯು ಸುಧಾರಿತ ಕಾರ್ಪೊರೇಟ್ ಕಾರ್ಯಾಚರಣೆಗಳು ಮತ್ತು ಸಂಕೀರ್ಣ ತಾರ್ಕಿಕತೆಯ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ.

ಎರಡೂ ಮಾದರಿಗಳು ದಕ್ಷತೆ ಮತ್ತು ಸ್ಕೇಲೆಬಿಲಿಟಿಯನ್ನು ಗರಿಷ್ಠಗೊಳಿಸಲು ಮತ್ತು ಕಂಪ್ಯೂಟೇಶನಲ್ ಅವಶ್ಯಕತೆಗಳಲ್ಲಿ ಅನುಗುಣವಾದ ಹೆಚ್ಚಳವಿಲ್ಲದೆ ಹೆಚ್ಚಿದ ಕಾರ್ಯಕ್ಷಮತೆಯನ್ನು ಸಕ್ರಿಯಗೊಳಿಸಲು ಮಿಶ್ರಣ-ತಜ್ಞರ (MoE) ವಾಸ್ತುಶಿಲ್ಪವನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತವೆ.

ಇದನ್ನೂ ಓದಿ | ಬೆಂಗಳೂರು ಮೂಲದ Gnani.ai ಭಾರತ AI ಶೃಂಗಸಭೆಯಲ್ಲಿ ಧ್ವನಿಯಿಂದ ಧ್ವನಿ AI ಮಾದರಿಯನ್ನು ಅನಾವರಣಗೊಳಿಸಿದೆ

ತಾಂತ್ರಿಕ ವಿಶೇಷಣಗಳು ಸೇರಿವೆ:

ಸರ್ವಂ-30B: 16 ಟ್ರಿಲಿಯನ್ ಟೋಕನ್‌ಗಳಲ್ಲಿ ಪೂರ್ವ-ತರಬೇತಿಯೊಂದಿಗೆ ಸಮರ್ಥವಾದ ನಿರ್ಣಯಕ್ಕಾಗಿ 32,000-ಟೋಕನ್ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋ.

ಸರ್ವಂ-105B: 9 ಬಿಲಿಯನ್ ಸಕ್ರಿಯ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳು ಮತ್ತು 128,000-ಟೋಕನ್ ಕಾಂಟೆಕ್ಸ್ಟ್ ವಿಂಡೋವನ್ನು ಒಳಗೊಂಡಿದೆ, ಆಳವಾದ ತಾರ್ಕಿಕ ಮತ್ತು ದೀರ್ಘ-ರೂಪದ ಕಾರ್ಯಗಳನ್ನು ಸಕ್ರಿಯಗೊಳಿಸುತ್ತದೆ.

ತಜ್ಞರ ವಾಸ್ತುಶಿಲ್ಪದ 30B ಮಾದರಿ ಸಂಯೋಜನೆ

30B ಮಾದರಿಯು 16 ಟ್ರಿಲಿಯನ್ ಟೆಕ್ಸ್ಟ್ ಟೋಕನ್‌ಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಮೊದಲಿನಿಂದಲೂ ಪೂರ್ವ-ತರಬೇತಿ ಪಡೆದ ಪರಿಣಿತರ ವಾಸ್ತುಶಿಲ್ಪದ ಮಿಶ್ರಣವಾಗಿದೆ. ಇದು ಒಂದು ಬಿಲಿಯನ್ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳನ್ನು ಹೊಂದಿದೆ. ಈ ಮಾದರಿಯು ಭಾರತೀಯ ಭಾಷೆಗಳನ್ನು ಬೆಂಬಲಿಸುತ್ತದೆ ಮತ್ತು ಬಳಕೆದಾರ-ಮುಖಾಮುಖಿ ಸಂಭಾಷಣೆಯ ಅನುಭವಗಳನ್ನು ನೀಡುತ್ತದೆ, ಇದು ಉತ್ಪಾದನಾ ಅಪ್ಲಿಕೇಶನ್‌ಗಳಿಗೆ ನೈಜ-ಸಮಯದ ಸಂವಾದಾತ್ಮಕ ಎಂಜಿನ್ ಮಾಡುತ್ತದೆ.

ಸರ್ವಮ್ 30B ಗಣಿತ, ಕೋಡಿಂಗ್ ಮತ್ತು ಜ್ಞಾನ ಕಾರ್ಯಗಳನ್ನು ಒಳಗೊಂಡಿರುವ ವಿವಿಧ ಜಾಗತಿಕ ಮಾನದಂಡಗಳ ಮೇಲೆ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು OpenAI ನ GPT-OSS-20B, Alibaba Cloud’s Qwen3-30B, Mistral-3-2-24B, HumanEval ಮತ್ತು MBPP, ಲೈವ್ ಕೋಡ್ ಬೆಂಚ್ v6, ಮತ್ತು Google ನ Gemma 27B ನಂತಹ ಮಾದರಿಗಳೊಂದಿಗೆ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಅಥವಾ ಸ್ಪರ್ಧಾತ್ಮಕವಾಗಿರುತ್ತದೆ.

105B ಮಾದರಿಯು ಸಂಕೀರ್ಣ ತಾರ್ಕಿಕ ಕಾರ್ಯಗಳ ಮೇಲೆ ಕೇಂದ್ರೀಕರಿಸುತ್ತದೆ

105B ಮಾದರಿಯು ಹೆಚ್ಚು ಸಂಕೀರ್ಣವಾದ ತಾರ್ಕಿಕ ಕಾರ್ಯಗಳಿಗಾಗಿ ಉದ್ದೇಶಿಸಲಾಗಿದೆ. ಇದು 30B ಮಾದರಿಗಿಂತ ಎರಡು ಪಟ್ಟು ಹೆಚ್ಚು ರನ್ ಆಗುತ್ತದೆ ಮತ್ತು ಒಂಬತ್ತು ಬಿಲಿಯನ್ ಸಕ್ರಿಯ ನಿಯತಾಂಕಗಳನ್ನು ಬಳಸಿಕೊಳ್ಳುತ್ತದೆ ಎಂದು ಅಂದಾಜಿಸಲಾಗಿದೆ. ಇದು ತನ್ನ ವರ್ಗದಲ್ಲಿ ಉನ್ನತ ಮುಕ್ತ-ಮೂಲ ಮತ್ತು ಮುಚ್ಚಿದ-ಮೂಲದ ಗಡಿ ಮಾದರಿಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ, ಗಣಿತ, ಕೋಡಿಂಗ್ ಮತ್ತು ಭಾರತೀಯ ಭಾಷೆಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು ಕೋಡ್ ಉತ್ಪಾದನೆ ಮತ್ತು ದೋಷ ಪರಿಹಾರಗಳಂತಹ ಸಾಫ್ಟ್‌ವೇರ್ ಎಂಜಿನಿಯರಿಂಗ್ ಉದ್ಯೋಗಗಳನ್ನು ಮತ್ತಷ್ಟು ಬೆಂಬಲಿಸುತ್ತದೆ.

ಇದನ್ನೂ ಓದಿ: SarvamAI ‘Sarvam Kaze’ ಕನ್ನಡಕಗಳೊಂದಿಗೆ ಧರಿಸಬಹುದಾದ ವಸ್ತುಗಳಲ್ಲಿ ತೊಡಗಿಸಿಕೊಂಡಿದೆ; ಚಾಟ್ ಅನ್ನು ಸಹ ಪ್ರಾರಂಭಿಸಲು

ಶೃಂಗಸಭೆಯಲ್ಲಿ ಮಾತನಾಡಿದ ಸರ್ವಮ್ ಸಹಸಂಸ್ಥಾಪಕ ಪ್ರತ್ಯೂಷ್ ಕುಮಾರ್, ಭಾರತೀಯ ಭಾಷೆಗಳಿಗೆ ಕಾರ್ಯಕ್ಷಮತೆಯಲ್ಲಿ ಸರ್ವಂ 105 ಬಿ ಜೆಮಿನಿ 2.5 ಫ್ಲ್ಯಾಶ್‌ನಂತಹ ದೊಡ್ಡ, ದುಬಾರಿ ಸಾಧನಗಳನ್ನು ಮೀರಿಸುತ್ತದೆ ಎಂದು ಹೇಳಿದರು.

ಈ ಮಾದರಿಯು ಒಂದು ವರ್ಷದ ಹಿಂದೆ ಬಿಡುಗಡೆಯಾದ 600B ಪ್ಯಾರಾಮೀಟರ್ ಮಾದರಿಯಾದ DeepSeek-R1 ಅನ್ನು ಹೆಚ್ಚಿನ ಬೆಂಚ್‌ಮಾರ್ಕ್‌ಗಳಲ್ಲಿ ಮೀರಿಸುತ್ತದೆ.

ಸರ್ವಮ್‌ನ ಮಾದರಿಗಳು ಭಾರತೀಯ ಭಾಷಾ ಸಂದರ್ಭವನ್ನು ನಿರ್ವಹಿಸುವಲ್ಲಿ ಉತ್ತಮವಾಗಿವೆ, ನಿರ್ದಿಷ್ಟವಾಗಿ ಹಿಂಗ್ಲಿಷ್‌ನಂತಹ ಕೋಡ್-ಮಿಶ್ರಿತ ರೂಪಗಳು ಮತ್ತು ಜೆಮಿನಿಯಂತಹ ದೊಡ್ಡ ಮಾದರಿಗಳನ್ನು ಮೀರಿಸಿವೆ. ಡೆವಲಪರ್‌ಗಳು ಮತ್ತು ಸರ್ಕಾರಿ ಏಜೆನ್ಸಿಗಳ ನಡುವೆ ಅಳವಡಿಕೆಯನ್ನು ವೇಗಗೊಳಿಸಲು ಮಾದರಿಗಳನ್ನು ಮುಕ್ತ ಮೂಲವಾಗಿ ಸಾರ್ವಜನಿಕವಾಗಿ ಲಭ್ಯವಾಗುವಂತೆ ಮಾಡಲು ಕಂಪನಿಯು ಉದ್ದೇಶಿಸಿದೆ.



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

TOP