భారతీయ AI రంగంలో విప్లవం: ‘సర్వం అక్షర్’తో డాక్యుమెంట్ ఇంటెలిజెన్స్ సరికొత్త పుంతలు

సర్వం AI తన కొత్త టూల్ 'సర్వం అక్షర్'ను విడుదల చేసింది. ఇది భారతీయ భాషల్లో గూగుల్ జెమిని, GPT-5 కంటే మెరుగ్గా పనిచేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

📌 ముఖ్యాంశాలు :

• సర్వం AI తన సరికొత్త డాక్యుమెంట్ ఇంటెలిజెన్స్ టూల్ ‘అక్షర్’ను విడుదల చేసింది.

• ఇది ఇంగ్లీష్‌తో పాటు 22 భారతీయ భాషల్లో అత్యంత ఖచ్చితత్వంతో పనిచేస్తుంది.

• గూగుల్ జెమిని, GPT-5 వంటి గ్లోబల్ మోడళ్లను ఇండిక్ లాంగ్వేజ్ బెంచ్‌మార్క్‌లలో అధిగమించింది.

• పాతకాలపు పత్రాలు, క్లిష్టమైన లేఅవుట్‌లను కూడా సులభంగా డిజిటలైజ్ చేస్తుంది.

━━━━━━━━━━━━━━━━━━━━━━━

సర్వం అక్షర్ AI టూల్ క్లిష్టమైన భారతీయ భాషా పత్రాలను విశ్లేషిస్తున్న దృశ్యం.

భారతదేశం వంటి బహుభాషా దేశంలో డిజిటలైజేషన్ అనేది అతిపెద్ద సవాలు. ముఖ్యంగా ప్రభుత్వ రికార్డులు, చారిత్రక పత్రాలు మరియు క్లిష్టమైన డాక్యుమెంట్లను స్కాన్ చేసి టెక్స్ట్‌గా మార్చడంలో పాతకాలపు టెక్నాలజీ (OCR) విఫలమవుతోంది. ఈ సమస్యకు పరిష్కారంగా, ప్రముఖ భారతీయ AI స్టార్టప్ ‘సర్వం AI’ తాజాగా సర్వం అక్షర్ (Sarvam Akshar) అనే వినూత్న టూల్‌ను పరిచయం చేసింది. ఇది ఫిబ్రవరి 15, 2026న అధికారికంగా విడుదలైంది. సర్వం విజన్ (Sarvam Vision) అనే శక్తివంతమైన మోడల్ ఆధారంగా రూపొందించబడిన ఈ టూల్, డాక్యుమెంట్ల నుంచి సమాచారాన్ని సేకరించడమే కాకుండా, వాటిని లోతుగా విశ్లేషించగలదు.

సర్వం విజన్ అనేది 3 బిలియన్ పారామీటర్లతో కూడిన అత్యాధునిక విజన్-లాంగ్వేజ్ మోడల్. ఇది ఇంగ్లీష్ మరియు 22 భారతీయ భాషల్లో డాక్యుమెంట్ ఇంటెలిజెన్స్ కోసం ప్రత్యేకంగా రూపొందించబడింది. ఆశ్చర్యకరమైన విషయం ఏమిటంటే, ఈ మోడల్ గ్లోబల్ బెంచ్‌మార్క్‌లైన olmOCR-Bench మరియు OmniDocBench లలో ఇంగ్లీష్ విభాగంలో టాప్ స్కోర్‌లను సాధించింది. అంతేకాకుండా, భారతీయ భాషల విషయానికి వస్తే, ‘సర్వం ఇండిక్ OCR బెంచ్’లో Gemini 3 Pro, Opus 4.5 మరియు GPT-5.2 వంటి అంతర్జాతీయ దిగ్గజ మోడళ్లను కూడా అధిగమించి అత్యుత్తమ ఖచ్చితత్వాన్ని నమోదు చేసింది.

ప్రస్తుతం మార్కెట్లో ఉన్న పాత OCR (Optical Character Recognition) వ్యవస్థలు, అంటే టెస్సెరాక్ట్ (Tesseract) లేదా గూగుల్ క్లౌడ్ విజన్ వంటివి, అన్-స్ట్రక్చర్డ్ డాక్యుమెంట్లను ప్రాసెస్ చేసేటప్పుడు తీవ్రమైన ఇబ్బందులను ఎదుర్కొంటాయి. ఇవి అక్షరాలను విడివిడిగా గుర్తిస్తాయి కానీ, ఆ పేజీ యొక్క సందర్భాన్ని లేదా లేఅవుట్‌ను అర్థం చేసుకోలేవు. ఉదాహరణకు, ఒక పేజీలో రెండు మూడు కాలమ్స్ ఉంటే, పాత సిస్టమ్‌లు వాటిని వరుసగా చదివేస్తాయి, దీనివల్ల సమాచారం తారుమారవుతుంది. ముఖ్యంగా భారతీయ భాషల్లోని ఒత్తులు, దీర్ఘాలు (Matras) వంటి వాటిని గుర్తించడంలో ఇవి తరచుగా తప్పులు చేస్తుంటాయి.

మరోవైపు, అధునాతన మల్టీమోడల్ మోడల్స్ (VLMs) కొంతవరకు మెరుగ్గా పనిచేస్తున్నప్పటికీ, సంక్లిష్టమైన పత్రాల దగ్గరకు వచ్చేసరికి అవి కూడా తడబడుతున్నాయి. పాత కాలపు వార్తాపత్రికలు, గ్రాఫ్‌లు ఉన్న మ్యాగజైన్లు లేదా చారిత్రక పత్రాలను ప్రాసెస్ చేసేటప్పుడు ఇవి తప్పుడు సమాచారాన్ని (Hallucinations) సృష్టిస్తున్నాయి. ఈ గ్యాప్‌ను భర్తీ చేయడానికే సర్వం AI ‘అక్షర్’ను తీసుకొచ్చింది. ఇది కేవలం టెక్స్ట్‌ను వెలికితీయడమే కాకుండా, ఆ టెక్స్ట్ పేజీలో ఎక్కడ ఉంది (Visual Grounding), దాని లేఅవుట్ ఎలా ఉంది అనే అంశాలను విశ్లేషించి ఆటోమేటెడ్ ప్రూఫ్ రీడింగ్‌ను కూడా చేస్తుంది.

1800వ కాలం నాటి పాత గుజరాతీ లేదా తమిళ రాతప్రతులను డిజిటలైజ్ చేయడాన్ని ఒక ఉదాహరణగా తీసుకుంటే, సాధారణ AI మోడళ్లు వాటిలోని పాత అక్షరాలను ఇప్పటి కాలపు స్పెల్లింగ్‌లుగా తప్పుగా మారుస్తాయి. దీనివల్ల ఒక భాషా నిపుణుడు కూర్చుని ప్రతి లైన్‌ను సరిచూడాల్సి ఉంటుంది. ఇది చాలా సమయం తీసుకునే ప్రక్రియ. కానీ ‘అక్షర్’ టూల్ తన ఏజెంట్ లూప్ ద్వారా ఎక్కడైతే అక్షరాలపై సందేహం ఉందో వాటిని ముందే గుర్తిస్తుంది. దీనివల్ల ఒక నిపుణుడు గంటల తరబడి చేసే పనిని కేవలం కొద్ది నిమిషాల్లోనే పూర్తి చేయవచ్చు.

తెలంగాణ ప్రభుత్వం మరియు కేంద్ర ప్రభుత్వ సంస్థలు తమ పాత రికార్డులను భద్రపరచడానికి, డిజిటలైజ్ చేయడానికి ఇలాంటి స్వదేశీ సాంకేతికతను ఉపయోగించుకోవడం ద్వారా అద్భుతమైన ఫలితాలను సాధించవచ్చు. డిజిటల్ ఇండియా మిషన్‌లో భాగంగా ప్రతి సామాన్యుడికి వారి సొంత భాషలో సమాచారం అందాలంటే, ఇలాంటి టూల్స్ అత్యంత కీలకం. RBI వంటి సంస్థలు కూడా తమ వద్ద ఉన్న భారీ డాక్యుమెంట్లను డేటాగా మార్చడానికి ‘అక్షర్’ వంటి టూల్స్‌ను వినియోగించుకునే అవకాశం ఉంది. భవిష్యత్తులో భారతీయ భాషా విజ్ఞానాన్ని భద్రపరచడంలో సర్వం AI ఒక మైలురాయిగా నిలుస్తుందని చెప్పడంలో ఎలాంటి సందేహం లేదు.

అధికారిక సమాచారం కోసం ఈ వనరులు చూడండి:

Sarvam AI Official Blog – https://www.sarvam.ai/blog

India AI Mission – https://indiaai.gov.in

Ministry of Electronics and IT – https://www.meity.gov.in

అత్యంత ఖచ్చితమైన సమాచారం కోసం పై అధికారిక వనరులను సందర్శించండి.

గమనిక: ఈ కథనం అధికారిక సమాచారం మరియు ప్రజా వనరుల ఆధారంగా రూపొందించబడింది. పూర్తి వివరాల కోసం అధికారిక వెబ్‌సైట్లను పరిశీలించాలి.

Leave a Reply

Your email address will not be published. Required fields are marked *