Home/Models/AI4Bharat-IndicConformer-STT-OR-Hybrid-CTC-RNNT-Large (Oriya): Automatic Speech Recognition Model

AI4Bharat-IndicConformer-STT-OR-Hybrid-CTC-RNNT-Large (Oriya): Automatic Speech Recognition Model

A large-scale Automatic Speech Recognition (ASR) model for Oriya, utilizing a hybrid CTC-RNNT decoder.

AI4Bharat
Nikhil_Narasimhan

About Model

The ai4bharat/indicconformer_stt_or_hybrid_ctc_rnnt_large model is an Automatic Speech Recognition (ASR) system designed for the Oriya language. It employs a Conformer-Large architecture with 120 million parameters, featuring 17 conformer blocks and a model dimension of 512. This model processes 16 kHz mono-channel audio (wav files) and outputs transcriptions in Oriya. Its hybrid CTC-RNNT decoder enhances recognition performance for spoken Oriya.

AI4Bharat-IndicConformer-STT-OR-Hybrid-CTC-RNNT-Large (Oriya): Automatic Speech Recognition Model

Metadata

License

MIT

Hosted By

AI4Bharat

Model Type

Audio-to-text

Model Format

N.A.

Visibility

Open

Source organisation

AI4Bharat

Sector

Sector Agnostic

Updated Date & Time

21/02/25 13:21:34

Created By

Nikhil Narasimhan

Size

Activity Overview

License Control

MIT

More Models from AI4Bharat

AI4Bharat- 500 M - RomanSetu Multilingual Native-to-Roman Model

RomanSetu is a multilingual continual pretrained transformer model designed for transliteration across six Indic languages

Llama

Instruction-Tuning

Multilingual

LLaMA2

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat- 400 M - RomanSetu Multilingual Native-to-Roman Model

RomanSetu is a multilingual continual pretrained transformer model designed for transliteration across six Indic languages

Multilingual

LLaMA2

Llama

Instruction-Tuning

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Maithili - IndicConformer Automatic Speech Recognition (ASR) Model

This model takes in mono-channel audio files at a 16,000 Hz sampling rate (WAV format) and outputs the transcribed text of the speech contained in the audio.

Automatic Speech Recognition

Speech-to-Text

NLP

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Konkani - IndicConformer Automatic Speech Recognition (ASR) Model

Automatic Speech Recognition (ASR) model for Konkani speech recognition, processing 16,000 KHz mono WAV audio and transcribing spoken content into text

Speech-to-Text

NLP

Automatic Speech Recognition

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Kashmiri - IndicConformer Automatic Speech Recognition (ASR) Model

This Automatic Speech Recognition (ASR) model transcribes Kashmiri speech from 16,000 KHz mono WAV audio files into text

NLP

Speech-to-Text

Kashmiri

Automatic Speech Recognition

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat - Romansetu-200M -Multilingual LLM for Indian langauges using romanization

RomanSetu is Efficiently unlocking multilingual (Indian Languages) capabilities of Large Language Models via Romanization.

Llama

Instruction-Tuning

Multilingual

LLaMA2

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat - Romansetu-100M - Multilingual LLM for Indian langauges using romanization

RomanSetu is Efficiently unlocking multilingual (Indian Languages) capabilities of Large Language Models via Romanization.

Multilingual

LLaMA2

Llama

Instruction-Tuning

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Kannada - IndicConformer Automatic Speech Recognition (ASR) Model

This Kannada Automatic Speech Recognition (ASR) model transcribes 16kHz mono-channel audio into text. It utilizes a Conformer-Large architecture with 120M parameters and a hybrid CTC-RNNT decoder for high-accuracy speech recognition.

Automatic Speech Recognition

Audio Processing

NLP

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat – Romanized Path – Base to Supervised Fine-Tuning (SFT)

Romansetu model is built on base pretrained model which is supervised fine tuned on instuction-following tasks using romanized Indian languages.

Instruction-Tuning

Llama

LLaMA2

Multilingual

Updated 10 month(s) ago

AI4BHARAT

View Details

AI4Bharat-IndicTrans2 Large-1B -English-to-Hindi (Devanagari) â€“ : Language Translation Model

A large-scale neural machine translation (NMT) model for translating English to Hindi (Devanagari) language, leveraging 1 billion parameters for high-quality translations.

Multilingual

Transformer

cross-lingual

high-quality-translation

Large Model

low-resource-NLP

NLP

Machine Translation

Updated 10 month(s) ago

AI4BHARAT

View Details

Accessibility options by UX4G

AI4Bharat-IndicConformer-STT-OR-Hybrid-CTC-RNNT-Large (Oriya): Automatic Speech Recognition Model

About Model

AI4Bharat-IndicConformer-STT-OR-Hybrid-CTC-RNNT-Large (Oriya): Automatic Speech Recognition Model

Metadata

Activity Overview

Tags

License Control

More Models from AI4Bharat

AIKosh

Resources

Support