Home/Models/AI4Bharat: Sentence-specific Headline Generation Multindic Model

AI4Bharat: Sentence-specific Headline Generation Multindic Model

It is a multilingual, sequence-to-sequence pre-trained model fine-tuned on the IndicBARTSS checkpoint for headline generation and summarization tasks across 11 Indian languages.

AI4Bharat
Nikhil_Narasimhan

About Model

It is a sequence-to-sequence pre-trained model focusing on 11 Indian languages: Hindi, Marathi, Punjabi, Tamil, Telugu, Bengali, Gujarati etc. It is fine-tuned on the IndicBARTSS checkpoint and can be used for tasks like summarization, headline generation, and other related applications in Indian languages. The model is smaller than mBART and mT5, making it computationally efficient for fine-tuning and decoding. Trained on a large corpus of 1.316 million paragraphs and 5.9 million unique tokens, it supports each language in its own script, eliminating the need for Devanagari script mapping.

AI4Bharat: Sentence-specific Headline Generation Multindic Model

Metadata

License

MIT

Hosted By

Aman Kumar, Himani Shrotriya, Prachi Sahu, Raj Dabre, Ratish Puduppully, Anoop Kunchukuttan, Amogh Mishra, Mitesh M. Khapra, Pratyush Kumar

Model Type

Text Summarization

Model Format

N.A.

Visibility

Open

Source organisation

AI4Bharat

Sector

Sector Agnostic

Updated Date & Time

21/02/25 13:20:55

Created By

Nikhil Narasimhan

Size

Activity Overview

License Control

MIT

More Models from AI4Bharat

AI4Bharat- 500 M - RomanSetu Multilingual Native-to-Roman Model

RomanSetu is a multilingual continual pretrained transformer model designed for transliteration across six Indic languages

Instruction-Tuning

LLaMA2

Multilingual

Llama

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat- 400 M - RomanSetu Multilingual Native-to-Roman Model

RomanSetu is a multilingual continual pretrained transformer model designed for transliteration across six Indic languages

Multilingual

Llama

Instruction-Tuning

LLaMA2

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Maithili - IndicConformer Automatic Speech Recognition (ASR) Model

This model takes in mono-channel audio files at a 16,000 Hz sampling rate (WAV format) and outputs the transcribed text of the speech contained in the audio.

Automatic Speech Recognition

Speech-to-Text

NLP

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Konkani - IndicConformer Automatic Speech Recognition (ASR) Model

Automatic Speech Recognition (ASR) model for Konkani speech recognition, processing 16,000 KHz mono WAV audio and transcribing spoken content into text

Speech-to-Text

NLP

Automatic Speech Recognition

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Kashmiri - IndicConformer Automatic Speech Recognition (ASR) Model

This Automatic Speech Recognition (ASR) model transcribes Kashmiri speech from 16,000 KHz mono WAV audio files into text

Kashmiri

Speech-to-Text

NLP

Automatic Speech Recognition

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat - Romansetu-200M -Multilingual LLM for Indian langauges using romanization

RomanSetu is Efficiently unlocking multilingual (Indian Languages) capabilities of Large Language Models via Romanization.

Instruction-Tuning

LLaMA2

Llama

Multilingual

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat - Romansetu-100M - Multilingual LLM for Indian langauges using romanization

RomanSetu is Efficiently unlocking multilingual (Indian Languages) capabilities of Large Language Models via Romanization.

Llama

Multilingual

Instruction-Tuning

LLaMA2

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat- Kannada - IndicConformer Automatic Speech Recognition (ASR) Model

This Kannada Automatic Speech Recognition (ASR) model transcribes 16kHz mono-channel audio into text. It utilizes a Conformer-Large architecture with 120M parameters and a hybrid CTC-RNNT decoder for high-accuracy speech recognition.

Automatic Speech Recognition

Audio Processing

NLP

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat – Romanized Path – Base to Supervised Fine-Tuning (SFT)

Romansetu model is built on base pretrained model which is supervised fine tuned on instuction-following tasks using romanized Indian languages.

LLaMA2

Instruction-Tuning

Multilingual

Llama

Updated 7 month(s) ago

AI4BHARAT

View Details

AI4Bharat-IndicTrans2 Large-1B -English-to-Hindi (Devanagari) â€“ : Language Translation Model

A large-scale neural machine translation (NMT) model for translating English to Hindi (Devanagari) language, leveraging 1 billion parameters for high-quality translations.

Machine Translation

Transformer

low-resource-NLP

high-quality-translation

Large Model

cross-lingual

NLP

Multilingual

Updated 7 month(s) ago

AI4BHARAT

View Details

Accessibility options by UX4G

AI4Bharat: Sentence-specific Headline Generation Multindic Model

About Model

AI4Bharat: Sentence-specific Headline Generation Multindic Model

Metadata

Activity Overview

Tags

License Control

More Models from AI4Bharat

AIKosh

Resources

Support