Home/Models/Dhwani - Multilingual Speech LLM

ORGANISATION

Dhwani - Multilingual Speech LLM

Dhwani is India's first end-to-end trained speech Large Language Model (LLM), capable of directly understanding speech without a separate ASR (Automatic Speech Recognition) model, avoiding cascading ASR errors. It supports speech-to-text translation across multiple Indic languages and English.

Ola Krutrim
har33sh

About Model

Dhwani is an end-to-end trained speech LLM designed for Indic speech-to-text and multilingual speech translation. Developed by Krutrim AI Labs, Dhwani is powered by Krutrim-1 LLM, enabling direct speech understanding without the need for ASR models. It features a dual encoder structure, utilizing Whisper's speech encoder for processing speech inputs and BEATs audio encoder for non-speech audio signals. The model employs a Window-Level Query Transformer (Q-Former) as a bridge between audio and text processing. Using Low-Rank Adaptation (LoRA) fine-tuning, Dhwani aligns audio-derived inputs with textual output, ensuring accurate speech recognition and translation. It supports English, Bengali, Gujarati, Hindi, Kannada, Malayalam, Marathi, Tamil, and Telugu and excels in use cases like multilingual communication, media translation, education, healthcare, customer support, business, and legal applications. Evaluation results show high BLEU scores for English-to-Indic and Indic-to-English translations, demonstrating its efficiency in real-world scenarios.

Dhwani - Multilingual Speech LLM

Metadata

License

Krutrim Community License Agreement Version 1.0

Hosted By

Ola Krutrim

Model Type

Automatic Speech Recognition

Model Format

N.A.

Visibility

Open

Source Organisation

Ola Krutrim

Sector

Sector Agnostic

Updated Date & Time

28/02/25 07:00:47

Created By

Hareesh Kumar G

Size

Activity Overview

0
153
0
3,483

License Control

Krutrim Community License Agreement Version 1.0

More Models from Ola Krutrim

Krutrim Translate - Indic Language Translation Model

Krutrim Translate is a multilingual machine translation model optimized for Indic languages, supporting English-to-Indic and Indic-to-English translations. It extends IndicTrans2 with a longer context length (4096 tokens) and leverages the Bharat Parallel Corpus Collection (BPCC) for training.

Machine Translation

Indic Languages

Krutrim AI

NLP

Multilingual AI

text-to-text translation

Deep Learning

BharatBench

IndicTrans2

0
57
0
1,563

Updated 1 year(s) ago

OLA KRUTRIM

View Details

Dhwani - Multilingual Speech LLM

BharatBench

conversational-AI

Speech-to-Text

Multilingual AI

Indic Languages

speech LLM

Krutrim AI

ASR-free speech recognition

Translation

Deep Learning

0
153
0
3,484

Updated 1 year(s) ago

OLA KRUTRIM

View Details

Vyakyarth - Multilingual Sentence Embedding Model

Vyakyarth is a sentence-transformers-based model fine-tuned for Indic languages, capable of mapping text to a 768-dimensional dense vector space for semantic search, similarity, classification, and clustering tasks.

NLP

Multilingual AI

Deep Learning

XLM-RoBERTa

Krutrim AI

paraphrase mining

text similarity

semantic search

Indic Languages

sentence embedding

Updated 1 year(s) ago

OLA KRUTRIM

View Details

Chitrarth - Multilingual Vision-Language Model

Chitrarth is a multilingual vision-language model (VLM) integrating a Large Language Model (LLM) with a vision module. It is trained on multilingual image-text data and supports 10 Indic languages along with English.

BharatBench

vision-language model

multimodal AI

Indic Languages

Krutrim AI

image-text AI

Deep Learning

generative AI

NLP

computer vision

1
140
0
1,888

Updated 1 year(s) ago

OLA KRUTRIM

View Details

Krutrim-2 Instruct

Krutrim-2 is a 12B parameter multilingual large language model built on the Mistral-NeMo 12B architecture, optimized for Indic languages and Indian cultural context. It supports long-form conversations, reasoning, coding, and translation tasks.

multilingual NLP

Large Language Model

BharatBench

AI Research

Text Generation

coding AI

generative AI

Deep Learning

Krutrim AI

Indic Languages

Updated 1 year(s) ago

OLA KRUTRIM

View Details

Krutrim-1 Instruct Large Language Model

Krutrim-1 is a 7.3B parameter multilingual foundation model trained on a 2 trillion token dataset, designed for Indian linguistic and demographic needs. It supports 11 Indic languages and matches or exceeds comparable state-of-the-art models in multilingual tasks.

multilingual NLP

Indic Languages

Krutrim AI

Deep Learning

generative AI

Text Generation

AI Research

LLAMA-2 alternative

Large Language Model

0
27
0
1,039

Updated 1 year(s) ago

OLA KRUTRIM

View Details

Accessibility options by UX4G

Dhwani - Multilingual Speech LLM

About Model

Dhwani - Multilingual Speech LLM

Metadata

Activity Overview

Tags

License Control

More Models from Ola Krutrim

AIKosh

Resources

Support