ORGANISATION

shuka-v1

Multilingual audio to text model

About Model

Shuka v1 is an innovative audio understanding model for Indic languages, combining Saaras v1 encoder and Meta's Llama3-8B-Instruct as the decoder. Trained on less than 100 hours of data, it outperforms larger models in audio-based question-answering tasks and supports fine-tuning for customized use cases. Shuka v1 is available open-source, marking the start of advancements in audio language models for Indic languages.

shuka-v1

Metadata

License

CC0 1.0 Public Domain

Hosted By

sarvamai

Task Type

Audio-to-text

Model Format

Transformers

Visibility

Open

Source Organisation

Sarvam AI

Sector

Science, Technology and Research

Updated Date & Time

24/02/25 07:45:11

Created By

Aashay Sachdeva

Size

Activity Overview

3
114
0
2,289

License Control

CC0 1.0 Public Domain

More Models from Sarvam AI

sarvam-30B

Sarvam-30B is an advanced Mixture-of-Experts (MoE) model with 2.4B non-embedding active parameters, designed primarily for practical deployment. It combines strong reasoning, reliable coding ability, and best-in-class conversational quality across Indian languages. Sarvam-30B is built to run reliably in resource-constrained environments and can handle multilingual voice calls while performing tool calls.

MoE Model

4
174
59.92 GB
2,814

Updated 4 month(s) ago

SARVAM AI

View Details

sarvam-105b

Sarvam-105B is an advanced Mixture-of-Experts (MoE) model with 10.3B active parameters, designed for superior performance across a wide range of complex tasks. It is highly optimized for complex reasoning, with particular strength in agentic tasks, mathematics, and coding.

region:us

Transformers

safetensors

sarvam_mla

Text Generation

conversational

custom_code

kok

mai

doi

mni

sat

license:apache-2.0

9
577
0
9,264

Updated 4 month(s) ago

SARVAM AI

View Details

sarvamM

Multilingual, hybrid-reasoning, text-only language model built on Mistral-Small

region:us

Transformers

safetensors

mistral

Text Generation

conversational

base_model:mistralai/Mistral-Small-3.1-24B-Base-2503

base_model:finetune:mistralai/Mistral-Small-3.1-24B-Base-2503

license:apache-2.0

autotrain_compatible

text-generation-inference

endpoints_compatible

1
72
0
1,444

Updated 1 year(s) ago

SARVAM AI

View Details

sarvamtranslate

Translation model for 22 Indian Languages

endpoints_compatible

text-generation-inference

region:us

Transformers

safetensors

gemma3

image-text-to-text

Translation

brx

doi

gom

mai

mni

sat

base_model:google/gemma-3-4b-it

base_model:finetune:google/gemma-3-4b-it

license:gpl-3.0

1
105
0
1,853

Updated 1 year(s) ago

SARVAM AI

View Details

sarvam-1

India's first indic model, pretrained on 4 trillion tokens

3
277
0
5,732

Updated 1 year(s) ago

SARVAM AI

View Details

shuka-v1

Multilingual audio to text model

audio-llms

3
114
0
2,290

Updated 1 year(s) ago

SARVAM AI

View Details

Accessibility options by UX4G

shuka-v1

About Model

shuka-v1

Metadata

Activity Overview

Tags

License Control

More Models from Sarvam AI

AIKosh

Resources

Support