Home/Datasets/Gram Vaani Hindi ASR Dataset

ORGANISATION

Gram Vaani Hindi ASR Dataset

Gram Vaani Hindi ASR Dataset

Hindi speech dataset from phone recordings for ASR

About Dataset

The Gram Vaani Hindi ASR dataset consists of telephone-quality speech recordings in Hindi, covering a wide range of dialects across India. It includes ~1000 hours of unlabelled and 105 hours of labelled data (with transcriptions), collected via the Mobile Vaani platform. Accompanying metadata includes speaker location, dialect, emotion, and audio quality.

Dataset Metadata

License

Attribution-Non-Commercial 4.0 International (CC BY-NC 4.0)

Geographical coverage

India

Sector

Science, Technology and Research

Author

Gram Vaani

Source Organisation

OnionDev Technologies Pvt. Ltd.

Uploaded by

Data Quality Score (Beta)

-

Dataset type

Structured

Frequency

Static

Time Granularity

Static

Year range

01/01/2022 - 31/12/2022

Date & Time

25/07/25 09:21:28

Visibility

Open

Hosted / Redirected

Hosted

Activity Overview

0
61
0
268

Tags

speech
Hindi
ASR
transcription
audio

License Control

Attribution-Non-Commercial 4.0 International (CC BY-NC 4.0)

© 2026 - Copyright AIKosh. All rights reserved.