Home/Datasets/Santham-Anvaya-Parallel

Digital India BHASHI...

ORGANISATION

Santham-Anvaya-Parallel

Santham-Anvaya-Parallel

**Santham** is a high-quality, curated parallel corpus for Sanskrit-Tamil machine translation. This dataset also contains 1000 benchmark sentences.

About Dataset

Sanskrit poetry frequently relies on complex metrical order that hinder direct translation. This repository contains *anvaya* (prose-order reordered) data mapped to poetry to serve as an intermediate translation bridge. | *Anvaya* | 10,146 | Poetry data mapped to *anvaya* (reordered) data. |

Purpose of Dataset

Translation Of Sanskrit Tamil Dataset Using Anvaya As Source.

Dataset Metadata

License

Attribution 4.0 International (CC BY- 4.0)

Geographical coverage

INDIA

Sector

Science, Technology and Research

Author

SKA-Parameswari-IIITH

Source Organisation

Digital India BHASHINI Division

Uploaded by

Data Quality Score (Beta)

4.5

Dataset type

Structured

Frequency

Annually

Time Granularity

Annually

Year range

N.A.

Date & Time

18/03/26 17:24:49

Visibility

Open

Hosted / Redirected

Hosted

Data Type

Primary

Activity Overview

0
7
1.32 MB
154

Tags

Tamil
Parallel Corpus
Sanskrit
parallel sentences
language:tam
language:san
anvaya
Sanskrit-Tamil

License Control

Attribution 4.0 International (CC BY- 4.0)

santham-anvaya ( 1 directories )

santham-anvaya

2 files

Data Quality Score Beta

Version Control

Version 1(1.32 MB)

Nagaraju V·3 month(s) ago
- santham-anvaya
  santham-anvaya

© 2026 - Copyright AIKosh. All rights reserved.