Home/Datasets/Bengali to Punjabi Translation Benchmark Dataset

Shailendra Pal Singh

Digital India BHASHI...

ORGANISATION

Bengali to Punjabi Translation Benchmark Dataset

Bengali to Punjabi Translation Benchmark Dataset

Bhashini's Bengali-Punjabi Translation Benchmark is a detailed text dataset for testing machine translation quality. It includes document-level information and helps researchers build better multilingual translation systems.

About Dataset

The dataset NTREX_bn_pa_benchmark provides news test references for Machine Translation (MT) evaluation, focusing on translations from Bengali to Punjabi. Part of a broader collection supporting translations into 128 target languages, this dataset includes document-level information, making it ideal for multilingual MT benchmarking. Tailored for the news domain, it serves as a comprehensive resource for assessing translation quality and advancing translation systems. Submitted by Microsoft, this dataset is a critical tool for researchers and developers working on Bengali-to-Punjabi translation tasks.

Dataset Metadata

License

Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

Geographical coverage

NA

Sector

Sector Agnostic

Author

Microsoft

Source Organisation

Digital India BHASHINI Division

Uploaded by

Shailendra Pal Singh

Data Quality Score (Beta)

4.75

Dataset type

Unstructured

Frequency

NA

Time Granularity

NA

Year range

N.A.

Date & Time

24/02/25 13:18:49

Visibility

Open

Hosted / Redirected

Hosted

Activity Overview

0
11
1.36 MB
166

Tags

Translation
Document-Level Evaluation
NLP Dataset
Language Modeling
Bilingual Translation
Bengali-Punjabi
Benchmark
News Domain
Machine Translation
Microsoft

License Control

Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)

data.json ( 1.36 MB )

To preview this file, you need to be a registered user. Please complete the registration process to gain access and continue viewing the content.

Data Quality Score Beta

Version Control

Version 1(1.36 MB)

admin·1 year(s) ago
- data.json
- params.json

© 2026 - Copyright AIKosh. All rights reserved.