Urdu Short Text Reuse Corpus (USTRC) - Research Portal | Lancaster University

Home > Research > Datasets > Urdu Short Text Reuse Corpus (USTRC)

Electronic data

USTRC.zip
410 KB, multipart/x-zip
Text
Available under license: CC BY-NC-SA

DOI

https://doi.org/10.17635/lancaster/researchdata/192

View graph of relations

Urdu Short Text Reuse Corpus (USTRC)

Dataset

Sara Sameen (Creator)
Sharjeel Muhammad (Creator)
Rao Muhammad Adeel Nawab (Creator)
Paul Rayson (Creator)
Iqra Muneer (Creator)

Description

USTRC is a gold standard benchmark corpus to measure short text reuse in the Urdu language. It contains in total 2,684 source-reused short text pairs.

Date made available	2017
Publisher	Lancaster University
Date of data production	2017

Contact person

rdm@lancaster.ac.uk

Links

UCREL Text Reuse website

Relations

Research outputs

Measuring Short Text Reuse For The Urdu Language
Research output: Contribution to Journal/Magazine › Journal article › peer-review