The English-Punjabi Code-Mixed Social Media Content corpus is composed is composed of 893,615 parallel sentences of English-Punjabi distributed over the following domains: - 82,341 parallel sentences of English-Punjabi code-mixed Agriculture Domain Data, - 59,158 parallel sentences of English-Punjabi… Read More code-mixed Culture Domain Data, - 101,732 parallel sentences of English-Punjabi code-mixed Entertainment Domain Data, - 53,622 parallel sentences of English-Punjabi code-mixed Health Domain Data, - 193,844 parallel sentences of English-Punjabi code-mixed Religion Domain Data, - 106,256 parallel sentences of English-Punjabi code-mixed Sports Domain Data, - 37,713 parallel sentences of English-Punjabi code-mixed Technology Domain Data, - 77,183 parallel sentences of English-Punjabi code-mixed Tourism Domain Data, - 63,103 parallel sentences of English-Punjabi code-mixed Education Domain Data, - 119,663 parallel sentences of English-Punjabi code-mixed Entertainment Domain Data.Read Less
View resource description in all available languages
Le corpus « Contenu de médias sociaux en anglais-panjabi » est composé de 893 615 phrases parallèles en anglais-panjabi réparties selon les domaines suivants: - 82 341 phrases parallèles en anglais-panjabi du domaine de l’agriculture, - 59 158 phrases parallèles en anglais-panjabi du domaine de la… Read More culture, - 101 732 phrases parallèles en anglais-panjabi du domaine du divertissement, - 53 622 phrases parallèles en anglais-panjabi du domaine de la santé, - 193 844 phrases parallèles en anglais-panjabi du domaine de la religion, - 106 256 phrases parallèles en anglais-panjabi du domaine du sport, - 37 713 phrases parallèles en anglais-panjabi du domaine de la technologie, - 77 183 phrases parallèles en anglais-panjabi du domaine du tourisme, - 63 103 phrases parallèles en anglais-panjabi du domaine de l’éducation, - 119 663 phrases parallèles en anglais-panjabi du domaine du divertissement.Read Less