diff --git a/pywikibot/fixes.py b/pywikibot/fixes.py index 5922b06..11873f6 100644 --- a/pywikibot/fixes.py +++ b/pywikibot/fixes.py @@ -28,7 +28,7 @@ parameter_help = """ in German * music - Links auf Begriffsklärungen in German * datum - specific date formats in German - * correct-ar - Corrections for Arabic Wikipedia and any + * correct-ar - Typo corrections for Arabic Wikipedia and any Arabic wiki. * yu-tld - Fix links to .yu domains because it is disabled, see: @@ -440,11 +440,11 @@ fixes = { } }, - # Corrections for Arabic Wikipedia and any Arabic wiki. - # python pwb.py replace -fix:correct-ar -start:! -always + # Typo corrections for Arabic Wikipedia and any Arabic wiki. + # python pwb.py replace -fix:correct-ar -start:! -always 'correct-ar': { - 'regex': True, + 'regex': False, 'msg': { 'ar': 'تدقيق إملائي', }, @@ -452,110 +452,138 @@ fixes = { # FIXME: Do not replace comma in non-Arabic text, # interwiki, image links or syntax. # (u' ,', u' ،'), - # TODO: Basic explanation in English what it does - (r'\bإمرأة\b', 'امرأة'), - (r'\bالى\b', 'إلى'), - (r'\bإسم\b', 'اسم'), - (r'\bالأن\b', 'الآن'), - (r'\bالة\b', 'آلة'), - (r'\bفى\b', 'في'), - (r'\bإبن\b', 'ابن'), - (r'\bإبنة\b', 'ابنة'), - (r'\bإقتصاد\b', 'اقتصاد'), - (r'\bإجتماع\b', 'اجتماع'), - (r'\bانجيل\b', 'إنجيل'), - (r'\bاجماع\b', 'إجماع'), - (r'\bاكتوبر\b', 'أكتوبر'), - (r'\bإستخراج\b', 'استخراج'), - (r'\bإستعمال\b', 'استعمال'), - (r'\bإستبدال\b', 'استبدال'), - (r'\bإشتراك\b', 'اشتراك'), - (r'\bإستعادة\b', 'استعادة'), - (r'\bإستقلال\b', 'استقلال'), - (r'\bإنتقال\b', 'انتقال'), - (r'\bإتحاد\b', 'اتحاد'), - (r'\bاملاء\b', 'إملاء'), - (r'\bإستخدام\b', 'استخدام'), - (r'\bأحدى\b', 'إحدى'), - (r'\bلاكن\b', 'لكن'), - (r'\bإثنان\b', 'اثنان'), - (r'\bإحتياط\b', 'احتياط'), - (r'\bإقتباس\b', 'اقتباس'), - (r'\bادارة\b', 'إدارة'), - (r'\bابناء\b', 'أبناء'), - (r'\bالانصار\b', 'الأنصار'), - (r'\bاشارة\b', 'إشارة'), - (r'\bإقرأ\b', 'اقرأ'), - (r'\bإمتياز\b', 'امتياز'), - (r'\bارق\b', 'أرق'), - (r'\bاللة\b', 'الله'), - (r'\bإختبار\b', 'اختبار'), - (r'== ?روابط خارجية ?==', '== وصلات خارجية =='), - (r'\bارسال\b', 'إرسال'), - (r'\bإتصالات\b', 'اتصالات'), - (r'\bابو\b', 'أبو'), - (r'\bابا\b', 'أبا'), - (r'\bاخو\b', 'أخو'), - (r'\bاخا\b', 'أخا'), - (r'\bاخي\b', 'أخي'), - (r'\bاحد\b', 'أحد'), - (r'\bاربعاء\b', 'أربعاء'), - (r'\bاول\b', 'أول'), - (r'\b(ال|)اهم\b', r'\1أهم'), - (r'\b(ال|)اثقل\b', r'\1أثقل'), - (r'\b(ال|)امجد\b', r'\1أمجد'), - (r'\b(ال|)اوسط\b', r'\1أوسط'), - (r'\b(ال|)اشقر\b', r'\1أشقر'), - (r'\b(ال|)انور\b', r'\1أنور'), - (r'\b(ال|)اصعب\b', r'\1أصعب'), - (r'\b(ال|)اسهل\b', r'\1أسهل'), - (r'\b(ال|)اجمل\b', r'\1أجمل'), - (r'\b(ال|)اقبح\b', r'\1أقبح'), - (r'\b(ال|)اطول\b', r'\1أطول'), - (r'\b(ال|)اقصر\b', r'\1أقصر'), - (r'\b(ال|)اسمن\b', r'\1أسمن'), - (r'\b(ال|)اذكى\b', r'\1أذكى'), - (r'\b(ال|)اكثر\b', r'\1أكثر'), - (r'\b(ال|)افضل\b', r'\1أفضل'), - (r'\b(ال|)اكبر\b', r'\1أكبر'), - (r'\b(ال|)اشهر\b', r'\1أشهر'), - (r'\b(ال|)ابطأ\b', r'\1أبطأ'), - (r'\b(ال|)اماني\b', r'\1أماني'), - (r'\b(ال|)احلام\b', r'\1أحلام'), - (r'\b(ال|)اسماء\b', r'\1أسماء'), - (r'\b(ال|)اسامة\b', r'\1أسامة'), - (r'\bابراهيم\b', 'إبراهيم'), - (r'\bاسماعيل\b', 'إسماعيل'), - (r'\bايوب\b', 'أيوب'), - (r'\bايمن\b', 'أيمن'), - (r'\bاوزبكستان\b', 'أوزبكستان'), - (r'\bاذربيجان\b', 'أذربيجان'), - (r'\bافغانستان\b', 'أفغانستان'), - (r'\bانجلترا\b', 'إنجلترا'), - (r'\bايطاليا\b', 'إيطاليا'), - (r'\bاوربا\b', 'أوروبا'), - (r'\bأوربا\b', 'أوروبا'), - (r'\bاوغندة\b', 'أوغندة'), - (r'\b(ال|)ا(لماني|فريقي|سترالي)(ا|ة|تان|ان|ين|ي|ون|و|ات|)\b', - r'\1أ\2\3'), - (r'\b(ال|)ا(وروب|مريك)(ا|ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', - r'\1أ\2\3'), - (r'\b(ال|)ا(ردن|رجنتين|وغند|سبان|وكران|فغان)' - r'(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', - r'\1أ\2\3'), - (r'\b(ال|)ا(سرائيل|يران|مارات|نكليز|نجليز)' - r'(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)\b', - r'\1إ\2\3'), - (r'\b(ال|)(ا|أ)(رثوذكس|رثوذوكس)(ي|ية|يتان|يان|يين|يي|يون|يو|يات|)' - r'\b', - r'\1أرثوذكس\4'), - (r'\bإست(عمل|خدم|مر|مد|مال|عاض|قام|حال|جاب|قال|زاد|عان|طال)' - r'(ت|ا|وا|)\b', - r'است\1\2'), - (r'\bإست(حال|قال|طال|زاد|عان|قام|راح|جاب|عاض|مال)ة\b', r'است\1ة'), + (' إمرأة ', ' امرأة '), + (' الى ', ' إلى '), + (' إسم ', ' اسم '), + (' الأن ', ' الآن '), + (' اول ', ' أول '), + (' الة ', ' آلة '), + (' فى ', ' في '), + (' اثقل ', ' أثقل '), + (' إبن ', ' ابن '), + (' إبنة ', ' ابنة '), + (' إقتصاد ', ' اقتصاد '), + (' إجتماع ', ' اجتماع '), + (' انجيل ', ' إنجيل '), + (' اجماع ', ' إجماع '), + (' امريكا ', ' أمريكا '), + (' اوروبا ', ' أوروبا '), + (' انجلترا ', ' إنجلترا '), + (' اكتوبر ', ' أكتوبر '), + (' اسرائيل ', ' إسرائيل '), + (' المانيا ', ' ألمانيا '), + (' ايطاليا ', ' إيطاليا '), + (' ايران ', ' إيران '), + (' إستخراج ', ' استخراج '), + (' إستعمال ', ' استعمال '), + (' إستبدال ', ' استبدال '), + (' إشتراك ', ' اشتراك '), + (' إستعادة ', ' استعادة '), + (' إستقلال ', ' استقلال '), + (' إنتقال ', ' انتقال '), + (' إتحاد ', ' اتحاد '), + (' املاء ', ' إملاء '), + (' إستخدام ', ' استخدام '), + (' أحدى ', ' إحدى '), + (' لاكن ', ' لكن '), + (' الاردن ', ' الأردن '), + (' إثنان ', ' اثنان '), + (' شيئ ', ' شيء '), + (' إحتياط ', ' احتياط '), + (' إقتباس ', ' اقتباس '), + (' الامارات ', ' الإمارات '), + (' اكثر ', ' أكثر '), + (' افضل ', ' أفضل '), + (' اكبر ', ' أكبر '), + (' اشهر ', ' أشهر '), + (' ادارة ', ' إدارة '), + (' ابناء ', ' أبناء '), + (' الانصار ', ' الأنصار '), + (' اشارة ', ' إشارة '), + (' إقرأ ', ' اقرأ '), + (' إمتياز ', ' امتياز '), + (' ارق ', ' أرق '), + (' أرثوذوكس ', ' أرثوذكس '), + (' الأرثوذوكس ', ' الأرثوذكس '), + (' أرثوذوكسية ', ' أرثوذكسية '), + (' الأرثوذوكسية ', ' الأرثوذكسية '), + (' الأرثوذوكسي ', ' الأرثوذكسي '), + (' ارثوذوكس ', ' أرثوذكس '), + (' ارثوذوكسي ', ' أرثوذكسي '), + (' ارثوذوكسية ', ' أرثوذكسية '), + (' الارثوذوكسية ', ' الأرثوذكسية '), + (' اللة ', ' الله '), + (' إختبار ', ' اختبار '), + ('== روابط خارجية ==', '== وصلات خارجية =='), + ('==روابط خارجية==', '== وصلات خارجية =='), + (' ارسال ', ' إرسال '), + (' إتصالات ', ' اتصالات '), + (' اسامة ', ' أسامة '), + (' ابراهيم ', ' إبراهيم '), + (' اسماعيل ', ' إسماعيل '), + (' ايوب ', ' أيوب '), + (' ايمن ', ' أيمن '), + (' ابو ', ' أبو '), + (' ابا ', ' أبا '), + (' اخو ', ' أخو '), + (' اخا ', ' أخا '), + (' اخي ', ' أخي '), + (' احد ', ' أحد '), + (' اربعاء ', ' أربعاء '), + (' اهم ', ' أهم '), + (' اوزبكستان ', ' أوزبكستان '), + (' اذربيجان ', ' أذربيجان '), + (' افغانستان ', ' أفغانستان '), + (' امجد ', ' أمجد '), + (' اوسط ', ' أوسط '), + (' اشقر ', ' أشقر '), + (' انور ', ' أنور '), + (' اصعب ', ' أصعب '), + (' اسهل ', ' أسهل '), + (' اجمل ', ' أجمل '), + (' اقبح ', ' أقبح '), + (' اطول ', ' أطول '), + (' اقصر ', ' أقصر '), + (' اسمن ', ' أسمن '), + (' اذكى ', ' أذكى '), + (' اماني ', ' أماني '), + (' احلام ', ' أحلام '), + (' اسماء ', ' أسماء '), + (' ابطأ ', ' أبطأ '), + (' اوربا ', ' أوروبا '), + (' أوربا ', ' أوروبا '), + (' امريكي ', ' أمريكي '), + (' امريكية ', ' أمريكية '), + (' امريكيان ', ' أمريكيان '), + (' امريكيتان ', ' أمريكيتان '), + (' امريكيون ', ' أمريكيون '), + (' امريكيات ', ' أمريكيات '), + (' الامريكي ', ' الأمريكي '), + (' الامريكية ', ' الأمريكية '), + (' الامريكيان ', ' الأمريكيان '), + (' الامريكيتان ', ' الأمريكيتان '), + (' الامريكيون ', ' الأمريكيون '), + (' الامريكيات ', ' الأمريكيات '), + (' اوروبي ', ' أوروبي '), + (' اوروبية ', ' أوروبية '), + (' اوروبيان ', ' أوروبيان '), + (' اوروبيتان ', ' أوروبيتان '), + (' اوروبيون ', ' أوروبيون '), + (' اوروبيات ', ' أوروبيات '), + (' الاوروبي ', ' الأوروبي '), + (' الاوروبية ', ' الأوروبية '), + (' الاوروبيان ', ' الأوروبيان '), + (' الاوروبيتان ', ' الأوروبيتان '), + (' الاوروبيون ', ' الأوروبيون '), + (' الاوروبيات ', ' الأوروبيات '), + (' اسرائيلي ', ' إسرائيلي '), + (' اسرائيلية ', ' إسرائيلية '), + (' اسرائيليان ', ' إسرائيليان '), + (' اسرائيليتان ', ' إسرائيليتان '), ], 'exceptions': { 'inside-tags': [ + 'gallery', # because of filenames 'interwiki', 'math', 'ref', @@ -566,6 +594,7 @@ fixes = { 'specialpages': { 'regex': False, 'msg': { + 'ar': 'روبوت: إصلاح حالة حروف الصفحات الخاصة', 'en': 'Robot: Fixing special page capitalisation', 'fa': 'ربات: تصحیح بزرگی و کوچکی حروف صفحه‌های ویژه', }, @@ -597,6 +626,7 @@ fixes = { 'regex': False, 'nocase': True, 'msg': { + 'ar': 'روبوت: إصلاح الوصلات إلى نطاقات .yu', 'de': 'Bot: Ersetze Links auf .yu-Domains', 'en': 'Robot: Replacing links to .yu domains', 'fa': 'ربات: جایگزینی پیوندها به دامنه‌ها با پسوند yu',