مرحبا بكم في زيارة فوسانغ!
الموقع الحالي:الصفحة الأولى >> العلوم والتكنولوجيا

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

2025-09-19 08:47:50 العلوم والتكنولوجيا

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

في السنوات الأخيرة ، مع التطور السريع للذكاء الاصطناعي وتكنولوجيا معالجة اللغة الطبيعية ، أصبح بناء مجموعة متعددة اللغات أساسًا مهمًا لتعزيز التواصل عبر اللغة والابتكار التكنولوجي. أعلن معهد أبحاث آسيان للبحوث في الصين (المشار إليه فيما يلي باسم "المعهد") مؤخرًا أنه قام بنجاح ببناء مجموعة متعددة اللغات تغطي اللغات الرئيسية لبلدان الرابطة العشر ، بهدف تعزيز قابلية التشغيل البيني للغة والنشر الثقافي والتعاون التكنولوجي الذكي بين الصين ودول الرابطة في آسيا.

لا يملأ بناء هذه المجموعة الفجوة في مجال الموارد اللغوية متعددة اللغات فحسب ، بل يوفر أيضًا دعم بيانات عالي الجودة لتطبيقات الذكاء الاصطناعي مثل الترجمة الآلية والتعرف على الكلام وتحليل النص. فيما يلي نظرة عامة على الميزات الرئيسية وبيانات هذه المجموعة:

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

أنواع اللغةمقياس كوربوس (100 مليون كلمة)مناطق التغطيةمصدر البيانات
الصينية50الأخبار والقانون والعلوم والأدبالمنشورات العامة ، وثائق الحكومة
التايلاندية12وسائل التواصل الاجتماعي ، الأخبار ، السفرتوفرها مؤسسات تزحف الشبكة والتعاون
الفيتنامي10الاقتصاد والثقافات والتعليمالأوراق الأكاديمية ، وسائل الإعلام الإخبارية
الملايو8العمل ، القانون ، المحادثات اليوميةتعاون الشركات ، وكالة الترجمة
إندونيسي8الأخبار ووسائل التواصل الاجتماعي والأفلام والتلفزيونمجموعات البيانات العامة ، تزحف الشبكة

سيناريوهات تطبيق Corpus

يوفر بناء هذه المجموعة الدعم الأساسي للتطبيقات في مجالات متعددة ، بما في ذلك:

1.الترجمة الآلية: من خلال مجموعة متوازية متعددة اللغات عالية الجودة ، قام المعهد بتدريب نموذج ترجمة يدعم أزواج اللغة مثل الصينية والإنجليزية والسلوبون الصيني والفيتنام الصينية ، وتحسنت دقة الترجمة بشكل كبير.

2.التعرف على الصوت: توفر البيانات الصوتية في المجموعة مواد تدريبية لأنظمة التعرف على الكلام في دول الآسيان ، مما يساعد على تطوير تطبيقات مثل مساعدي الصوت الأذكياء وأنظمة خدمة العملاء.

3.استرجاع المعلومات عبر اللغة: يمكن للمستخدمين البحث في المحتوى المرتبط بلغات الآسيان من خلال الكلمات الرئيسية الصينية ، مما يسهل بشكل كبير البحث الأكاديمي واكتساب المعلومات التجارية.

4.التواصل والبحث الثقافي: يوفر المحتوى الأدب والأفلام والتلفزيون في المجموعة العلماء الثقافيين مواد تحليلية غنية وتعزيز التبادلات الثقافية بين الصين ودول الآسيان.

التخطيط في المستقبل

قال المعهد إن الحجم واللغة في المجموعة سيتم توسيع نطاقه في المستقبل ، ويخطط لتشمل المزيد من لغات الآسيان الصغيرة مثل البورمية والكمبودية. في الوقت نفسه ، سيتعاون المعهد مع المؤسسات والمؤسسات الأكاديمية في بلدان الآسيان للترويج للمشاركة المفتوحة للجسم والمساهمة في أبحاث ذكاء اللغة العالمية.

إن بناء هذه المجموعة متعددة اللغات ليس فقط إنجازًا مهمًا لمجلة المعهد الصيني لاستخبارات اللغة ، ولكنه يوفر أيضًا دعمًا قويًا للتشغيل البيني للغة والتعاون التقني بموجب مبادرة "الحزام والطريق". مع التقدم المستمر لتكنولوجيا الذكاء الاصطناعي ، ستكون آفاق تطبيق مجموعة متعددة اللغات أوسع.

المقال التالي
  • كيفية تغيير كلمة المرور السحابية للجوال؟ المواضيع الشائعة وأدلة التشغيل على الإنترنت في الأيام العشرة الماضيةفي الآونة الأخيرة، مع زيادة الوعي بأمن البيانات، أصبح تعديل كلمة المرور السحابية للهاتف المحمول موضوعًا ساخنًا. يشعر ا
    2026-01-11 العلوم والتكنولوجيا
  • ماذا عن مساعد قسم AOMEI؟ موضوعات شائعة وتحليل متعمق للأيام العشرة الماضية عبر الإنترنتفي الآونة الأخيرة، أصبح AOMEI Partition Assistant مرة أخرى موضوعًا ساخنًا في دائرة التكنولوجيا بسبب وظائفه القوية لإدارة القرص. تجمع هذه المقالة بين المناقشا
    2026-01-09 العلوم والتكنولوجيا
  • كيفية إرسال النقد عند التسليم السريعمع التطور السريع للتجارة الإلكترونية والصناعات اللوجستية، أصبح الدفع عند التسليم (COD)، كوسيلة دفع مريحة، مفضلاً لدى العديد من المستهلكين. ولكن بالنسبة للمرسلين، قد يكون هناك سؤال حول كيفية إرسا
    2026-01-07 العلوم والتكنولوجيا
  • كيفية شراء كمبيوتر علي بابا السحابي Wuyingفي السنوات الأخيرة، ومع التطور السريع لتكنولوجيا الحوسبة السحابية، أصبحت أجهزة الكمبيوتر السحابية تدريجيًا خيارًا جديدًا للمؤسسات والمستخدمين الأفراد. لقد اجتذب الكمبيوتر السحابي الذي أطل
    2026-01-04 العلوم والتكنولوجيا
المواد الموصى بها
تصنيفات القراءة
روابط ودية
تقسيم الخط