مرحبا بكم في زيارة فوسانغ!
الموقع الحالي:الصفحة الأولى >> العلوم والتكنولوجيا

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

2025-09-19 08:47:50 العلوم والتكنولوجيا

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

في السنوات الأخيرة ، مع التطور السريع للذكاء الاصطناعي وتكنولوجيا معالجة اللغة الطبيعية ، أصبح بناء مجموعة متعددة اللغات أساسًا مهمًا لتعزيز التواصل عبر اللغة والابتكار التكنولوجي. أعلن معهد أبحاث آسيان للبحوث في الصين (المشار إليه فيما يلي باسم "المعهد") مؤخرًا أنه قام بنجاح ببناء مجموعة متعددة اللغات تغطي اللغات الرئيسية لبلدان الرابطة العشر ، بهدف تعزيز قابلية التشغيل البيني للغة والنشر الثقافي والتعاون التكنولوجي الذكي بين الصين ودول الرابطة في آسيا.

لا يملأ بناء هذه المجموعة الفجوة في مجال الموارد اللغوية متعددة اللغات فحسب ، بل يوفر أيضًا دعم بيانات عالي الجودة لتطبيقات الذكاء الاصطناعي مثل الترجمة الآلية والتعرف على الكلام وتحليل النص. فيما يلي نظرة عامة على الميزات الرئيسية وبيانات هذه المجموعة:

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

أنواع اللغةمقياس كوربوس (100 مليون كلمة)مناطق التغطيةمصدر البيانات
الصينية50الأخبار والقانون والعلوم والأدبالمنشورات العامة ، وثائق الحكومة
التايلاندية12وسائل التواصل الاجتماعي ، الأخبار ، السفرتوفرها مؤسسات تزحف الشبكة والتعاون
الفيتنامي10الاقتصاد والثقافات والتعليمالأوراق الأكاديمية ، وسائل الإعلام الإخبارية
الملايو8العمل ، القانون ، المحادثات اليوميةتعاون الشركات ، وكالة الترجمة
إندونيسي8الأخبار ووسائل التواصل الاجتماعي والأفلام والتلفزيونمجموعات البيانات العامة ، تزحف الشبكة

سيناريوهات تطبيق Corpus

يوفر بناء هذه المجموعة الدعم الأساسي للتطبيقات في مجالات متعددة ، بما في ذلك:

1.الترجمة الآلية: من خلال مجموعة متوازية متعددة اللغات عالية الجودة ، قام المعهد بتدريب نموذج ترجمة يدعم أزواج اللغة مثل الصينية والإنجليزية والسلوبون الصيني والفيتنام الصينية ، وتحسنت دقة الترجمة بشكل كبير.

2.التعرف على الصوت: توفر البيانات الصوتية في المجموعة مواد تدريبية لأنظمة التعرف على الكلام في دول الآسيان ، مما يساعد على تطوير تطبيقات مثل مساعدي الصوت الأذكياء وأنظمة خدمة العملاء.

3.استرجاع المعلومات عبر اللغة: يمكن للمستخدمين البحث في المحتوى المرتبط بلغات الآسيان من خلال الكلمات الرئيسية الصينية ، مما يسهل بشكل كبير البحث الأكاديمي واكتساب المعلومات التجارية.

4.التواصل والبحث الثقافي: يوفر المحتوى الأدب والأفلام والتلفزيون في المجموعة العلماء الثقافيين مواد تحليلية غنية وتعزيز التبادلات الثقافية بين الصين ودول الآسيان.

التخطيط في المستقبل

قال المعهد إن الحجم واللغة في المجموعة سيتم توسيع نطاقه في المستقبل ، ويخطط لتشمل المزيد من لغات الآسيان الصغيرة مثل البورمية والكمبودية. في الوقت نفسه ، سيتعاون المعهد مع المؤسسات والمؤسسات الأكاديمية في بلدان الآسيان للترويج للمشاركة المفتوحة للجسم والمساهمة في أبحاث ذكاء اللغة العالمية.

إن بناء هذه المجموعة متعددة اللغات ليس فقط إنجازًا مهمًا لمجلة المعهد الصيني لاستخبارات اللغة ، ولكنه يوفر أيضًا دعمًا قويًا للتشغيل البيني للغة والتعاون التقني بموجب مبادرة "الحزام والطريق". مع التقدم المستمر لتكنولوجيا الذكاء الاصطناعي ، ستكون آفاق تطبيق مجموعة متعددة اللغات أوسع.

المقال التالي
  • كيفية كسر قفل شاشة Apple: الموضوعات والحلول الشائعة على الشبكة بأكملها في الأيام العشرة الماضيةفي الآونة الأخيرة ، أصبح تكسير أقفال شاشة Apple موضوعًا ساخنًا ، ويبحث العديد من المستخدمين عن حلول لأنهم ينسون كلمات المرور الخاصة بهم أو ش
    2025-09-26 العلوم والتكنولوجيا
  • يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقلفي السنوات الأخيرة ، مع التطور السريع للذكاء الاصطناعي وتكنولوجيا معالجة اللغة الطبيعية ، أصبح بناء مجموعة متعددة اللغات أساسًا مهمًا لتعزيز التواصل عبر اللغة وا
    2025-09-19 العلوم والتكنولوجيا
  • معدل دقة بعض نماذج الذكاء الاصطناعي الصيني يتجاوز 95 ٪في السنوات الأخيرة ، حققت الصين تقدماً كبيراً في مجال الذكاء الاصطناعي ، خاصة فيما يتعلق بدقة النموذج. وفقًا لأحدث البيانات ، تجاوز معدل دقة بعض نماذج الذكاء الاصطناعى التي تم تط
    2025-09-19 العلوم والتكنولوجيا
  • الصين تحمل 8 منتديات متوازية للطاقة: التركيز على تحويل الطاقة العالمي وتعاونهفي الآونة الأخيرة ، عقدت الصين بنجاح 8 منتديات متوازية للطاقة ، وجذب الخبراء والعلماء وممثلي الشركات والمسؤولين الحكوميين في مجال الطاقة العالمي. أجرت هذ
    2025-09-19 العلوم والتكنولوجيا
المواد الموصى بها
تصنيفات القراءة
روابط ودية
تقسيم الخط