مرحبا بكم في زيارة فوسانغ!
الموقع الحالي:الصفحة الأولى >> العلوم والتكنولوجيا

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

2025-09-19 08:47:50 العلوم والتكنولوجيا

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

في السنوات الأخيرة ، مع التطور السريع للذكاء الاصطناعي وتكنولوجيا معالجة اللغة الطبيعية ، أصبح بناء مجموعة متعددة اللغات أساسًا مهمًا لتعزيز التواصل عبر اللغة والابتكار التكنولوجي. أعلن معهد أبحاث آسيان للبحوث في الصين (المشار إليه فيما يلي باسم "المعهد") مؤخرًا أنه قام بنجاح ببناء مجموعة متعددة اللغات تغطي اللغات الرئيسية لبلدان الرابطة العشر ، بهدف تعزيز قابلية التشغيل البيني للغة والنشر الثقافي والتعاون التكنولوجي الذكي بين الصين ودول الرابطة في آسيا.

لا يملأ بناء هذه المجموعة الفجوة في مجال الموارد اللغوية متعددة اللغات فحسب ، بل يوفر أيضًا دعم بيانات عالي الجودة لتطبيقات الذكاء الاصطناعي مثل الترجمة الآلية والتعرف على الكلام وتحليل النص. فيما يلي نظرة عامة على الميزات الرئيسية وبيانات هذه المجموعة:

يقوم معهد Indian Intelligence في الصين ببناء مجموعة متعددة اللغات بشكل مستقل

أنواع اللغةمقياس كوربوس (100 مليون كلمة)مناطق التغطيةمصدر البيانات
الصينية50الأخبار والقانون والعلوم والأدبالمنشورات العامة ، وثائق الحكومة
التايلاندية12وسائل التواصل الاجتماعي ، الأخبار ، السفرتوفرها مؤسسات تزحف الشبكة والتعاون
الفيتنامي10الاقتصاد والثقافات والتعليمالأوراق الأكاديمية ، وسائل الإعلام الإخبارية
الملايو8العمل ، القانون ، المحادثات اليوميةتعاون الشركات ، وكالة الترجمة
إندونيسي8الأخبار ووسائل التواصل الاجتماعي والأفلام والتلفزيونمجموعات البيانات العامة ، تزحف الشبكة

سيناريوهات تطبيق Corpus

يوفر بناء هذه المجموعة الدعم الأساسي للتطبيقات في مجالات متعددة ، بما في ذلك:

1.الترجمة الآلية: من خلال مجموعة متوازية متعددة اللغات عالية الجودة ، قام المعهد بتدريب نموذج ترجمة يدعم أزواج اللغة مثل الصينية والإنجليزية والسلوبون الصيني والفيتنام الصينية ، وتحسنت دقة الترجمة بشكل كبير.

2.التعرف على الصوت: توفر البيانات الصوتية في المجموعة مواد تدريبية لأنظمة التعرف على الكلام في دول الآسيان ، مما يساعد على تطوير تطبيقات مثل مساعدي الصوت الأذكياء وأنظمة خدمة العملاء.

3.استرجاع المعلومات عبر اللغة: يمكن للمستخدمين البحث في المحتوى المرتبط بلغات الآسيان من خلال الكلمات الرئيسية الصينية ، مما يسهل بشكل كبير البحث الأكاديمي واكتساب المعلومات التجارية.

4.التواصل والبحث الثقافي: يوفر المحتوى الأدب والأفلام والتلفزيون في المجموعة العلماء الثقافيين مواد تحليلية غنية وتعزيز التبادلات الثقافية بين الصين ودول الآسيان.

التخطيط في المستقبل

قال المعهد إن الحجم واللغة في المجموعة سيتم توسيع نطاقه في المستقبل ، ويخطط لتشمل المزيد من لغات الآسيان الصغيرة مثل البورمية والكمبودية. في الوقت نفسه ، سيتعاون المعهد مع المؤسسات والمؤسسات الأكاديمية في بلدان الآسيان للترويج للمشاركة المفتوحة للجسم والمساهمة في أبحاث ذكاء اللغة العالمية.

إن بناء هذه المجموعة متعددة اللغات ليس فقط إنجازًا مهمًا لمجلة المعهد الصيني لاستخبارات اللغة ، ولكنه يوفر أيضًا دعمًا قويًا للتشغيل البيني للغة والتعاون التقني بموجب مبادرة "الحزام والطريق". مع التقدم المستمر لتكنولوجيا الذكاء الاصطناعي ، ستكون آفاق تطبيق مجموعة متعددة اللغات أوسع.

المقال التالي
  • كيفية تحسين موقع الويب الخاص بك: 10 أيام من المواضيع الساخنة ودليل منظمفي عصر الانفجار المعلوماتي، أصبح تحسين موقع الويب (SEO) هو المفتاح لتحسين حركة المرور وتجربة المستخدم. ستجمع هذه المقالة بين الموضوعات الساخنة على الإنترنت في الأ
    2026-01-29 العلوم والتكنولوجيا
  • كيفية صنع المومياءكان التحنيط من الطقوس الجنائزية المهمة في الحضارة المصرية القديمة. فهو لم يعكس إيمان المصريين القدماء بالحياة الآخرة فحسب، بل أظهر أيضًا إنجازاتهم البارزة في الطب والكيمياء وتكنولوجيا التحنيط. ستقدم هذه المقالة
    2026-01-26 العلوم والتكنولوجيا
  • كيفية إنشاء الاختصارات: الموضوعات الشائعة والأدلة العملية من جميع أنحاء الويبومن بين المواضيع الساخنة على الإنترنت في الأيام العشرة الماضية، جذبت التكنولوجيا وأدوات الكفاءة الكثير من الاهتمام، وخاصة مهارات إنشاء الاختصارات. تجم
    2026-01-24 العلوم والتكنولوجيا
  • كيفية استرجاع رسائل البريد الإلكتروني المحذوفة؟ —— دليل شامل ونصائح عمليةفي العمل والحياة المعاصرة، يعد البريد الإلكتروني أداة اتصال لا غنى عنها. ومع ذلك، غالبًا ما يحدث الحذف غير المقصود لرسائل البريد الإلكتروني، خاصة عند حذف ر
    2026-01-21 العلوم والتكنولوجيا
المواد الموصى بها
تصنيفات القراءة
روابط ودية
تقسيم الخط