هوش مصنوعی جدید الواح خط میخی ۵۰۰۰ ساله را فورا ترجمه می کند
هوش مصنوعی به کمک باستان شناسان می آید . در ادامه این مطلب از سرویس دانستنی های سایت چمدون بررسی می کنیم که چگونه هوش مصنوعی می تواند خطوط باستانی را ترجمه کند . ترجمه صرفاً مبادله یک کلمه با یک کلمه متناظر در زبان دیگر نیست.یک ترجمه با کیفیت بالا مستلزم این است که مترجم بفهمد
گنج هیتلر کجاست ؟چرا تا کنون پیدا نشده است ؟
اما به عنوان یک زبان نوشتاری، اکدی ماندگارتر شد. امپراتوری خط میخی جانشین خود، تمدن سومری را به عاریت گرفت . این سیستم نوشتاری از یک قلم نی استفاده میکرد تا گلیفهای گوهشکل را قبل از پختن در لوحهای سفالی خیس قرار دهد (از این رو نام خط میخی که در لاتین به معنای واقعی کلمه «گوهشکل» است). حتی پس از اینکه آرامی جایگزین زبان اکدی به عنوان زبان رایج منطقه شد، دانشمندان تا قرن اول پس از میلاد به نوشتن به خط میخی اکدی ادامه دادند – به نظر می رسد حتی در دوران باستان، دانشمندان و دانشگاهیان به طرز باورنکردنی سرسخت بودند.
این طرز فکر سنتی برای باستان شناسان مدرن نیز سود ناخواسته ای داشت.
در حالی که خط میخی را میتوان بر روی پاپیروس نوشت ، اغلب روی خشت یا سنگ نوشته میشد. این مواد در برابر آتشسوزیها و سیلهایی که همتایان بدشان را ویران کردهاند، بسیار بهتر میایستند. و در حالی که زمان نسبت به همه چیز ظالمانه است – باستان شناسان به ندرت لوح های خط میخی را در حالت نعناع کشف می کنند – این یکی از دلایلی است که ممکن است نوشته های اکدی در سوابق تاریخی به خوبی تأیید کند.
قضا، آتش سوزی های مخرب برخی از بزرگترین کتابخانه های بین النهرین باستان را حفظ کرده است – زیرا آنها از گل ساخته شده بودند. در مقابل، تمام کتابخانههای پاپیروس مصر باستان سوخته یا به خاک سپرده شدهاند، اگرچه بسیاری از کدهای منفرد باقی ماندهاند.» استیون راجر فیشر زبانشناس در تاریخ نوشتن مینویسد .
حتی با وجود چنین ثروت زبان شناسانه، ترجمه صحیح این کتابخانه های باستانی کار کمی نیست. فراتر از چالش هایی که قبلاً ذکر شد، زبان اکدی چند ظرفیتی است. یعنی علائم میخی آن بسته به نحوه عملکرد هر یک در یک جمله می تواند چندین قرائت مختلف داشته باشد. دلایل زیادی برای این پیشرفت وجود دارد، اما به گفته فیشر، یکی از دلایلی که اکدیها هرگز سادهسازی نکردند این بود که «به نظر میرسید که به سنت و کارآمدی خود تحمیلی وابسته هستند». این طرز فکر سنتی باعث شد که آنها به استفاده از خط سومری برای زبانی بسیار متفاوت از سومری ادامه دهند. (وقتی نوبت به مطالعات تاریخی میرسد، برخی را برنده میشوید، برخی را از دست میدهید.)
به این ترتیب، ترجمه اکدی یک فرآیند دو مرحله ای است. اولاً دانشمندان باید علائم خط میخی را ترجمه کنند. یعنی خط میخی را می گیرند و با استفاده از آوایی مشابه زبان مقصد آن را بازنویسی می کنند. نمونه ای که اکثر خوانندگان با آن آشنا خواهند بود کلمه عربی الله است که به انگلیسی به عنوان “خدا” ترجمه می شود اما به عنوان “الله” ترجمه می شود. این نویسهگردانی نزدیکترین چیزی است که الفبای لاتین میتواند به تولید کلمه آنطور که در زبان عربی به نظر میرسد برسد. سپس محققین متن را برگردان میکنند و آن را به زبانی مدرن ترجمه میکنند.
هوش مصنوعی سریع برای نتایج فوری
همانطور که می توانید تصور کنید، این می تواند یک فرآیند طولانی و پرزحمت باشد – فرآیندی که برای یادگیری خوب انجام دادن، به سال ها آموزش و فداکاری نیاز دارد. برای کمک به سرعت بخشیدن به کارها، تیم تحقیقاتی یک مدل ترجمه ماشینی عصبی برای خط میخی اکدی، همان فناوری زیر پوشش Google Translate، توسعه دادند .
این تیم مدل هوش مصنوعی را بر روی نمونه ای از متون خط میخی از مجموعه Open Richly Annotated Cuneiform Corpus آموزش دادند و به آن ترجمه را به دو روش مجزا آموزش دادند. ابتدا، مدل هوش مصنوعی ترجمه اکدی را از نویسهگردانی متون اصلی آموخت. همچنین یاد گرفت که چگونه نمادهای خط میخی را مستقیماً ترجمه کند. به طور خاص تر، حروف یونیکد از متون خط میخی را ترجمه کرد که توسط ابزار صرفه جویی در زمان دیگری که به طور خودکار یونیکد را از تصویر یک تبلت اصلی تولید می کرد، ایجاد شده بود .
سپس مدل هوش مصنوعی باید چگونگی رسیدگی به تفاوتهای ظریف ژانرهای مختلف نمونه – به عنوان مثال، تفاوت بین آثار ادبی و حروف اداری – و همچنین نحوه رسیدگی به تغییرات یافت شده در خط میخی در طول هزارههای مورد استفاده را دریابد. سپس مدل هوش مصنوعی با استفاده از ارزیابی دو زبانه ۴ ( BLEU4 )، الگوریتمی که برای ارزیابی متن ترجمه شده توسط ماشین استفاده میشود، مورد آزمایش قرار گرفت.
در آزمون ترجمه به انگلیسی، مدل هوش مصنوعی تیم امتیاز ۳۷.۴۷ را کسب کرد. در آزمون خط میخی به انگلیسی خود امتیاز ۳۶.۵۲ را کسب کرد. هر دو امتیاز بالاتر از خط پایه هدف و در محدوده ترجمه با کیفیت بالا قرار داشتند. و یک نتیجه شگفتانگیز وجود داشت: این مدل میتوانست تفاوتهای ظریف ژانر هر جمله آزمایشی را بازتولید کند. در حالی که این یکی از اهداف محقق نبود، آنها در این مطالعه خاطرنشان کردند که ممکن است امکان استفاده هایی فراتر از ترجمه را فراهم کند.
[ترجمه] درست باشد یا نه، ژانر قابل تشخیص است». در یک سناریوی آینده امیدوارکننده، [مدل] فهرستی از منابعی را به کاربر نشان میدهد که ترجمههای خود را بر اساس آنها انجام میدهند، که برای اهداف علمی نیز مفید خواهد بود.»
این تیم نتایج خود را در PNAS Nexus منتشر کرد . آنها همچنین تحقیقات و کد منبع خود را در GitHub در Akkademia منتشر کردند .
آینده گذشته روشن تر به نظر می رسد
هر چقدر نتایج اولیه امیدوارکننده باشد، هنوز کار برای انجام دادن وجود دارد. در هر دو مورد، برخی از جملات آزمون اشتباه ترجمه شده است. و مانند سایر مدلهای هوش مصنوعی، این مدل نیز مستعد توهم است – لحظاتی که پاسخ هیچ ارتباطی با منبع ندارد. در یک نمونه، مترجم انسانی این جمله را ارائه کرد: «چرا ما (همچنین) باید در برابر مردی از لیبی علی دعوا کنیم؟ ترجمه هوش مصنوعی: “آنها در شهر درونی در شهر درونی هستند.” (کمی خاموش.)
در مجموع، مدل هوش مصنوعی زمانی که جملات کوتاه و متوسط را ترجمه می کند، بهترین کار را دارد. همچنین با ژانرهای فرمولی بیشتر، مانند احکام سلطنتی و سوابق اداری، بهتر از ژانرهای ادبی مانند اسطوره ها، سرودها و پیشگویی ها عمل می کند. محققان در این مطالعه خاطرنشان کردند که با آموزش بیشتر در مورد یک مجموعه داده بزرگتر، هدف آنها بهبود دقت آن است. با گذشت زمان، آنها امیدوارند که مدل هوش مصنوعی آنها بتواند به عنوان یک دستیار مجازی برای دانشمندان انسانی عمل کند. هوش مصنوعی میتواند ترجمه خام را به سرعت ارائه کند، در حالی که محقق میتواند آن را با دانش خود از زبانها، فرهنگها و مردم تاریخی اصلاح کند.
صدها هزار لوح گلی حک شده به خط میخی تاریخ سیاسی، اجتماعی، اقتصادی و علمی بین النهرین باستان را مستند می کند. با این حال، اکثر این اسناد به دلیل تعداد زیاد و تعداد محدودی از متخصصان که قادر به خواندن آنها هستند ترجمه نشده و غیرقابل دسترسی باقی میمانند.»
این گام بزرگ دیگری در جهت حفظ و اشاعه میراث فرهنگی بین النهرین باستان است.
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰