Как-то очень незаметно наступил 21й век
Clive Thompson on How Translation Software Saves Mother Tongue
Вкратце – статья о том, как в последние пару лет машинный перевод стал неожиданно хорошим. Т.е. если недавно на тексты, переведенные промптом без слёз нельзя было смотреть, то теперь тот же translate.google.com довольно неплохо справляется с переводом сайтов и блогов – до той степени, что в обсуждении одного и того же сюжета онлайн могут принимать участие люди из разных стран каждый на своём языке одновременно – всё остальное on the fly переведется.Собственно, меня это зацепило по двум причинам. Первое. Совсем недавно в рабочую почту свалилось письмо следующего содержания:
Риторический вопрос по мотивом перевода евро-списка материалов. Кто нибудь может сказать как это перевести можно?
)
Лента электроизоляционная термостойкая самослипающаяся резиновая радиационной вулканизации
Шутки ради я полез в гугло-переводчик, посмотреть чего он скажет, ожидая чего-нибудь смешное несуразное и обязательно со словом volcano. Скажем так, Гугль меня приятно удивил, выдав мне фразу, лучше которой я и сам ничего придумать не смог: Heat-resistant electrically insulating tape autohesion rubber radiation curing.
Ну а второе – собственно обоснование того, почему в последние пару лет такое стало возможно (об этом тоже есть в статье). Вместо того, чтобы пытаться алгоритмизировать перевод, тот же гуглопереводчик и прочие наиболее успешные образцы тупо используют “статистический перевод”. Т.е. из сети берутся доступные на нескольких языках идентичные тексты (а этого добра полно – вся документация Евросоюза, ООН, мультиязычные новостные сайты и т.п.), сканируются и на основании сопоставления этих текстов, изначально переведенных человеком, осуществляется сам перевод – который, смотрим выше, получается вполне вменяемым.
И, собственно, о чем я. Фразу выше можно сказать чуть иначе: мозгам Гугля было сказано прочитать весь интернет и выучить человеческие языки. А потом переводить. Гугль пошел, прочитал, сопоставил, запомнил словосочетания и их соответствия в различных языках и теперь может понимать и переводить.
Вам не кажется, что пора вводить 3 закона из “Я, Робот”?