Facebook от много време има функция за автоматичен превод на публикациите в социалната мрежа. За целта се използва машинно обучение, което обаче първо превежда даден език на английски и след това на избрания от потребителя, предаде vesti.bg.
Това създава риск от изкривяване на смисъла понякога, а и е доста по-сложно. Затова компанията работи по нова система с изкуствен интелект. Тя ще превежда директно от един език на друг, което ще улесни превода и ще повиши качеството, съобщава Engadget.
Всеки ден във Facebook се публикуват милиарди постове на 160 езика. Общо две-трети от публикациите са на език, който е различен от английския, коментира Анджела Фан от отдела на Facebook за изкуствен интелект.
Новата система M2M-100 ще може да превежда директно от език на език, като за начало ще работи със 100 езика. Компанията е направила база данни със 7.5 млрд. изречения за езиците, като изкуственият интелект е обучен да използва 15 млрд. параметъра. Това включва и използване на информация от сходни езици.
Голяма част от информацията е събрана от публично достъпни източници. Това включва интернет страници, както и технология за разпознаване на езика, на който е написан даден текст.
За езиците, за които няма достатъчно публикации в интернет, Facebook е използвала подход, чрез който разчита на своеобразно обратно инженерство - от езиците, за които има много данни, научава за тези, за които няма, чрез множество тестови преводи. Така се създава достатъчно информация, която изкуственият интелект да използва в работата си.
Facebook постепенно ще увеличава броя на езиците, но ще е трудно да покрие всички около 6200 езика по света. Компанията отбелязва, че това ще зависи в голяма степен от наличните данни за езиците.