Інклюзивність для африканських мов у роботі технологічних гігантів

Діти корінних народів у Танзанії за ноутбуком. Автор фотографії — Куренг Воркс (Kureng Workx), взято із сайту Pexels (безкоштовне використання).

[Усі посилання в тексті — англійською мовою, якщо не вказано інше].

Технологічний гігант Google 28 жовтня повідомив, що ще 15 африканських мов отримають підтримку в сервісах Голосового пошуку (Voice Search), Голосового вводу на клавіатурі Gboard [укр.] (Gboard talk-to-type) та в Перекладачі (Translate dictation). Йдеться про такі мови, як ігбо, йоруба, кікую, (кі)рунді, ньянджа, оромо, сваті, сомалі, тигринья, тсвана, хауса, чві, шона, південна ндебеле та нігерійський піджин.

Ця помітна віха дасть змогу ще 300 мільйонам африканців взаємодіяти у вебпросторі за допомогою власного голосу, але у цьому світлі також стає видно, як багато ще належить зробити, щоб подолати цифровий розрив між Африкою й рештою світу.

Африка — другий за чисельністю населення континент світу, де проживає понад 1,34 млрд людей. Згідно з дослідженням, опублікованим на порталі Statista у липні 2024 року, Африка тримає пальму першості за багатомовністю серед континентів світу, адже тут налічують близько 2158 живих мов. Із цих мов близько 25% (520) побутують у Нігерії, тоді як 277 і 214 мов припадають відповідно на Камерун і Демократичну Республіку Конго. Найоднорідніша з точки зору мовного різноманіття африканська країна — Сейшели, де говорять всього чотирма мовами.

У відповідь на оголошення про підтримку нових мов у спільноті Google Перекладача Аламазан Джак (Alamazan Jak), користувач із Бусоги, що в Уганді, написав наступний коментар:

Congratulations on the exciting announcement! Expanding dictation to 13 African languages is a significant milestone. Your dedication to inclusivity and diversity is truly commendable.

However, I couldn't help but notice that Lusoga, a vital language spoken in Eastern Uganda, is not among the listed languages. As a proud speaker of Lusoga, I eagerly await its inclusion.

Could you please share any plans or timelines for adding Lusoga to Google Translate's supported languages? Your consideration would mean a great deal to the Lusoga-speaking community.

Thank you for your tireless efforts in breaking language barriers. I look forward to your response. 

Вітання з приводу такого чудового оголошення! Розширення голосового вводу для ще 13 африканських мов — це помітна віха. Ваша відданість справі інклюзивності та різноманітності дійсно гідна похвали.

Проте я не можу не відмітити, що серед перелічених мов немає соги, важливої мови, поширеної у Східній Уганді. Як людина, що з гордістю говорить на сога, я з нетерпінням чекаю на її включення.

Якщо можна, поділіться, будь ласка, планами або часовими орієнтирами, коли сога буде додана до мов, що підтримуються Google Перекладачем. Увага з вашого боку була б надзвичайно важливою для сога-мовної спільноти.

Дякую за ваші невтомні зусилля у подоланні мовних бар'єрів. З нетерпінням чекаю вашої відповіді.

З цього коментаря видно, що сога і тисячі інших африканських мов усе ще залишаються поза увагою, попри жагу користувачів до ширшого представлення мов. Сога (лусога) — мова, якою розмовляють понад 3 мільйони носіїв в Уганді.

В ході того, як технології штучного інтелекту (ШІ [укр.]) продовжують розвиватися й набувати популярності у світі, вони інтегруються в численні інструменти для автоматизації буденних справ, у багатьох випадках полегшуючи людям життя й роботу. Хоча інструменти ШІ все більше проникають у повсякденне життя в Африці, багато користувачів усе ще не мають доступу до них своєю рідною мовою. Якщо мови, такі як сога, не будуть включені при розробленні цих інструментів, сотні мільйонів африканців, напевно, не зможуть скористатися безмежними можливостями, які надає ШІ. Таке залишення за бортом ще дужче поглибить технологічний розрив між Африкою й рештою світу.

Цифровий мовний бар'єр може сповільнити економічне зростання багатьох африканських країн, заважаючи носіям корінних мов у доступі до можливостей працевлаштування та до онлайн-ринків. Виключення африканських корінних мов з розробки ШІ-інструментів, які використовуються у школах, може негативно позначитися на освітніх системах багатьох країн. Тим часом використання ШІ в освіті на континенті залишається на рівні всього лиш 12%.

Можливості для включення різних мов до сфери послуг

Основа економіки Африки — сільське господарство. Аграрний сектор є головним джерелом наповнення ВВП у багатьох африканських країнах. Понад 43% економічно активного населення Африки так-сяк перебивається, займаючись сільським господарством у віддалених куточках. Проте багато дрібних африканських фермерів стикаються з такими викликами, як непередбачувана погода, незахищеність продукції, відсутність належної логістичної інфраструктури, обмежений доступ до офіційних фінансових послуг, обмежений доступ до онлайн-ринків, спади в економіці, неграмотність багатьох фермерів тощо. Використання цифрових технологій на основі ШІ довело свою ефективність у пом'якшенні цих проблем. Проте більшість цих інструментів недоступні місцевими мовами фермерів.

Африка може похвалитися багатою культурною спадщиною і розмаїттям традицій. Мова — живильне підґрунтя цієї багатої спадщини і традицій. Мови слугують джерелом знань і традицій, а ще вони стають засобами вираження, через які культурна спадщина групи людей зберігається і передається з покоління в покоління.

Зважаючи на тривожну швидкість вимирання мов, Організація Об'єднаних Націй (ООН) проголосила 2022 року Міжнародне десятиліття мов корінних народів світу, щоб захистити загрожені мови і зберегти спільну спадщину людства. З 3000 мов, що вимирають чи перебувають під загрозою і, за прогнозами, повністю зникнуть до кінця XXI століття, 523 мови припадають на Африку. Виключення цих вразливих мов з розробки цифрових технологій прискорить насування загрози зникнення.

Багато африканських підприємців, розробників і дослідників, відповідаючи на обставини, втілюють ініціативи, що інтегрують африканські мови в технології. Гарним прикладом слугує нігерійський стартап Awarri, де працюють над створенням першої в Нігерії великої мовної моделі [укр.] з підтримкою багатьох мов. Кенійський стартап Code Vast також використовує ШІ для надання швидких порад щодо здоров'я місцевими кенійськими мовами, такими як суахілі, меру, кікую та луо. Lelapa AI розробляє інструменти машинного навчання, спроєктовані відповідно до саме африканських контекстів. Ще один стартап з Нігерії, Crop2Cash, створив технологію автоматизованої системи телефонних послуг під назвою FarmAdvice (“фермерські поради”). Завдяки штучному інтелекту дрібні фермери в режимі реального часу можуть отримати доступ до інформації стосовно сільського господарства та до служби розповсюдження знань своїми місцевими мовами, якщо зателефонують на безкоштовний номер з будь-якого пристрою у будь-який час.

Попри всі ці невпинні зусилля, спрямовані на те, щоб перекрити мовний розрив, необхідно ще інтегрувати більше мов, особливо тих, якими розмовляють у регіонах, де робота з подолання цифрової нерівності ведеться слабко чи й не проводиться зовсім. Технологічні гіганти, такі як Meta, Amazon, Uber [укр.], IBM, AWS та інші організації, чиї технології широко застосовуються в Африці, мають долучитися до справи, також надаючи вищий пріоритет інтеграції мов африканських меншин при розробленні своїх продуктів. Необхідні скоординовані зусилля місцевих стартапів та органів влади, щоб створити місцеві технології для охоплення територій, куди не сягають іноземні компанії.

Почати обговорення

Шановні автори, будь ласка увійти »

Правила

  • Усі коментарі перевіряються модератором. Не надсилайте свій коментар більше одного разу, інакше він може бути ідентифікований як спам.
  • Будь ласка, ставтесь з повагою до інших. Коментарі, які містять мову ненависті, непристойність та особисті образи, не будуть опубліковані.