Intron، یک استارتآپ هوش مصنوعی مستقر در لاگوس، به طور رسمی Sahara-v2، مدل صوتی هوش مصنوعی نسل دوم پرچمدار خود را راهاندازی کرده است که به طور مؤثری استانداردهای جهانی تشخیص گفتار را ارتقا میدهد. این مدل از 24 زبان جدید آفریقایی پشتیبانی میکند و بیش از 500 لهجه متمایز انگلیسی آفریقایی را تسلط دارد و پوشش کل زبانی شرکت را به 57 زبان بیسابقه میرساند.
برای سالها، تعامل با دستیارهای صوتی جهانی مانند Siri، Alexa یا موتورهای استاندارد تبدیل متن به گفتار مانند صحبت کردن با دیواری بوده است که اساساً زبان شما را نمیفهمد. همه ما این تجربه را داشتهایم که سعی کنیم از یک دستور صوتی استفاده کنیم تا عبارت محلی مانند "No worry, e go better" به "No war eagle butter" بیمعنی رونویسی شود. در ابتدا خندهدار است، اما وقتی "Wanjiru" به "One zero" دیجیتالی میشود و "Chukwuebuka" به طور غیرقابل توضیحی به "Check wheelchair baker" تبدیل میشود، شوخی به سرعت محو میشود.
این شکستهای مکرر رونویسی بیش از یک اشتباه فنی صرف هستند؛ آنها یک شکل فعال از طرد دیجیتال هستند. مدلهای هوش مصنوعی پیشرو جهانی که عمدتاً بر اساس مجموعه دادههای غربی ساخته شدهاند، کاملاً در اینجا هدف را از دست میدهند. آنها برای غنای تُنال گفتار ما که یک کلمه واحد میتواند بسته به تلفظ شش معنی مختلف داشته باشد، طراحی نشدهاند. آنها در تعویض کد ریتمیک طبیعی ما دچار مشکل میشوند و نمیتوانند درک کنند که یک دفتر واحد ممکن است کارکنانی با ده لهجه کاملاً متفاوت داشته باشد. وقتی دستیارهای صوتی کلمات و نامهای پایه را اشتباه درک میکنند، میلیونها کاربر را از میانبرهای دیجیتالی که زندگی مدرن را آسانتر میکنند، محروم میسازند.
Intron
Sahara-v2 این شکاف حیاتی را پر میکند زیرا بر اساس فرضیات ساخته نشده یا در یک استودیوی ساکت و استریل آموزش داده نشده است. Intron این مدل را با رفتن به خیابانها و گوش دادن ساخت. مجموعه داده عظیم و فوقالعاده محلی است: بیش از 14 میلیون کلیپ صوتی، در مجموع بیش از 50000 ساعت گفتار، از بیش از 40000 گویشگو تهیه شده است. این صداها نمایانگر 64 زبان آفریقایی و دیاسپورا در بیش از 30 کشور هستند. به طور حیاتی، آنها در جاهایی که هوش مصنوعی واقعاً باید عمل کند، در کلینیکهای شلوغ، بازارهای پرسروصدا، مراکز تماس پرجنبوجوش و دادگاهها ضبط شدند.
این رویکرد از پایین به بالا و دنیای واقعی به Sahara-v2 اجازه داده است تا بزرگترین نامهای فناوری جهانی را پشت سر بگذارد. هنگامی که در برابر غولهای صنعت مانند Gemini-3، GPT-4، Whisper، ElevenLabs، AWS و Azure مقایسه میشود، مدل Intron برتری قابل توجهی ارائه میدهد.
این مدل نرخ دقت 68.6 درصد بهتر در نامها، سازمانها و مکانهای آفریقایی ارائه میدهد و 55.6 درصد دقیقتر در رونویسی اعداد، کسرها و ارزها عمل میکند. علاوه بر این، 36.5 درصد مقاومت بیشتری در برابر توهمات هوش مصنوعی ناشی از نویز پسزمینه و گویشگوهای همپوشانی دارد، در کنار 46.7 درصد بهبود عملکرد در بخشهای تخصصی مانند مراقبتهای بهداشتی، حقوق، مخابرات و امور مالی.
فراتر از معیارهای چشمگیر، Sahara-v2 یک موتور بهرهوری جدی است که برای استقرار سازمانی در دنیای واقعی طراحی شده است. با پشتیبانی API های قوی که میتوانند در کمتر از پنج دقیقه مستقر شوند، این زیرساخت در حال حاضر به طور فعال بانکداری صوتی، فرآیندهای خودکار مشتری خودت را بشناس و سیستمهای پر کردن خودکار برای همه چیز از دادههای بهداشتی تا فرمهای افتتاح حساب را تقویت میکند. پذیرفتهکنندگان اولیه سازمانی گزارش میدهند که این فناوری زمانهای پردازش اداری را تا 4.4 برابر کاهش میدهد.
برای رسیدگی به واقعیتهای زبانی منحصر به فرد قاره، Intron ویژگیهای منطقهای بسیار تخصصی را ارائه کرده است. در همکاری با Penda Health کنیا، آنها اولین مدل دوزبانه سواحیلی-انگلیسی تشخیص خودکار گفتار (ASR) جهان را معرفی کردند که به طور کامل نحوه تعویض طبیعی افراد بین زبانها در میانه جمله را ثبت میکند.
برای بازار اینجا، آنها یک مدل بومی تبدیل متن به گفتار (TTS) هائوسا را راهاندازی کردهاند که رباتهای صوتی با تأخیر کم و 24/7 را فعال میکند. و برای دولتها و شرکتهایی که با نگرانیهای حریم خصوصی دادهها روبرو هستند، راهاندازی Sahara-v2 شامل پشتیبانی آفلاین جدید است که به دادهها اجازه میدهد برای انطباق با هوش مصنوعی حاکمیتی ایمن و محلی باقی بمانند.
Sahara-v2 شرکت Intron
شرکتها و مشتریان دولتی در شش کشور در حال حاضر از این سیستم استفاده میکنند. Ayo Oluleye، رئیس داده و بینش در ARM Investments، اظهار داشت: "با استفاده از مدلهای هوش مصنوعی Intron، ما بهبود قابل توجهی در رونویسیها و خلاصهها در مقایسه با مدلهایی که قبلاً بررسی کردیم، مشاهده کردهایم. سیستمهای آنها زمینه و ظرافت را بهتر ثبت میکنند که منجر به نتایج دقیقتر میشود." Sarah Morris، CPO در Audere، این موضوع را تأیید کرد و نرخ موفقیت بیش از 99 درصدی API و دقت عالی در لهجههای جنوب آفریقایی را گزارش کرد.
همزمان با راهاندازی Sahara-v2، Intron همچنین گزارش هوش مصنوعی صوتی آفریقا 2026 افتتاحی خود را منتشر کرد. این انتشار نگاهی جامع و اولین نوع خود به اکوسیستم ارائه میدهد و درسهای آموخته شده از استقرار هوش مصنوعی صوتی در محیطهای پیچیده را برای راهنمایی استارتآپها، سرمایهگذاران و سیاستگذاران تشریح میکند.
همچنین بخوانید: Google برای آموزش هوش مصنوعی به 21 زبان آفریقایی، از جمله یوروبا، هائوسا و ایگبو
جدیدترین زبانها شامل فرانسوی آفریقایی، آفریکانس، آکان، امهری، عربی، بمبا، فولانی، گا، هائوسا، ایگبو، کینیارواندا، لوگاندا، اورومو، پدی و پیجین هستند. دیگران شامل سسوتو، شونا، سواحیلی، تسوانا، توی، ولوف، خوسا، یوروبا و زولو هستند. با این اضافات، در نهایت در به دنیای دیجیتال به طور گسترده باز میشود.
همانطور که Tobi Olatunji، مدیر عامل Intron، گفت: "Sahara-v2 ثابت میکند که وقتی فناوری با درک عمیق فرهنگی و زبانی ساخته شود، اتفاقات شگفتانگیزی میتواند رخ دهد و ما تازه شروع کردهایم."
پست Intron راهاندازی Sahara-v2، یک مدل صوتی هوش مصنوعی با پشتیبانی از 24 زبان جدید آفریقایی برای اولین بار در Technext ظاهر شد.


