دستیار مجازی اپل -سیری- از لحاظ قابلیت هایی که ارائه می دهد نسبت به دستیار صوتی گوگل در سطح پایین تری قرار دارد. اگرچه در گزارشی از رویتر، سیری یک مزیت کلیدی نسبت به دستیار های مجازی دیگر در بازار دارد و آن هم اینکه تعداد زبان هایی است که پشتیبانی می کند. در این گزارش حتی چگونگی فرایند اضافه شدن یک زبان به سیری نیز بیان شده است.

در کل، سیری از 21 زبان زنده دنیا پشتیبانی می کند و برای 36 کشور  پشتیبانی محلی دارد. در مقایسه، دستیار گوگل تنها از چهار زبان پشتیبانی می کند در حالی که الکسا آمازون بد تر از آن یعنی از دو زبان پشتیبانی می کند.

بنا به گفته اورن اتزیونی، مدیر اجرایی ارشد موسسه هوش مصنوعی آلن در سیاتل، اپل برتری خود را در حوزه دستیار مجازی حیف و میل کرده است. سیری قدیمی ترین دستیار مجازی صوتی در بازار می باشد و می بایست از قابلیت بهتری در تشخیص صدا و الگوریتم پاسخ بهره ببرد اما فعلا این چنین نیست.

این گزارش تنها چند روز بعد از انتشار دستیار اختصاصی گوگل به تمامی دیوایس های اندرویدی مارشملو و نوقا منتشر شد. همانطور که گفته شد این گزارش چگونگی اضافه شدن یک زبان را نیز بازگو می کند. در ابتدا اپل با یک تیم از افراد شروع می کند که آنها متونی از گویش ها و لهجه های متفاوت را می خوانند. سپس این متون به صورت دستی نوشته می شوند تا کامپیوتر بازنمود واقعی و دقیق متن خوانده شده را یاد بگیرد. به علاوه، این کمپانی صدا های مختلفی را ضبط می کند. بعد از این به «حالت دیکته» می رسیم که صدا کاربران به طور بی نام و نشان ضبط شده، و سپس توسط افراد رونویسی می شود تا خطاهای موجود در تشخیص گفتار را به حداقل برساند.

اپل از «حالت دیکته» در یک زبان جدید استفاده می کند، همان مترجم متن به گفتار. وقتی کاربران از این حالت استفاده می کنند، اپل درصد کوچکی از صدا انها را ضبط کرده و به صورت بی نام و نشان ذخیره می کند. این فایل ها تماما با صدا های اضافی در پس زمینه و کلمات زیر لب، توسط انسان رونویسی می شود، و این فرایندی است که کمک می کند میزان خطای تشخیص گفتار به نصف کاهش یابد.

 حالا اپل یک بازیگر صدا را استخدام می کند تا این زبان جدید را با صدای او ضبط کند و وقتی مقدار داده ها به اندازه کافی برای سوالات عمومی رسید، این زبان در اختیار عموم قرار می گیرد. و همانطور که کمپانی داده های بیشتری از کاربران جمع آوری می کند، هر چند هفته یکبار توییک هایی برای آن زبان منتشر می کند.

با این حال نظر چارلز جالی، سازنده یک دستیار صوتی به نام Ozlo، چیز دیگری است. او می گوید این روش مطلوبی برای توسعه یک دستیار صوتی نیست. یک محدودیتی برای تعداد نویسندگان که در هر زبان استخدام می کنید وجود دارد. راه حل بهتر این است که «پاسخ ها را ترکیب کنید» اما این هنوز بسیار زود است.

ضمنا، Viv که یک دستیار مجازی است که توسط سازندگان اصلی سیری توسعه یافته است- این مشکل خاص را حل می کند. این ابزار در استارتاپی در سال گذشته در اختیار شرکت سامسونگ قرار گرفت و انتظار می رود در پرچم داران امسال این شرکت دیده شود.

به کانال تلگرام ما بپیوندید

شما میتوانید با عضویت در کانال تلگرام ما از آخرین اخبار، آموزش ها و تخفیف های فروشگاه باخبر باشید.

ورود به کانال تلگرام