مکالمه خصوصی در اتاق های پر سر و صدا با یک هدفون جدید
به گزارش نئوپدیا، هدفون های «ایزوله کننده مکالمه» مجهز به هوش مصنوعی، امکان مکالمه خصوصی را در اتاق های پر سر و صدا فراهم می کنند. این دستیار شنوایی فعال، گویندگان را در عرض چند ثانیه شناسایی کرده و هر صدای دیگری را سرکوب می کند و در آزمایش های اولیه موفق نشان داده است.
به گزارش نئوپدیا به نقل از ایسنا، افراد در اتاق های شلوغ، هنگام پخش موسیقی، صدای تق و تق بشقاب ها و با وجود ده ها مکالمه میان افراد مختلف صحبت می کنند و برای بسیاری، گوش دادن به یک صدا به گوش تیز کردن و تلاش ذهنی زیادی نیاز دارد. این در شرایطی است که این سعی برای اشخاصی که مشکلات شنوایی دارند، می تواند طاقت فرسا باشد.
حالا تعدادی از پژوهشگران دانشگاه واشینگتن(Washington) می گویند که راهی برای عبور از این سر و صدا پیدا کرده اند.
هدفون های هوشمند جدید مجهز به هوش مصنوعی می توانند به صورت خودکار صدای طرف مقابل مورد نظر کاربر برای مکالمه را از هرج و مرج اطراف جدا کنند.
فناوری شنوایی هوشمندتر
بر خلاف دستگاههای ایزوله کننده گفتار موجود، نمونه اولیه این هدفون جدید منتظر ورودی دستی نمی ماند. هدفون ها تشخیص می دهند که چه کسی بخشی از مکالمه است و صداهایی را که با ریتم گفتار نوبتی مطابقت ندارند، خاموش می کنند.
یک مدل هوش مصنوعی الگوهای زمان بندی را تحلیل و بررسی می کند و دیگری صداهای نامربوط را فیلتر می کند.
این سیستم، طرف های مکالمه را در عرض دو تا چهار ثانیه شناسایی می کند.
این تیم، کار خویش را بتازگی در چین و در کنفرانس روش های تجربی در پردازش زبان طبیعی به اشتراک گذاشت. شایان ذکر است که کد اصلی آن متن باز است.
محققان اعتقاد دارند که این فناوری می تواند از سمعک ها، هدفون ها و عینک های هوشمند آینده پشتیبانی کند.
شیام گولاکوتا(Shyam Gollakota)، نویسنده ارشد این مطالعه اظهار داشت که رویکرد های قبلی بسیار فراتر از انتظار کاربران هستند.
وی ادامه داد: رویکرد های موجود برای شناسایی این که فرد به چه کسی گوش می دهد، به طور عمده شامل الکترودهای کاشته شده در مغز برای ردیابی توجه است.
وی اشاره کرد که الگوهای طبیعی در گفتگو، مسیر بهتری را عرضه می دهند.
گولاکوتا افزود: بینش ما اینست که وقتی با گروه خاصی از افراد صحبت می نماییم، گفتار ما به صورت طبیعی از یک ریتم نوبتی پیروی می کند و ما می توانیم هوش مصنوعی را آموزش دهیم تا این ریتم ها را فقط با بهره گیری از صدا، بدون احتیاج به کاشت الکترود، پیش بینی و ردیابی کند.
نحوه رفتار این هدفون در استفاده واقعی
این سیستم زمانی فعال می شود که فرد آغاز به صحبت می کند. مدل اول، بررسی این که «چه کسی چه زمانی صحبت کرده است» را اجرا می کند و بدنبال همپوشانیِ کم بین گویندگان می گردد.
مدل دوم سیگنال را پالایش می کند و صدای ایزوله شده را به شکل لحظه ای به کاربر بازمی گرداند.
نمونه اولیه اکنون از مکالماتی که شامل کاربر و حداکثر چهار گوینده دیگر می شود، بدون تأخیر قابل توجه پشتیبانی می کند. محققان این تجربه را با ۱۱ شرکت کننده آزمایش کردند.
آنها وضوح، حذف نویز و درک مطلب را با و بدون فیلترها ارزیابی کردند. نسخه فیلتر شده بیشتر از دو برابر امتیاز بیشتری به دست آورد.
این پروژه بر مبنای آزمایش های قبلی تیم «گولاکوتا» تولید شده است. نمونه های اولیه قبلی احتیاج به نگاه کردن به فرد برای جداسازی صدای او یا تنظیم حباب های صوتی مبتنی بر فاصله داشتند.
گویلین هو(Guilin Hu)، محقق ارشد این مطالعه می گوید: طراحی جدید، این مراحل را حذف می کند. هر کاری که ما قبلاً انجام داده ایم، مستلزم آن است که کاربر به شکل دستی یک گوینده خاص یا فاصله ای را که باید گوش دهد، انتخاب نماید که برای تجربه کاربر خوب نیست.
وی ادامه داد: این سیستم جدید به صورت خودکار واکنش نشان میدهد. آن چه ما نشان داده ایم، یک تکنولوژی است که پیشگیرانه عمل می کند و چیزی است که قصد انسان را به شکل غیرتهاجمی و خودکار استنباط می کند.
البته فضا و گفتارهای آشفته هنوز مشکلاتی را به وجود می آورد. قطع کردن صحبت افراد، صحبت کردن بین حرف های یکدیگر یا پیوستن به مکالمه در حین مکالمه می تواند ردیابی را گیج کند.
در عین حال، نتایج اولیه تیم را تحت تاثیر قرار داد. مدلها برای زبان های انگلیسی، ماندارین و ژاپنی آموزش دیده بودند و زبان های دیگر ممکنست احتیاج به تنظیمات داشته باشند.
نسخه فعلی از هدفون های روگوشی تجاری و مدارهای پایه استفاده می نماید. «گولاکوتا» انتظار دارد که این فناوری به هدفون های داخل گوشی یا سمعک ها هم توسعه یابد. همین تیم نشان داد که مدلهای هوش مصنوعی مشابه می توانند روی تراشه های به اندازه سمعک اجرا شوند.
بطور خلاصه به گزارش نئوپدیا به نقل از ایسنا، افراد در اتاق های شلوغ، هنگام پخش موسیقی، صدای تق و تق بشقاب ها و با وجود ده ها مکالمه میان افراد مختلف صحبت می کنند و برای بسیاری، گوش دادن به یک صدا به گوش تیز کردن و تلاش ذهنی زیادی نیاز دارد. این در شرایطیست که این اهتمام برای اشخاصی که مشکلات شنوایی دارند، می تواند طاقت فرسا باشد. وی افزود: رویکرد های موجود برای شناسایی اینکه فرد به چه کسی گوش می دهد، بطور عمده شامل الکترودهای کاشته شده در مغز برای ردیابی توجه است.
منبع: neopedia.ir
این مطلب نئوپدیا را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب