به گزارش فرهنگ امروز به نقل از فارس؛ هدی سادات جعفری مجری طرح با بیان اینکه دنیای کنونی دنیای انتقال اطلاعات بوده و این انتقال به صورتهای مختلفی مانند متن، صوت و تصویر انجام میشود، افزود: امروزه، با رشد روز افزون اطلاعات و قرار گرفتن حجم بالایی از فایلهای صوتی بر روی شبکهها و کامپیوترها، یافتن راهحلهای کارا برای ذخیرهسازی، بازیابی، جستجو و مرورگری سریع این فایلهای صوتی مورد نیاز است.
وی خلاصهسازی گفتار را یکی از راههای پیشنهادی برای انتقال سریعتر اطلاعات گفتاری نام برد و اظهار داشت: با اجرای مطالعاتی اقدام به طراحی و ساخت نرمافزاری برای خلاصهسازی فایلهای صوتی شد. این نرمافزار قادر است اطلاعات مهم فایلهای گفتاری را پیدا کند و به صورت خلاصه شده در خروجی به کاربر تحویل دهد.
جعفری با تاکید بر اینکه طراحی این نرمافزار صرفهجویی در زمان و تسهیل دسترسی به نکات کلیدی فایلهای گفتاری را به دنبال خواهد داشت، خاطر نشان کرد: در طراحی این نرم افزار از روش یادگیری ماشین به نام روش «نیمهنظارتی» استفاده شده است به این معنی که یکسری داده کم از قبل به ماشین ارائه میشود تا ماشین چگونگی خلاصهسازی را یاد بگیرد و ماشین با استفاده از مدل های ساخته شده میتواند فایلهای بعدی را خلاصهسازی کند.
جعفری با بیان اینکه نرمافزار طراحی شده در مرحله تحقیقاتی قرار دارد، تاکید کرد: در این نرمافزار کاربران با وارد کردن فایل گفتاری و انتخاب درصد خلاصهسازی میتوانند از فایل خلاصهسازی شده استفاده کنند. جعفری اضافه کرد: در این نرم افزار خلاصهسازی گفتار بدون استفاده از سامانه بازشناسی گفتار ارائه شده است. به این صورت که بخشهای شاخص گفتار مستقیما از روی سیگنال گفتار شناسایی میشوند و خلاصه به صورت گفتاری در اختیار کاربر قرار میگیرد.
مجری طرح، با بیان اینکه در حال حاضر این نرم افزار برای خلاصه سازی فایلهای گفتار رسمی مانند فایلهای گفتاری اخبار رادیو و تلویزیون کاربرد دارد، یادآور شد: اضافه کردن قابلیتهایی مانند پشتیبانی از خلاصهسازی فایلهای جلسات که چندین گوینده دارد، سخنرانیها، کلاسهای درس،... از دیگر برنامههای پیش روی این نرمافزار هستند. وی استفاده از این نرمافزار را در موتورهای جستجو مفید دانست و عنوان کرد: با پیشرفت این نرم افزار میتوانیم فایلهای گفتاری را با استفاده از کلمات کلیدی جستجو کنیم