گفتارنویسهای جدید با امکانات گسترده
۱۳۸۷ شهریور ۵, سهشنبه۲۰ سال پیش، اینکه رایانهها هم قادر به شنیدن و فرمانبردن از شنیدهها باشند، تنها یک رؤیا بود، کاری که امروز عملی است. نرمافزارهای "گفتارنویس" ، نرمافزارهای رایانهای هستند که واژه و جملات صوتی را تشخیص میدهند و آنها را به نوشته تبدیل میکنند.
شرکت آمریکایی "نوانس" (Nuance) چندی است که نرمافزار جدید تشخیص زبان خود، موسوم به "Dragon NaturallySpeaking 10" ، را معرفی کرده است. کمی پیشتر هم رقیب این شرکت، یعنی شرکت "لینگواتک" آلمان (Linguatec) نسخه جدید "Voice Pro 11" را روانه بازار کرده بود. اما چه انتظاری میتوان از این نرمافزارها داشت و چه کسی میتواند از آنها استفاده کند؟
شرکت "لینگواتک" که در مونیخ آلمان دفتر دارد، مدعی است که پس از دو سال تحقیق و بررسی، نسخه جدید نرمافزار "Voice Pro" را به بازار عرضه کرده که به ویژه تحت سیستم عامل ویستا، از قابلیتهای بالاتر و قدرت تشخیص بهتری برخوردار است. شرکت "نوانس" هم دقت بیشتر، تشخیص بهتر در زمان کمتر، دستورهای گفتاری هوشمند و در پی آن، کنترل بهتر رایانه را از ویژگیهای نرمافزار جدید خود برمیشمرد.
قدرت تشخیص ۸۰ درصدی
"نوانس" اعلام کرده است که نرمافزار "دراگون" این شرکت، با برنامههای "Outlook" ، "اینترنت اکسپلورر" ، مجموعۀ "آفیس" و حتی "فایرفاکس" و "تاندربِرد" همخوانی دارد ولی از "OpenOffice" پشتیبانی نمیکند. مارتین هلد، مدیر تولید این شرکت، همچنین میگوید که "نوانس" موفق شده نسخه جدید برنامه را طوری طراحی کند که ۲۰ درصد کمتر از نسخههای پیشین اشتباه میکند. اگر کاربر عادی با نرمافزار کار کند، "دراگون" ۸۰ درصد گفتار او را درک میکند. بیشترین کارایی سیستم زمانی است که کاربر آموزشدیده با آن کار میکند که به این ترتیب توانایی گفتارنگار به ۹۹ درصد میرسد.
کاربر برای استفاده از نرمافزار، متن را برای رایانه بلند میخواند. سپس رایانه با استفاده از سیگنالهای آکوستیک صدای شخص، خصوصیات گفتاری او را مشخص میکند، به این معنی که گوینده چگونه صحبت میکند، در گفتار زیاد مکث میکند یا کم و ... . کار رایانه این است که واژهها و جملاتی را که در هنگام گفتن، بدون مکث و در دل هم ادا میشوند از هم تشخیص دهد، آنها را به درستی بخش کند و با نمونههایی که در بانک اطلاعاتی خود دارد مقایسه کرده و واژه درست را بنویسد.
دایره واژگان محدود
نرمافزارهای "گفتارنویس" باید طوری طراحی شده باشند که واژههای همآوا اما با معنی متفاوت، آنها را ناکارآمد نکند. برای این منظور تعداد زیادی متن در بانک اطلاعاتی این برنامهها قرار داده شده است. با استفاده از این متنها رایانه قادر خواهد بود واژهای همچون "صواب" را از "ثواب" تشخیص دهد.
به همین دلیل پای این دست نرمافزارها به حوزههایی باز شده که در آنها متنهای بسیاری وجود دارند ولی میتوان از دایره واژگان روشن استفاده کرد: پزشکی، حقوق و بخش اداری. هم لینگواتک و هم نوانس نسخههای ویژهای را برای هر کدام از این حوزهها در نظر گرفتهاند که از بدو تولید بسیاری از این واژههای پیچیده و تخصصی را در بانک اطلاعاتی خود دارند.
وولفگانگ هوپنر، استاد زبانشناسی رایانهای دانشگاه دویسبورگ-اِسِن آلمان، تأکید میکند که هرچه در هنگام صحبت از دایره واژگان محدودتری استفاده شود، توانایی تشخیص نرمافزار بالاتر خواهد بود.
وی همچنین معتقد است که نویسندگان و روزنامهنگاران و بهطور کلی تمام کسانی که از واژههای خاص و خارج از واژههای معمول استفاده میکنند، باید برای استفاده از نرمافزارهای "گفتارنویس" ، به دایره واژگان محدودتر رضایت دهند.
۱۶۰ واژه در دقیقه
دیکته کردن به جای نوشتن از همه بیشتر به کار کسانی میآید که خیلی با نوشتن سروکار دارند اما انگشتانشان به سرعت و دقت یک تایپیست ماهر روی حروف صفحهکلید فرود نمیآیند. "نوانس" ضمانت کرده که نرمافزار این شرکت توانایی نگارش ۱۶۰ واژه در دقیقه را دارد، یعنی همان سرعتی که - بر اساس یک بررسی – انسانها صحبت میکند.
تحقیقات نشان میدهد که یک کاربر عادی قادر است در هر دقیقه ۳۵ واژه را با دقت تنها ۵۸ درصد تایپ کند. بدین ترتیب با استفاده از نرمافزارهای یادشده، سرعت کار بسیاری از کاربران افزایش میابد.
نسخه خانگی برنامه "دراگون" از ۹۹ یورو به بالا فروخته میشود. نسخه حرفهای آن با تواناییهای جانبی، ۱۹۹ یورو قیمت دارد. این نسخه قادر است گفتار ضبطشده با ضبطصوت را هم تشخیص داده و تایپ کند. بهای نسخه ویژه پزشکان و وکیلان هم ۹۹۹ یورو است.
برنامه شرکت لینگواتک ارزانتر است: بهای نسخه بهروزِ برنامۀ "VoicePro" برای وکیلان و پزشکان، ۳۹۹ یورو است. دیگر کاربران هم برای یک نسخه کامل برنامه ۱۹۹ یورو میپردازند.
ویژگیهایی که رایانه باید داشته باشد
افزایش قابلیتهای نرمافزارهای "گفتارنگار" ، هنوز به معنای خداحافظی با موشوارهها و صفحهکلیدها نیست. مارتین هلد، مدیر تولید شرکت "نوانس" ، معتقد است که هر کس که میخواهد از حداکثر توان رایانه خود استفاده کند باید دو دست و صدای خود را با هم به کار بگیرد.
برای استفاده همزمان از نرمافزارهای "گفتارنگار" در کنار فعالیتهای معمولی که با رایانه انجام میشود (مانند ایمیل و کار بر روی متن و گشتوگذار اینترنتی) باید رایانه قدرتمندی در اختیارداشت. شرکت "نوانس" حداقل یک گیگابایت حافظۀ نقد (RAM) و پردازشگر (CPU) ۴/ ۲ گیگاهرتزی (یا پردازشگر دو هستهای (Dual-Core Processor) ۷/ ۱ گیگاهرتزی) را برای استفاده از نرمافزار خود لازم میداند. "VoicePro" هم با پردازشگر ۵/ ۱ گیگاهرتزی و حافظۀ نقد ۵۱۲ مگابایتی قابل اجراست.