1. Inhalt
  2. Navigation
  3. Weitere Inhalte
  4. Metanavigation
  5. Suche
  6. Choose from 30 Languages

دانش و فناوری

گفتارنویس‌های جدید با امکانات گسترده

نرم‌افزارهای جدید "گفتارنویس" به بازار آمده‌اند که نسبت به نمونه‌های پیشین خود از دقت و سرعت بیشتری برخوردارند. این نرم‌افزارهای نه‌چندان ارزان، ۸۰ درصد جمله‌ها را تشخیص داده و ‌قابلیت نوشتن ۱۶۰ واژه در دقیقه را دارند.

default

"Dragon NaturallySpeaking 10" متعلق به شرکت Nuance

۲۰ سال پیش، این‌که رایانه‌ها هم قادر به شنیدن و فرمان‌بردن از شنیده‌ها باشند، تنها یک رؤیا بود، کاری که امروز عملی است. نرم‌افزارهای "گفتارنویس" ، نرم‌افزارهای رایانه‌ای هستند که واژه و جملات صوتی را تشخیص می‌دهند و آنها را به نوشته تبدیل می‌کنند.

شرکت آمریکایی "نوانس" (Nuance) چندی است که نرم‌افزار جدید تشخیص زبان خود، موسوم به "Dragon NaturallySpeaking 10" ، را معرفی کرده است. کمی پیش‌تر هم رقیب این شرکت، یعنی شرکت "لینگواتک" آلمان (Linguatec) نسخه جدید "Voice Pro 11" را روانه بازار کرده بود. اما چه انتظاری می‌توان از این نرم‌افزارها داشت و چه کسی می‌تواند از آنها استفاده کند؟

شرکت "لینگواتک" که در مونیخ آلمان دفتر دارد، مدعی است که پس از دو سال تحقیق و بررسی، نسخه جدید نرم‌افزار "Voice Pro" را به بازار عرضه کرده که به ویژه تحت سیستم عامل ویستا، از قابلیت‌های بالاتر و قدرت تشخیص بهتری برخوردار است. شرکت "نوانس" هم دقت بیشتر، تشخیص بهتر در زمان کمتر، دستورهای گفتاری هوشمند و در پی آن، کنترل بهتر رایانه را از ویژگی‌های نرم‌افزار جدید خود برمی‌شمرد.

قدرت تشخیص ۸۰ درصدی

"نوانس" اعلام کرده است که نرم‌افزار "دراگون" این شرکت، با برنامه‌های "Outlook" ، "اینترنت اکسپلورر" ، مجموعۀ "آفیس" و حتی "فایرفاکس" و "تاندربِرد" هم‌خوانی دارد ولی از "OpenOffice" پشتیبانی نمی‌کند. مارتین هلد، مدیر تولید این شرکت، هم‌چنین می‌گوید که "نوانس" موفق شده نسخه جدید برنامه را طوری طراحی کند که ۲۰ درصد کمتر از نسخه‌های پیشین اشتباه می‌کند. اگر کاربر عادی با نرم‌افزار کار کند، "دراگون" ۸۰ درصد گفتار او را درک می‌کند. بیشترین کارایی سیستم زمانی است که کاربر آموزش‌دیده با آن کار می‌کند که به این ترتیب توانایی گفتارنگار به ۹۹ درصد می‌رسد.

کاربر برای استفاده از نرم‌افزار، متن را برای رایانه بلند می‌خواند. سپس رایانه با استفاده از سیگنال‌های آکوستیک صدای شخص، خصوصیات گفتاری او را مشخص می‌کند، به این معنی که گوینده چگونه صحبت می‌کند، در گفتار زیاد مکث می‌کند یا کم و ... . کار رایانه این است که واژه‌ها و جملاتی را که در هنگام گفتن، بدون مکث و در دل هم ادا می‌شوند از هم تشخیص دهد، آنها را به درستی بخش کند و با نمونه‌هایی که در بانک اطلاعاتی خود دارد مقایسه کرده و واژه درست را بنویسد.

دایره واژگان محدود

نرم‌افزارهای "گفتارنویس" باید طوری طراحی شده باشند که واژه‌های هم‌آوا اما با معنی متفاوت، آنها را ناکارآمد نکند. برای این منظور تعداد زیادی متن در بانک اطلاعاتی این برنامه‌ها قرار داده شده است. با استفاده از این متن‌ها رایانه قادر خواهد بود واژه‌ای هم‌چون "صواب" را از "ثواب" تشخیص دهد.

به همین دلیل پای این دست نرم‌افزارها به حوزه‌هایی باز شده که در آنها متن‌های بسیاری وجود دارند ولی می‌توان از دایره واژگان روشن استفاده کرد: پزشکی، حقوق و بخش اداری. هم لینگواتک و هم نوانس نسخه‌های ویژه‌ای را برای هر کدام از این حوزه‌ها در نظر گرفته‌اند که از بدو تولید بسیاری از این واژه‌های پیچیده و تخصصی را در بانک اطلاعاتی خود دارند.

وولفگانگ هوپنر، استاد زبان‌شناسی رایانه‌ای دانشگاه دویسبورگ-اِسِن آلمان، تأکید می‌کند که هرچه در هنگام صحبت از دایره واژگان محدودتری استفاده شود، توانایی تشخیص نرم‌افزار بالاتر خواهد بود.

وی ‌همچنین معتقد است که نویسندگان و روزنامه‌نگاران و به‌طور کلی تمام کسانی که از واژه‌های خاص و خارج از واژه‌های معمول استفاده می‌کنند، باید برای استفاده از نرم‌افزارهای "گفتارنویس" ، به دایره واژگان محدودتر رضایت دهند.

۱۶۰ واژه در دقیقه

دیکته کردن به جای نوشتن از همه بیشتر به کار کسانی می‌آید که خیلی با نوشتن سروکار دارند اما انگشتان‌شان به سرعت و دقت یک تایپیست ماهر روی حروف صفحه‌کلید فرود نمی‌آیند. "نوانس" ضمانت کرده که نرم‌افزار این شرکت توانایی نگارش ۱۶۰ واژه در دقیقه را دارد، یعنی همان سرعتی که - بر اساس یک بررسی – انسان‌ها صحبت می‌کند.

تحقیقات نشان می‌دهد که یک کاربر عادی قادر است در هر دقیقه ۳۵ واژه را با دقت تنها ۵۸ درصد تایپ کند. بدین ترتیب با استفاده از نرم‌افزارهای یادشده، سرعت کار بسیاری از کاربران افزایش میابد.

نسخه خانگی برنامه "دراگون" از ۹۹ یورو به بالا فروخته می‌شود. نسخه حرفه‌ای آن با توانایی‌های جانبی، ۱۹۹ یورو قیمت دارد. این نسخه قادر است گفتار ضبط‌شده با ضبط‌صوت را هم تشخیص داده و تایپ کند. بهای نسخه ویژه پزشکان و وکیلان هم ۹۹۹ یورو است.

برنامه شرکت لینگواتک ارزان‌تر است: بهای نسخه به‌روزِ برنامۀ "VoicePro" برای وکیلان و پزشکان، ۳۹۹ یورو است. دیگر کاربران هم برای یک نسخه کامل برنامه ۱۹۹ یورو می‌پردازند.

ویژگی‌هایی که رایانه باید داشته باشد

افزایش قابلیت‌های نرم‌افزارهای "گفتارنگار" ، هنوز به معنای خداحافظی با موشواره‌ها و صفحه‌کلیدها نیست. مارتین هلد، مدیر تولید شرکت "نوانس" ، معتقد است که هر کس که می‌خواهد از حداکثر توان رایانه خود استفاده کند باید دو دست و صدای خود را با هم به کار بگیرد.

برای استفاده هم‌زمان از نرم‌افزارهای "گفتارنگار" در کنار فعالیت‌های معمولی که با رایانه انجام می‌شود (مانند ایمیل و کار بر روی متن و گشت‌وگذار اینترنتی) باید رایانه قدرتمندی در اختیارداشت. شرکت "نوانس" حداقل یک گیگابایت حافظۀ نقد (RAM) و پردازشگر (CPU) ۴/ ۲ گیگاهرتزی (یا پردازشگر دو هسته‌ای (Dual-Core Processor) ۷/ ۱ گیگاهرتزی) را برای استفاده از نرم‌افزار خود لازم می‌داند. "VoicePro" هم با پردازشگر ۵/ ۱ گیگاهرتزی و حافظۀ نقد ۵۱۲ مگابایتی قابل اجراست.