کد خبر: 481
معاون فنی شورای عالی اطلاع رسانی:

حفظ پیکره متنی زبان فارسی به شورای زیرساخت سپرده شد

minaei2سینا: معاون فنی شورای عالی اطلاع رسانی گفت: با تشکیل شورای زیرساخت، حفظ پیکره متنی زبان فارسی در محیط وب به شورای زیرساخت سپرده شد.
بهروز مینائی در گفت و گو با آژانس خبری صنعت ارتباطات (سینا) افزود: طرح شورای عالی اطلاع رسانی برای گسترش خط و زبان فارسی در محیط اینترنت سبب شد تا یک سند راهبردی نوشته شود که در کارگروه خط و زبان فارسی طی بحث های مفصل چند ماهه، چشم انداز این طرح تعریف شد.
به گفته وی، طبق چشم انداز تعیین شده، شورای زیرساخت تشکیل شد که وظیفه اش پرداختن به ایجاد پیکره متنی زبان فارسی است.
او افزود: پیکره متنی زبان فارسی را مجموعه عظیمی از داده های زبان فارسی مانند روزنامه ها، مجلات، وبلاگ ها، کتاب ها، کتاب های درسی و خبرهای مکتوب که در اینترنت و خارج از فضای اینترنت یافت می شود را شامل می شود.
مینایی اظهارکرد: در حال حاضر پژوهشکده پردازش هوشمند علائم، یک پیکره ۱۰۰ میلیونی را خریداری کرده است که در اختیار پژوهشگران و محققان قرار می دهد.
معاون فنی شورای عالی اطلاع رسانی ادامه داد: این پیکره ۱۰ میلیون نشانه صرفی و نحوی کلمات فارسی را دربردارد.



نظرات غیرفعال است.