جمع‌آوری و تحلیل داده یکی از گام‌های اساسی پژوهش در بسیاری از زمینه‌های تحقیقاتی است. مدیریت صحیح داده‌های پژوهشی موجب می‌شود که پژوهشگران هم خود بتوانند بعدها به داده‌ها مراجعه کنند و در پژوهش‌های دیگر خود از آن‌ها استفاده نمایند، و هم با اشتراک‌گذاری داده‌ها این امکان را برای سایر پژوهشگران فراهم نمایند که بتوانند آن داده‌ها را برای اهداف دیگر مورد استفاده قرار دهند.

حوزه شفافیت داده باز Open Data Scope
موضوع راهنما، آموزشی Learning, Educational Subject
جغرافیا ایران Iran Geography
نوع مطلب متن Text Type
زبان فارسی Farsi Language
منتشر کننده سومین همایش ملی زبانشناسی و آموزش زبان فارسی Publisher

چکیده مقاله

جمع‌آوری و تحلیل داده یکی از گام‌های اساسی پژوهش در بسیاری از زمینه‌های تحقیقاتی است. مدیریت صحیح داده‌های پژوهشی موجب می‌شود که پژوهشگران هم خود بتوانند بعدها به داده‌ها مراجعه کنند و در پژوهش‌های دیگر خود از آن‌ها استفاده نمایند، و هم با اشتراک‌گذاری داده‌ها این امکان را برای سایر پژوهشگران فراهم نمایند که بتوانند آن داده‌ها را برای اهداف دیگر مورد استفاده قرار دهند. این مسئله در خصوص داده‌های زبانی، یعنی داده‌هایی که برای مطالعه یا پردازش زبان از آن استفاده می‌شود، نیز صادق است و زبان‌شناسان و متخصصان پردازش رایانه‌ای زبان می‌توانند با رعایت نکات مربوط به مدیریت داده‌های زبانی، گام مثبتی در پژوهش‌های حوزه تخصصی خود بردارند. در این پژوهش ضمن تعریف و ارائه توضیحاتی پیرامون داده‌های زبانی، ابتدا به تجربیات جهانی از موضوع مدیریت داده‌های پژوهشی به طور عام پرداخته می‌شود و سپس تجربیات به دست آمده از تولید داده‌های زبانی و راه‌اندازی و مدیریت «مرجع دادگان زبان فارسی» با خوانندگان مقاله به اشتراک گذاشته می‌شود. نکاتی چون اشتراک‌گذاری داده‌های زبانی در پایگاه‌های اشتراک داده معتبر، مشخص کردن وضعیت مالکیت معنوی و شرایط استفاده داده، تهیه مستندات مناسب برای توصیف داده و مشخص کردن مستندی که کاربران باید هنگام استفاده از داده به آن ارجاع دهند، استفاده از منابع اولیه مناسب برای تولید داده، ساختاربندی داده بر مبنای قالب‌های استاندارد و مشترک، کسب اطمینان از کیفیت داده با استفاده از روش‌های مختلف ارزیابی، ایجاد ابزارهای مناسب برای پردازش و نمایش داده، و استفاده از ساختارهای مناسب برای فایل داده از جمله پیشنهاداتی هستند که برای مدیریت داده‌های زبانی در این مقاله ارائه شده است.

یه شما توصیه می‌کنیم که فایل pdf این مقاله را دانلود و مطالعه نمایید:

 دریافت
حجم: 183 کیلوبایت

این مقاله توسط آقای مرتضی رضائی شریف‌آبادی، کارشناس ارشد زبانشناسی رایانشی تهیه شده است.

تذکر: مطالب بازنشر و مهمان بدون هیچگونه دخل و تصرفی در سایت «شفافیت برای ایران» منتشر می‌شوند.