جمعآوری و تحلیل داده یکی از گامهای اساسی پژوهش در بسیاری از زمینههای تحقیقاتی است. مدیریت صحیح دادههای پژوهشی موجب میشود که پژوهشگران هم خود بتوانند بعدها به دادهها مراجعه کنند و در پژوهشهای دیگر خود از آنها استفاده نمایند، و هم با اشتراکگذاری دادهها این امکان را برای سایر پژوهشگران فراهم نمایند که بتوانند آن دادهها را برای اهداف دیگر مورد استفاده قرار دهند.
حوزه شفافیت | داده باز | Open Data | Scope |
موضوع | راهنما، آموزشی | Learning, Educational | Subject |
جغرافیا | ایران | Iran | Geography |
نوع مطلب | متن | Text | Type |
زبان | فارسی | Farsi | Language |
منتشر کننده | سومین همایش ملی زبانشناسی و آموزش زبان فارسی | Publisher |
چکیده مقاله
جمعآوری و تحلیل داده یکی از گامهای اساسی پژوهش در بسیاری از زمینههای تحقیقاتی است. مدیریت صحیح دادههای پژوهشی موجب میشود که پژوهشگران هم خود بتوانند بعدها به دادهها مراجعه کنند و در پژوهشهای دیگر خود از آنها استفاده نمایند، و هم با اشتراکگذاری دادهها این امکان را برای سایر پژوهشگران فراهم نمایند که بتوانند آن دادهها را برای اهداف دیگر مورد استفاده قرار دهند. این مسئله در خصوص دادههای زبانی، یعنی دادههایی که برای مطالعه یا پردازش زبان از آن استفاده میشود، نیز صادق است و زبانشناسان و متخصصان پردازش رایانهای زبان میتوانند با رعایت نکات مربوط به مدیریت دادههای زبانی، گام مثبتی در پژوهشهای حوزه تخصصی خود بردارند. در این پژوهش ضمن تعریف و ارائه توضیحاتی پیرامون دادههای زبانی، ابتدا به تجربیات جهانی از موضوع مدیریت دادههای پژوهشی به طور عام پرداخته میشود و سپس تجربیات به دست آمده از تولید دادههای زبانی و راهاندازی و مدیریت «مرجع دادگان زبان فارسی» با خوانندگان مقاله به اشتراک گذاشته میشود. نکاتی چون اشتراکگذاری دادههای زبانی در پایگاههای اشتراک داده معتبر، مشخص کردن وضعیت مالکیت معنوی و شرایط استفاده داده، تهیه مستندات مناسب برای توصیف داده و مشخص کردن مستندی که کاربران باید هنگام استفاده از داده به آن ارجاع دهند، استفاده از منابع اولیه مناسب برای تولید داده، ساختاربندی داده بر مبنای قالبهای استاندارد و مشترک، کسب اطمینان از کیفیت داده با استفاده از روشهای مختلف ارزیابی، ایجاد ابزارهای مناسب برای پردازش و نمایش داده، و استفاده از ساختارهای مناسب برای فایل داده از جمله پیشنهاداتی هستند که برای مدیریت دادههای زبانی در این مقاله ارائه شده است.
یه شما توصیه میکنیم که فایل pdf این مقاله را دانلود و مطالعه نمایید:
دریافت
حجم: 183 کیلوبایت
این مقاله توسط آقای مرتضی رضائی شریفآبادی، کارشناس ارشد زبانشناسی رایانشی تهیه شده است.
تذکر: مطالب بازنشر و مهمان بدون هیچگونه دخل و تصرفی در سایت «شفافیت برای ایران» منتشر میشوند.