چه چیزی داده باز حساب میشود؟ فرق داده و داده باز در چیست؟ در این پست مفاهیم اولیه از داده تعریف و بررسی میشوند.
نوع محتوا | ادبیات علمی |
موضوع | داده باز |
منتشر کننده | شفافیت برای ایران |
داده چیست؟
امروزه همه چیز داده (Data) حساب میشود. از شنهای ریز سواحل گرفته تا منظومهها و سیارات کهکشانها.
اما اصولا داده را مواد خامی میدانند که یک واقعیت را توصیف میکند. این مواد خام متغیرهای کمی(اعداد و..) یا کیفی(حروف و نمادها) هستند. وقتی دادهها کنار هم قرار گرفته و معنادار(پردازش) میشوند، در اینجا دیگر دادهی خام نیستند، بلکه به اطلاعات (Information) تبدیل شدهاند.
بهعنوان مثال دادههای انسان را در نظر بگیرید: رنگ پوست و مو و چشمها، نوع صورت، قد و اندازه، نام و نام و خانوادگی، شماره شناسنامه، کد ملی و.. که اطلاعات و مشخصات یک انسان حساب میشوند.
انواع داده چیست؟
- دادههای آمار و ارقام
- دادههای جغرافیایی
- دادههای حمل و نقل
- دادههای مالی و بانکی
- دادههای فرهنگی
- دادههای علمی
- دادههای آب و هوایی
- دادههای طبیعی و محیط زیستی
فراداده چیست؟
هر مطلبی که توضیحی راجعبه دادهها بدهد را فراداده (Meta Data) میگویند.
فرادادهها یا در مشخصات فایل داده هستند، یا بهصورت جداگانه در صفحه دانلود و بخش توضیحات نوشته میشوند.
فرادادهها معمولا شامل: منبع و تهیهکننده فایل داده، منتشرکننده داده، تاریخ تهیه و انتشار، تعاریف و مفاهیم، واحد اندازهگیری و.. میشود.
تفاوت داده با سند چیست؟
بهعنوان مثال «مرکز آمار ایران»، آمار و اطلاعات خود را بهصورت فایل PDF و با توضیحات فراوان و مقدمه منتشر میکند. فایلهای فوق «داده» نیستند، بلکه یک «سند» برای مطالعه و آگاهی است.
اما چرا، بهاین دلیل که:
- توضیحات و تحلیلهای مرکز را شامل شده است.
- برای استفاده از دادههای موجود در آن اسناد، باید آنها را تایپ، ویرایش و آمادهسازی کرد.
در اینجا ما به چیزی میگوییم «داده» که در قالبهای صفحهگسترده یا جدولی آمده باشند، مثل فایلهای اکسل(XLS) و CSV.
مجموعه داده(دادگان) چیست؟
یک جدول که چند سطر و ستون داشته و ارقام و.. در آن ثبت شدهاند را یک مجموعه داده (Dataset) میگویند. بهصورت خلاصه، هر جدول داده یک دیتاست، دادگان یا مجموعه داده است.
داده بسته چیست؟
هر دادهای که برای دسترسی به آن محدودیت و هزینه وجود دارد را داده بسته (Closed Data) میگویند.
ویژگیهای داده بسته چیست؟
اگر دادهای یک یا تعدادی از ویژگیهای زیر را داشته باشد، «بسته» حساب میشود.
- برای هر بار دسترسی به دادهها، مجوز و اجازهنامه لازم است.
- دادهها فقط برای اعضای یک گروه یا وبسایت نمایش داده میشوند.(یعنی برای دسترسی به داده یا باید عضو سایت شوید یا هزینهای را پرداخت کنید)
- دادهها رمزگذاری یا محدود شدهاند.
- دادهها شامل قانون کپیرایت میشوند. یعنی در هر بار استفاده از دادهها، نام منبع باید ذکر شود.
- موتورهای جستوجو، سایتها و API برای دسترسی به داده با محدودیت روبرو هستند.
- از نظر زمان استفاده میتوانند دارای محدودیت باشند.
- دادهها قابل تغییر و ترکیب نیستند.
- دادهها در فرمتهای گوناگونی ارائه نمیشوند.
داده باز چیست؟
طبق تعریف «راهنمای دادهباز»(Open Data Handbook):
داده باز، دادهای است که هر فردی میتواند بهصورت آزاد و رایگان از آن برای هر مقصودی بدون نیاز به مجوز یا اجازهنامه استفاده(استفاده مجدد، توزیع) کند.
تعاریف فراوانی از داده باز وجود دارد که میتوانید این لینک را مشاهده فرمایید.
ویژگیهای داده باز چیست؟
هر دادهای که ویژگیهای داده بسته را نداشته باشد را میتوان یک داده باز دانست، یعنی:
- در دسترس عموم باشد.
- برای استفاده نیازی کسب به اجازه و مجوز نداشته باشد.
- رایگان و بدون هزینه باشند.
- در فرمتهای گوناگون(CSV, XLS) ارائه شود.
- بتوان آنها را ویرایش، ترکیب و بازاستفاده کرد.
برای آشنایی بیشتر با ویژگیهای داده باز میتوانید خلاصه منشور بینالمللی داده باز و این اصول را مطالعه فرمایید.
فرق داده با داده باز در چیست؟
داده باز بر خلاف داده بسته، دسترسی عمومی دارد. پس اگر دادهای بر روی اینترنت برای همهی افراد و کاربران منتشر شده بود، آن داده باز است.
داده حکومتی باز چیست؟
حکومتها و دولتها دادههای بسیار فراوانی دارند. اگر این دادهها را با توجه به یک سری اصول در دسترس مردم قرار دهند، در اینجا ما داده حکومتی باز (Open Government Data) داریم.
آیا داده باز فقط برای دولتهاست؟
خیر. هر فردی یا شرکتی میتواند دادههای خود را بهصورت باز منتشر کند. زمانی که یک داده رایگان بوده و حق دسترسی عمومی داشته باشد آن باز محسوب میشود.
ویژگیهای داده حکومتی باز چیست؟
- رایگان
- عمومی و بدون نیاز به مجوز
- بههنگام و بهروز بودن
- در فرمتهای گوناگون
- قابلیت استفاده مجدد
- ماشینخوان بودن
- قابل تغییر و ترکیب بودن