چه چیزی داده باز حساب می‌شود؟ فرق داده و داده باز در چیست؟ در این پست مفاهیم اولیه از داده تعریف و بررسی می‌شوند.

نوع محتوا ادبیات علمی
موضوع داده باز
منتشر کننده شفافیت برای ایران

داده چیست؟

امروزه همه چیز داده (Data) حساب می‌شود. از شن‌های ریز سواحل گرفته تا منظومه‌ها و سیارات کهکشان‌‌ها.
اما اصولا داده را مواد خامی می‌دانند که یک واقعیت را توصیف می‌کند. این مواد خام متغیرهای کمی(اعداد و..) یا کیفی(حروف و نمادها) هستند. وقتی داده‌ها کنار هم قرار گرفته و معنادار(پردازش) می‌شوند، در اینجا دیگر داده‌ی خام نیستند، بلکه به اطلاعات (Information) تبدیل شده‌اند.
به‌عنوان مثال داده‌های انسان را در نظر بگیرید: رنگ پوست و مو و چشم‌ها، نوع صورت، قد و اندازه، نام و نام و خانوادگی، شماره شناسنامه، کد ملی و.. که اطلاعات و مشخصات یک انسان حساب می‌شوند.

انواع داده چیست؟

  • داده‌های آمار و ارقام
  • داده‌های جغرافیایی
  • داده‌های حمل و نقل
  • داده‌های مالی و بانکی
  • داده‌های فرهنگی
  • داده‌های علمی
  • داده‌های آب و هوایی
  • داده‌های طبیعی و محیط زیستی

فراداده چیست؟

هر مطلبی که توضیحی راجع‌به داده‌ها بدهد را فراداده (Meta Data) می‌گویند.

فراداده‌ها یا در مشخصات فایل داده هستند، یا به‌صورت جداگانه در صفحه دانلود و بخش توضیحات نوشته می‌شوند.

فراداده‌ها معمولا شامل: منبع و تهیه‌کننده فایل داده، منتشرکننده داده، تاریخ تهیه و انتشار، تعاریف و مفاهیم، واحد اندازه‌گیری و.. می‌شود.

تفاوت داده با سند چیست؟

به‌عنوان مثال «مرکز آمار ایران»، آمار و اطلاعات خود را به‌صورت فایل PDF و با توضیحات فراوان و مقدمه منتشر می‌کند. فایل‌های فوق «داده» نیستند، بلکه یک «سند» برای مطالعه و آگاهی است.

اما چرا، به‌این دلیل که:

  1. توضیحات و تحلیل‌های مرکز را شامل شده است.
  2. برای استفاده از داده‌های موجود در آن اسناد، باید آن‌ها را تایپ، ویرایش و آماده‌سازی کرد.

در اینجا ما به چیزی می‌گوییم «داده» که در قالب‌های صفحه‌گسترده یا جدولی آمده باشند، مثل فایل‌های اکسل(XLS) و CSV.

مجموعه داده(دادگان) چیست؟

یک جدول که چند سطر و ستون داشته و ارقام و.. در آن ثبت شده‌اند را یک مجموعه داده (Dataset) می‌گویند. به‌صورت خلاصه، هر جدول داده یک دیتاست، دادگان یا مجموعه داده است.

داده بسته چیست؟

هر داده‌ای که برای دسترسی به آن محدودیت و هزینه وجود دارد را داده بسته (Closed Data) می‌گویند.

ویژگی‌های داده بسته چیست؟

اگر داده‌ای یک یا تعدادی از  ویژگی‌های زیر را داشته باشد، «بسته» حساب می‌شود.

  • برای هر بار دسترسی به داده‌ها، مجوز و اجازه‌نامه لازم است.
  • داده‌ها فقط برای اعضای یک گروه یا وب‌سایت نمایش داده می‌شوند.(یعنی برای دسترسی به داده یا باید عضو سایت شوید یا هزینه‌ای را پرداخت کنید)
  • داده‌ها رمزگذاری یا محدود شده‌اند.
  • داده‌ها شامل قانون کپی‌رایت می‌شوند. یعنی در هر بار استفاده از داده‌ها، نام منبع باید ذکر شود.
  • موتورهای جست‌وجو، سایت‌ها و API برای دسترسی به داده با محدودیت روبرو هستند.
  • از نظر زمان استفاده می‌توانند دارای محدودیت باشند.
  • داده‌ها قابل تغییر و ترکیب نیستند.
  • داده‌ها در فرمت‌های گوناگونی ارائه نمی‌شوند.

داده باز چیست؟

طبق تعریف «راهنمای داده‌باز»(Open Data Handbook):

داده باز، داده‌ای است که هر فردی می‌تواند به‌صورت آزاد و رایگان از آن برای هر مقصودی بدون نیاز به مجوز یا اجاز‌ه‌نامه استفاده(استفاده مجدد، توزیع) کند.

تعاریف فراوانی از داده باز وجود دارد که می‌‌توانید این لینک را مشاهده فرمایید.

ویژگی‌های داده‌ باز چیست؟

هر داده‌ای که ویژگی‌های داده بسته را نداشته باشد را می‌توان یک داده باز دانست، یعنی:

  • در دسترس عموم باشد.
  • برای استفاده نیازی کسب به اجازه و مجوز نداشته باشد.
  • رایگان و بدون هزینه باشند.
  • در فرمت‌های گوناگون(CSV, XLS) ارائه شود.
  • بتوان آن‌ها را ویرایش، ترکیب و بازاستفاده کرد.


برای آشنایی بیشتر با ویژگی‌های داده باز می‌توانید خلاصه منشور بین‌المللی داده باز و این اصول را مطالعه فرمایید.

فرق داده با داده باز در چیست؟

داده باز بر خلاف داده بسته، دسترسی عمومی دارد. پس اگر داده‌ای بر روی اینترنت برای همه‌ی افراد و کاربران منتشر شده بود، آن داده باز است.

داده حکومتی باز چیست؟

حکومت‌ها و دولت‌ها داده‌های بسیار فراوانی دارند. اگر این داده‌ها را با توجه به یک سری اصول در دسترس مردم قرار دهند، در اینجا ما داده حکومتی باز (Open Government Data) داریم.

آیا داده باز فقط برای دولت‌هاست؟

خیر. هر فردی یا شرکتی می‌تواند داده‌های خود را به‌صورت باز منتشر کند. زمانی که یک داده رایگان بوده و حق دسترسی عمومی داشته باشد آن باز محسوب می‌شود.

ویژگی‌های داده حکومتی باز چیست؟

  • رایگان
  • عمومی و بدون نیاز به مجوز
  • به‌هنگام و به‌روز بودن
  • در فرمت‌های گوناگون
  • قابلیت استفاده مجدد
  • ماشین‌خوان بودن
  • قابل تغییر و ترکیب بودن


ویدئوی آموزشی

منابع

Open Data Handbook (+)

Wikipedia (+)

OKFN (+)