بنیاد دانش باز (Open Knowledge Foundation) سندی را منتشر کرده است و در آن مباحثی عمومی پیرامون داده باز، همچون چیستی داده باز و چرایی آن، انواع داده باز، مباحث فنی حول آن مورد بحث قرار گرفته است. این سند، مطالبی مختصر و مفید را تنظیم کرده است و این منظر حائز اهمیت مضاعف است.
حوزه شفافیت | حکومت باز | Open Government | Scope |
موضوع | راهنما، آموزشی | Learning, Educational | Subject |
نوع مطلب | متن | Text | Type |
زبان | انگلیسی | English | Language |
منتشر کننده | بنیاد دانش باز | Open knowledge Foundatio | Publisher |
میتوانید این سند را از این لینک دانلود نمایید:
The Open Data Handbook (Open Knowledge Foundation)
در ادامه، مباحثی اولیه برگرفته از این جزوه ذکر میگردد:
1. تعریف داده باز
«داده باز» (Open Data) یعنی هر محتوا، اطلاعات یا دادهای که مردم بتوانند از آن مجانی استفاده کرده و توزیع نمایند، بدون آنکه با محدودیتهای قانونی، فنی یا اجتماعی روبرو شوند.
ویژگیهای کلیدی باز بودن عبارتاند از:
- وجود و امکان دسترسی: اطلاعات بایستی در قالب یک کل، نهایتاً با هزینهای معادل هزینه تولید آنها، و ترجیحاً بوسیله دانلود از اینترنت قابل دسترسی باشد. اطلاعات همچنین بایستی در قالبهایی مناسب و قابل تغییر در اختیار قرار گیرند.
- استفاده و توزیع مجدد: اطلاعات بایستی با شرایطی ارائه گردد که امکان استفاده و توزیع مجدد از آنها وجود داشته، بتوان آنها را با اطلاعات سایر پایگاههای داده ترکیب نمود. این اطلاعات بایستی در قالبهای «ماشینخوان» (machine-readable) ارائه گردد.
- مشارکت عمومی: هر فردی بایستی بتواند از اطلاعات بهره برده، آنها را مورد بازتوزیع قرار داد. در این نبایستی تبعیضی در مسیر تلاش فرد یا گروهی خاص قرار داشته باشد؛ همچون محدودیتهای «غیرتجاری»، که استفادههای تجاری را محدود میکند.
2. انواع داده باز
انواع مختلفی از داده باز، با استفادهها و کاربردهای خاص خود وجود دارد:
- فرهنگی: اطلاعات پیرامون اثرها و محصولات فرهنگی، برای نمونه عناوین و نویسندگان؛
- علمی: اطلاعاتی که در نتیجه یک پژوهش علمی بدست میآید؛
- مالی: اطلاعاتی همچون اطلاعات حسابهای دولتی (مخارج و درامدها) و اطلاعات بازارهای مالی (سهام، قیمتها، اوراق، ...)؛
- آمار: اطلاعات تولید شده توسط دفاتر آماری، و نیز شاخصهای اصلی اقتصادی و اجتماعی؛
- حمل و نقل: اطلاعاتی همچون جداول زمانی، مسیرها، ...؛
- محیط زیست: اطلاعاتی مرتبط با محیط زیست همچون سطح آلودگی و کیفیت رودخانهها و دریاها؛
3. چرا داده باز؟
چرا داده بایستی باز باشد؟ پاسخ بسیار به نوع داده وابسته است. با این حال دلایل مختلفی وجود دارد، همچون:
- شفافیت: در یک جامعه مردمسالار، شهروندان بایستی بدانند که حکومت آنها چه میکند. برای این منظور، آنها بایستی آزادانه به اطلاعات و دادههای حکومتی دسترسی داشته باشند و اینکه بتوانند آن اطلاعات را در اختیار سایر شهروندان نیز قرار دهند. شفافیت تنها بحث دسترسی نیست، بلکه بحث اشتراک و استفاده مجدد را نیز شامل میشود، چرا که فهم این اطلاعات معمولا نیازمند تحلیل و بصریسازی خاصی است که امکان به اشتراکگذاری مجدد آنها را اقتضا میکند.
- تولید ارزشهای اجتماعی و تجاری: در عصر دیجیتال، اطلاعات یکی از منابع اساسی فعالیتهای اجتماعی و تجاری به شمار میرود. هر چیزی از پیدا کردن دفتر پست محلی یا ساخت یک موتور جستجو نیازمند دسترسی به اطلاعات است، اطلاعاتی که عمدتاً توسط دولت تولید و نگهداری میشود. با باز کردن اطلاعات، دولتها میتوانند به تولید فعالیتهای تجاری و خدماتی کمک کند که سبب خلق ارزشهای اجتماعی و تجاری میگردند.
- مشارکت: بیشتر موارد شهروندان عموماً با حکومتهای خود بصورت پراکنده متعامل میشوند، مثلا برای دورههای 4 ساله انتخابات. اما با باز کردن اطلاعات، شهروندان میتوانند بصورت مستقیمتری از جریان امور مطلع گردیده و در فرایند تصمیمگیری مشارکت کنند. این مسئله فراتر از شفافیت است: نه تنها آگاهی از آنچه اتفاق میافتد، بلکه مشارکت و افزودن بر آن.
4. آزادسازی اطلاعات (از نظر فنی)
داده باز بایستی از نظر فنی نیز (همانند منظر قانونی) باز باشد. دادهای از نظر فنی باز و آزاد تصور میشود که دارای شرایط زیر باشد:
- موجود باشد: داده بایستی در قیمتی همارز هزینه تولید آن، و ترجیحاً بصورت مجانی، از طریق اینترنت قابل دانلود باشد.
- بصورت داده انباشته (Bulk): داده بایستی بصورت یک مجموعه کامل موجود باشد. برای نمونه چنانچه به سند مشخصی نیاز داشته باشید، بایستی تمام مجموعه اسناد مرتبط در یک فایل قابل دانلود نیز قابل دستیابی باشد. یک سرویس Web API یا سرویسهای مشابه در این زمینه هر چند بسیار مفید هستند، با این نباید جایگزین داده انباشته گردد.
- در یک قالب باز و ماشینخوان: استفاده مجدد از اطلاعات توسط عموم نبایستی توسط محدودیتهای پتنت محافظت گردد. اما مهمتر از آن، آن است که اطلاعات در قالبهای ماشینخوان ارائه گردد که سطوح بالاتری از استفاده مجدد امکانپذیر باشد. برای فهم این مسئله، آماری را تصور کنید که در قالب PDF ارائه شده است. این اطلاعات میتواند توسط انسان مورد فهم و استفاده قرار گیرد، اما نرمافزارها نمیتوانند بسادگی و بطور مستقیم از این اطلاعات بهره ببرند. لذا چنین اطلاعاتی باید در قالبهایی همچون XLS یا CSV ارائه گردد.