یکی از معتبرترین اسناد پایهی داده باز، منشور بینالمللی داده باز، Open Data Charter، است. هر دادهای که از اصول ۶گانهی این منشور پیروی کند، باز محسوب میشود. در ادامه خلاصهای از این اصول به همراه مثال ارائه میشود.
نوع محتوا | ادبیات علمی |
موضوع | داده باز |
منتشر کننده | شفافیت برای ایران |
اصل اول: باز بودن داده بهصورت پیشفرض
حکومتها و دولتها، شهرداریها و.. وظیفه دارند دادههای خود را بهصورت رایگان در اختیار عموم قرار دهند. «پیشفرض بودن» یعنی زمانی که داده تولید میشود، آن داده باز است. ضمن آنکه حریم خصوصی دادهها هم باید رعایت شود.
مثال: شما یک محقق یا شهروند کنجکاو هستید که نیاز به دادههای آموزش و پرورش شهر خود دارید.
آموزش و پروش موظف است دادههایی مثل تعداد دانشآموزان به تفکیک مقطع، جنسیت، نوع مدرسه و... را زمانی که تولید میشوند(یعنی آمارگیری تمام شده است) و حتی درخواستی نیست منتشر کند، یعنی نیازی به تایید و اجازهی ریاست، حراست و... ندارد. درعین حال نباید دادههای فوق مشخصات هویتی دانشآموزان را افشا کند.
اصل دوم: به هنگام و جامع بودن
دادهها بدون تاخیر و تغییر منتشر شده و باکیفیت و جامع باشند. ضمن آنکه باید از کاربران دادهها مشورت گرفت.
مثال: در ادامه مثال قبل، میخواهید بدانید توزیع و تعداد جمعیت دانشآموزان کلاس اولی چگونه است.
آموزش و پرورش باید دادههای دانشآموزان را در ابتدای هر فصل آموزشی(بازگشایی مدارس) یا انتهای آن منتشر کند. دادههای فوق نباید قدیمی باشند و بهنوعی بهروزرسانی دادههای قبلی هستند. یعنی وقتی دادهها کنار هم قرار میدهید، مثلا یک روند ۱۰ساله از جمعیت کلاس اولیها دارید.
در داخل دادهها هم نباید توضیح یا نموداری باشد و در هر زمان اگر نظری داشتید، باید بدون مشکلی پیشنهاد یا انتقاد خود را با مسئولین جمعآوری داده در میان بگذارید.
اصل سوم: قابلیت دسترسی و استفاده
تا وقتی دادههای باز منتشر نشوند و به دست شهروندان نرسند هیچ ارزشی ندارند. مزایای این امر تصمیمگیری بهتر و تعامل بین مسئولین و شهروندان است. این دسترسی باید در یک پورتال واحد انجام شود تا تمام دادهها در یک جا قرار بگیرند و اصطلاحا جزیره جزیره نباشند.
از همه مهمتر، دادهها باید در فرمتهای مختلف(CSV, XLS, TXT) منتشر شده تا کاربران مشکلی برای ویرایش دادهها نداشته باشند. ضمنا، استفاده از دادهها نیازی به کسب اجازه، مجوز، احراز هویت کاربر و.. ندارد.
مثال: برای تحقیق خود، نیاز به آمار جمعیت، ثبت ازدواج و طلاق و تعداد دانشآموزان ابتدایی دارید.
آیا برای به دست آوردن این دادهها باید به آموزش و پرورش و سازمان ثبت احوال شهر خود مراجعه کنید؟ از ریاست و بازرسی کسب اجازه کنید؟ یا سایتهای هرکدام را جداگانه زیر و رو کنید؟ خیر!
اصل انتشار داده باز این است که هر دو سازمان، دادههای خود را در یک پورتال واحد مثلا Data.gov.ir به تفکیک موضوع و.. ثبت کنند و شما هم نیازی ندارید هویت خود را فاش نمایید. دادههای موجود در پورتال میتواند PDF باشد اما اولویت با فایلهای متنی و صفحه گسترده(اکسل و..) است و اگر دادهای PDF بود، فایل متنی یا اکسل آن هم باید وجود داشته باشد. اگر برای دسترسی به داده یا فرمت آن مشکلی پیش آمد، حق اعتراض دارید.(اصل دوم)
اصل چهارم: قابلیت قیاس و همکنشپذیری
دادهها نباید کلی بوده و باید به قسمتهای کوچکتر مثل تقسیمات جغرافیایی، زمانی و.. تقسیم شوند. بهطور معمول دادهها توضیحاتی دارند که باید توضیح داده شوند. دادهها باید در فرمتهایی مثل CSV منتشر شوند که قابلیت ماشینخوان بودن را داشته باشند.
مثال: میخواهید دادههای آموزش و پرورش را از پورتال دریافت کنید.
دادهها باید به تفکیک سال ارائه شده باشند، مثلا از سال ۸۰ تا ۹۰ غلط است. مختصات مکانی مدارس هم باید در داخل دادهها موجود باشند، مثلا وقتی میخواهید در گوگل ارث مکان مدارس را ببینید، تنها کافی است طول و عرض جغرافیایی آن را وارد نمایید. اما چرا نباید در گوگل ارث با اسم، یک مدرسه را پیدا کرد؟ چون مدارس زیادی با نامهای مشابه وجود دارند.
شاید دادهای نیاز به توضیح داشته باشد، این توضیح نباید در داخل فایل باشد، بلکه در صفحهی دریافت فایل جداگانه نوشته شود. چرا؟ به این دلیل که وقتی قرار است دادهها ماشینخوان شوند و API داده شود، توضیحات فوق میتواند ایجاد خطا کند.
اصل پنجم: برای حکمرانی بهتر و مشارکت شهروندان
بهترین راه برای جلوگیری از فساد در دولتها و حکومتها نظارت شهروندان است. پیشنیاز این کار انتشار دادههاست که باعث شفافیت میشود. ضمن آنکه انتشار دادهها باعث تعامل شهروندان و مسئولین شده که میتواند بهبود عملکرد دولتها را در پی داشته باشد، چرا که شهروندان مشکلات را مشاهده کرده و میتوانند راهحل یا ایدهی بهتری ارائه دهند(خرد و تصمیمات جمعی).
مثال: معمولا مدارس دولتی به دلایل گوناگون از اولیا شهریه میگیرند با اینکه اینکار غیرقانونی است.
وقتی مدارس موظف شوند دادههای خود را منتشر کنند، دادههای مخارج و تعمیرات مدرسه را هم باید ارائه دهند. با انتشار دادههای مالی میتوان فهمید آیا فسادی در مدرسه وجود دارد یا خیر و چرا بودجههای دولتی کفاف خرج مدارس را نمیدهد.
یا مثلا آموزش و پرورش میخواهد مدرسهی جدیدی را بسازد، آیا این کار ضروری است؟ موقعیت مکانی آن مناسب است؟ و موارد دیگر که وقتی شهروندان اجازه بیان نظرات خود را داشته باشند و بتوانند در فرآیند تصمیمسازی مشارکت کنند، میتوان از خرجهای بیهوده و اتلاف وقت جلوگیری کرده و تصمیمات بهتری اتحاذ کرد.
اصل ششم: برای توسعه و نوآوری فراگیر
زمانی که دادهها منتشر میشوند شهروندان میتوانند آنها را مشاهده و برسی کنند. اگر مشکلی بود برای آن راهحل بدهند، راهحلهای موجود را نقد کرده و برای چالشهای فعلی در هر سطحی بتوانند ایدهای مطرح کنند. وقتی دادهها در دسترس همه باشد، کارآفرینان میتوانند از دادهها ارزش افزوده ایجاد کنند.
روزنامهنگاری داده و تحقیقی میتواند با بررسی دادهها فسادها را کشف و افشا کند. مصورسازی دادهها آنها را معنیدار کرده و الگوهای پنهان را آشکار میکند. میتوان دادهها را ترکیب کرده و به فهم جدیدی رسید. و خیلی کارها و اقدامات دیگر که پیشنیاز آنها انتشار دادهها به صورت باز است.
در صورت علاقه میتوانید متن جامع و اصلی «منشور داده باز» را در اینجا مطالعه فرمایید.
گراف زیر، خلاصهای از مطالب بالا و اصول داده باز منشور است.