شهرستان مونتگُمری واقع در ایالت آلابامای ایالات متحده، در سال ۲۰۱۳ برای ورود به بحث «داده باز» و انتشار دادههای شهر خود برای عموم مردم، قاعده و اصولی را به عنوان راهنمای خود تدوین کرد.
حوزه شفافیت |
داده باز |
Open Data | Scope |
موضوع |
راهنما، آموزشی | Principle | Subject |
جغرافیا |
ایالات متحده | United States | Geography |
نوع مطلب |
ترجمه | Translate | Type |
زبان | انگلیسی | EN | Language |
منتشر کننده |
شفافیت برای ایران | Trasparency4Iran | Publisher |
این اصول کلی عبارتانداز:
۱. کامل: همه دادههای عمومی باید در دسترس قرار بگیرند. دادههای عمومی شامل همه چیز به غیر از: دادههای حریم خصوصی معتبر، امنیتی و امتیازهای محدود میشود.
۲. بهموقع: لازم است داده و بهروزرسانی آن به سرعت در دسترس قرار داده شود تا ارزش آن حفظ شود. (یعنی داده به علت گذشت زمان اعتبار خود را از دست نداده و بیمصرف نشود.)
۳. بدون تبعیض: دادهها باید در دسترس همه و بدون نیاز به ثبتنام یا کسب اجازه باشد.
۴. رایگان: دادهها به عنوان یک حق عمومی، شامل قوانین کپیرایت، حق ثبت اختراع و.. نمیشوند.
۵. منبع: دادهها به عنوان یک مرجع جمعآوری میشوند، یعنی بایدبه اعتبار و قابل استناد بودن آنها توجه شود.(دادههای جعلی، غلط، مشکوک، ناقص و مبهم ارائه نشوند.)
۶. در دسترس: دادهها برای اینکه معنیدار باشند باید ارایه شده و در دسترس همگان قرار بگیرند. این کار به شفاف و همچنین فعال کردن راهحلهای جدید و نوآورانه برای جامعه مفید است.
۷. ماشینخوان: دادهها را باید بتوان بهصورت سیستمی و کامپیوتری پردازش کرد.
۸.غیراختصاصی: دادهها باید در بیش از یک فرمت(csv, pdf, xls) ارایه میشوند که تحت انحصار سازمان یا گروهی نباشند.
بعد از این اصول، استانداردهای داده آمده است که باید براساس موارد زیر، یک دیتاست یا مجموعه داده منتشر شود:
- فرمت داده با پلتفرم مورد استفاده همخوانی داشته باشد.
بهعنوان مثال وقتی قرار است دادهها تحلیل و بررسی شوند، نباید جداول داده با فرمت pdf یا مایکروسافت ورد doc ارایه شوند.
- دادهها باید در قطعات کوچک و ساختارمند ارایه شوند نه یک رشته بزرگ و بدون ساختار.
یعنی از متنهای ساده اجتناب کرده و دادهها را به صورت عدد، زمان و.. در قالب سطر و ستون ارائه شوند.
- برای دادههای شامل آدرس و.. ، باید طول و عرض و مخصات جغرافیایی مکان هم ثبت شود.
وقتی شما از یک مکان یا محل سخن میگویید، باید دادهی جغرافیایی آن را هم اضافه کنید. مزیت این نکته زمانی روشن میشود که هنگام ماشینخوان کردن دادهها، محل فوق به صورت اتوماتیک مکانیابی میشود.
- دادهها باید خام باشند.
تحلیل، نمودار و.. نباید همراه با اصل داده ارائه شود. این موارد جزء اصلی داده نیستند.
- تا حد امکان دادهها بهصورت فرمت CSV ارائه شود تا فرمولها و محتواهای اضافی اکسل در آن ثبت نشوند.
در فرمت csv ، دادهها به صورت متنی اما در قالب ستونهای مجزا از طریق ویرگول جدا شده که خواندن آنها توسط ماشین و سایر نرمافزارها آسان بوده و میتوان آن را به دیگر فرمتها تبدیل کرد.
- پاورقی و اطلاعات استنادی باید قبل از آپلود از دادهها حذف شوند.
اگر تیترها و سایر توضیحات اضافی حذف نشوند، در تبدیل سند به فرمت csv و خواندن آن مشکل به وجود خواهد آمد.
در گراف زیر میتوانید خلاصهای از اصول داده این شهرستان را دانلود نمایید.