נתונים פתוחים

מתוך אקו-ויקי, מקום מפגש בנושאי אקולוגיה, חברה וכלכלה.
(הופנה מהדף Open data)
קפיצה לניווט קפיצה לחיפוש

נתונים פתוחים או נתונים גולמיים חופשיים (באנגלית: Open data) הוא רעיון לפיו חלק מהנתונים הגולמיים צריכים להיות זמינים לכל אדם, כך שניתן להשתמש בהם ולפרסם אותם מחדש בצורה חופשית, ללא מגבלות כמו זכויות יוצרים, פטנטים, או מכניזמים אחרים של שליטה. המטרה של "תנועת הנתונים הפתוחים" (Open data movement) דומה למטרות של תנועות אחרות של "פתיחות" כמו קוד פתוח, תוכן פתוח וגישה פתוחה. הפילוסופיה מאחורי נתונים פתוחים פותחה מזה זמן רב (לדוגמה ב-Merton Thesis לגבי מדע). עם זאת המונח "נתונים פתוחים" הוא חדש יחסית, והוא צובר תאוצה עם הפיתוח של רשת האינטרנט. במיוחד עם הפתיחה של יוזמות ממשל עם נתונים פתוחים (open-data government) כמו Data.gov.

מדינות בעלות אתרים ממשלתיים להפצת נתונים פתוחים, נכון לשנת 2012


סקירה

הרעיון של נתונים פתוחים אינו חדש; אבל למרות שיש שימוש נפוץ למדי בשנים האחרונות, אין לו הגדרה מוסכמת (בניגוד לדוגמה לגישה פתוחה שלגביה הוכרזו ונחתמו כמה הכרזות רשמיות).

נתונים חופשיים מתרכזים לעיתים קרובות במידע לא טקסטואלי כמו מפות, גנומים, מפות תאי מוח, תרכובות כימיות, סטטיסטיקה, נוסחאות מתמטיות ומדעיות, נתונים ונוהלים רפואיים, מידע ביולוגי ומגוון גנטי. קיימות בעיות רבות הנובעות מכך שנתונים אלה הם בעלי ערך כלכלי וניתן לצבור אותם כדי לקבל עוד ערך כלכלי. גישה אל או שימוש מחודש בנתונים נשלטת על ידי ארגונים, הן ציבוריים (ממשלות, אוניברסיטאות, רשויות וכו') והן פרטיות (פירמות). השליטה בנתונים יכולה להתבצע על ידי הגבלת גישה, רישיונות, זכויות יוצרים, פטנטים או תשלום תמורת גישה או שימוש מחדש. התומכים בגישת נתונים פתוחים טוענים כי הגבלות אלה פוגעים בטובת הכלל וכי הנתונים צריכים להיות זמינים ללא מגבלה או תשלום. בנוסף, חשוב כי הנתונים יהיו ניתנים לשימוש חוזר ללא בקשת הרשאה נוספת, אם כי הסוגים של השימוש מחדש (לדוגמה יצירה של עבודות או מידע הנגזרות מתוך הנתונים) עשויים להישלט על ידי רישיון.

דוגמה לטיעון מדוע יש צורך בנתונים פתוחים:

"מדענים רבים הצביעו על האירוניה שבדבר שבדיוק ברגע ההיסטורי שבו יש לנו את הטכנולוגיות לאפשר זמינות כלל עולמית של נתונים מדעיים, שיכולים להרחיב את שיתופי הפעולה ולהאיץ את קצב והעומק של גילויים חדשים... אנו עסוקים בנעילה הנתונים ומניעת שימוש בטכנולוגיות מתקדמות על הידע." John Wilbanks, Executive Director, Science Commons

הבדל מחופש מידע

להבדיל מחופש המידע, נתונים פתוחים מאפשרים עיבוד מחדש של הנתונים, פיתוח יישומים, שילוב הנתונים בנתונים אחרים והפקת מידע חדש. דוגמה לחופש המידע הם דוחות ממשלתיים, או מחקרים מדעיים, דוגמה לנתונים חופשיים הם בסיסי הנתונים שעליהם מבוססים המחקרים והדוחות האלה.


גישה חופשית למחקרים מדעיים

גישה חופשית, Open Access היא הקריאה לכך שירחונים מדעיים יפרסמו את המחקרים המדעיים חינם לציבור וכן שהמחקרים יהיו חופשיים לשימוש עתידי של אנשים שרוצים לחקור את המחקרים, למצוא בהם דפוסים וכו'.

בעבר הייתה הצדקה לכך שירחונים מדעיים עלו הרבה כסף. עלות ההפקה של המאמרים הייתה יקרה משום שהיה צריך להשקיע משאבים רבים בהכנת גרפים והכנות אחרות לדפוס, וכן היו עלויות הפצה גבוהות של הירחונים בכל העולם בתפוצה קטנה. היום שני דברים השתנו - בזכות הדפוס הדיגיטלי, תוכנות לעיבוד תמלילים, עימוד גרפי והכנת גרפים מדענים יכולים להכין בכוחות עצמם או עם סיוע קל את המאמר לדפוס. כמו כן ההפצה הוזלה מאוד בזכות האינטרנט. כך שהעלויות של הכנת המאמרים המדעיים ירדו מאוד. מצד שני עלויות ההרשמה לירחונים המדעיים עלו מאוד, בין 1986 ל-2003 עלה המחיר הריאלי של ההרשמה (המחיר בהתחשב מחיר האינפלציה) ב-260%. מחיר העלות השנתית לירחון בכימיה הוא מעל 4,000 דולר בשנה, ומצב דומה יש גם בפיזיקה, ביולוגיה, ותחומים רבים נוספים. יש ירחון אחד עם עלות הרשמה שנתית של 40,000 דולר.[1]

המצב הזה יוצר כל מיני בעיות, סטודנטים אינם יכולים לקרוא את המאמרים, ולפעמים גם מרצים מוגבלים בגישה ולא יכולים ללמד מחקרים חדשים. הדבר הוא בעייתי במדינות עניות שבהן האוניברסיטאות לא יכולות לעמוד בתשלום לכל הירחונים. מצד שני המצב אבסורדי היות והמיסים הממשלתיים משלמים על המחקר, וגם עבודת הסינון של המאמרים והריוויו נעשים על ידי מדענים אחרים ולא על ידי הירחון עצמו (וגם מדענים אלה מקבלים סיוע מכספי המיסים). מצד שני הציבור עצמו ששילם על כל המחקר הזה לא מקבל גישה לנתונים ולמחקרים באופן ישיר.

דוגמאות לשימושים

  • GTFS הוא פורמט של נתונים פתוחים הקשורים לתחבורה, ובעיקר לתחבורה ציבורית. בפורמט זה שואבים נתונים אודות מיקום תחנות אוטובוס, קווי אוטובוס, זמני נסיעה ולוחות זמנים. את המידע הזה מנצלות כיום מאות סוגי אפליקציות לשם הצגת מידע גאוגרפי או כזה הקשור למתן שירותי תחבורה - לדוגמה היכן ממוקמות תחנות האוטובוס הקרובות, שירות תכנון נסיעה קצרה, זמני נסיעה בתחבורה ציבורית, מפת קווים אישית ועוד.
  • מאגרי מפות חינמיים - דוגמת OSM (שנבנה על ידי תוכן גולשים) ומפות חופשיות שמפורסמות על ידי ממשלות וסוכנויות ממשלתיות - מאפשרות לכתוב יישומים, לקיים מחקרים מדעיים ולכתוב יישומים המנצלים מידע גאוגרפי ללא צורך בתקורה הגבוהה שכרוכה בתשלום למפות מסחריות.
  • דיביפדיה (DBpedia) הוא פרוייקט שמטרתו להנגיש מידע מובנה (נתונים) מתוך מקורות מידע שנובעים מפרוייקט ויקיפדיה. מידע מובנה זה מונגש לאחר מכן לרשת האינטרנט. דיביפדיה מאפשרת למשתמשים לבצע שאילתות על יחסים ועל תכונות הקשורות למשאבי ויקיפדיה, כולל קשרים לבסיסי נתונים אחרים. דיביפדיה תוארה על ידי טים ברנרס-לי כאחד מהחלקים היותר מפורסמים של פרוייקט Linked data.

נתונים חופשיים מטעם ממשלות

כמה ממשלות יצרו אתרי אינטרנט כדי להפיץ חלק מהנתונים שהן אוספות.

על פי אתר הנתונים הפתוחים של ארצות הברית, ל-53 ממשלות ברחבי העולם יש אתרי נתונים פתוחים, נכון לשנת 2017. ראו לרשימה עדכנית של אתרי נתונים פתוחים ממשלתיים.

נתונים חופשיים בישראל

נתונים חופשיים המפורסמים מטעם הממשלה

ממשלת ישראל פתחה אתר נתונים בשם data.gov.il. האתר נפתח בעקבות החלטת ועדת השרים לעניין שיפור השירות הממשלתי לציבור וממשל פתוח, שנתקבלה ביום ב', 29 בנובמבר 2010. במשך שנים לא נוספו לאתר נתונים וסדרות לדוגמה בשנת 2012, היו במאגר כ-70 דוחות בלבד.

בנובמבר 2017 הושק אתר נתונים חדש ובו כ-511 מאגרי נתונים שונים, כולל נתונים על תחבורה, שכבות מידע גאוגרפיות, נתונים על תוכניות בנייה, נתונים על מחצבות, על תאונות דרכים, מוקדי פשיעה, מוקדי יתושים, נתונים זיהום ממפעלים ועוד נושאים. {{הערה|מהפכה בחשיפת המידע הממשלתי לציבור ברשת סה"כ מיפו משרדי הממשלה וארגונים ממשלתיים שונים 1025 סדרות נתונים שחלקם אמור להתפרסם בעתיד, מתוכם נטען כי 625 מאגרים פורסמו בעבר.

ארבעת הגופים שפרסמו הכי הרבה נתונים כללו את המרכז למיפוי ישראל שפרסם 110 מסמכים, חלקם הגדול תצלומי אוויר או נתוני מידע גאוגרפי (GIS), [2] המשרד להגנת הסביבה שפרסם 62 מאגרי נתונים כולל מאגרי המפל"ס, [3] ומשרד התיירות שפרסם 53 מאגרים. [4]. משרד האוצר פרסם 33 נתוני תקציבים שונים אך לא פרסם נתונים כלכליים הנוגעים למשק בישראל. [5]

חלק ממאגרי הנתונים מכילים מידע באיכות נמוכה - מידע לקוני, שניתן למצוא במקומות אחרים או בעל משמעות ציבורית נמוכה מאוד. דוגמה אחת לכך היא "מאגרי מידע" שכולל כמה עשרות פריטים והם יותר קרובים למסמך ממשלתי מאשר מאגר נתונים - לדוגמה משרד החקלאות פרסם רשימה של "מוצרים בפיקוח - מוצרי חלב, ביצים, פירות וירקות" - שמכילה 12 מוצרים. דוגמה אחרת היא הסתפקות בפרסום מידע דל על הגוף עצמו במקום על התחום בו עוסק המשרד - לדוגמה משרד הבריאות פרסם 3 מאגרי נתונים שכולם הם בעצם רשימות של מרפאות או מעבדות רפואיות. נתונים על בריאות הציבור כמו כמות ופריסה של מעשנים, או התפלגות של אי שוויון בריאותי וסוגי תחלואה שונים לא פורסמו. [6].

מאגרים אחרים מציגים מידע שהוא כנראה חלקי מאוד, עם כמות רבה של מידע משוכפל וחשיבות לא ברורה - לדוגמה משרד התיירות פרסם כ-1776 רשומת על "אירועים", כל אירוע הופיע בכמה רשומות שהכילו מידע על מיקום האירוע, טלפון, אימייל ועוד, כך שסה"כ פרסם המשרד 191 אירועים כמו "הופעה של אבי אביטל ועומר אביטל שני אמנים מעולם הג'אז" שנערכה ב-12.9.2017 [7]- כאשר ברור כי מלבד אירועים אלה מתקיימים בישראל עוד עשרות אלפי אירועים אחרים בשנה. מאגרים אחרים של משרד התיירות כוללים מאגרים כמו "דילים" (על טיסות), ועוד. עם זאת משרד התיירות פרסם גם מאגרים משמעותיים יותר כמו מאגר של 39 אלף רשומות (הכוללות רשומות כפולות רבות) המתארות כ- 2600 מסעדות בישראל. [8]

רבים מתוך המאגרים נוגעים לנתונים פנים-ממשלתים כמו תקציבים, יחידות ממשלתיות, אנשים שקיבלו רשיונות שונים ועוד, מעט מאגרים נוגעים למחקרים ונתונים שהממשלה אוספת מהמשק עצמו. דוגמאות הפוכות בולטות כוללות את דוח המפל"ס של המשרד להגנת הסביבה (שכולל דיווחים של מפעלים מזהמים) או נתוני על זמנים ומיקומים של התחבורה הציבורית של משרד התחבורה.

יוזמות ציבוריות

בצד היוזמות הממשלתיות קמו גם יוזמות של אנשים וארגונים כדי להשיג, לקבץ, לעבד ולהפיץ נתונים חופשיים.

בשנת 2011 פעלה עמותת ויקימדיה ישראל שפעלה לפרסם לציבור ולאפשר שימוש חופשי בתמונות של ארכיון התמונות הממשלתי. [9] בשנת 2012 פעלו הפעילים החברתיים נחמן שלף ויואב לרמן לפרסום פורמט GTFS שאיפשר פיתוח יישומים שונים שמציגים מידע על תחבורה ציבורית בזמן אמת כמו Moovit [10]

היוזמה הבולטת ביותר בתחום הנגשת נתונים פתוחים בישראל היא הסדנא לידע ציבורי שמארגנת נתונים שונים ממוסדות ממשלתיים, מהכנסת ומארגונים רשמיים נוספים ומפרסמת את הנתונים ו/או עיבוד נוח שלהם לציבור. הסדנא פיתחה מספר אתרים בנושא כמו התקציב הפתוח, כנסת פתוחה ועוד.

ראו גם

קישורים חיצוניים

נתונים פתוחים בישראל:

גישה חופשית

ביזור וריכוזיות

רקע: שוק חופשי - שוק תחרותי - כשל שוק - מונופול - אוליגופול - מונופסון - תאגיד - תאגיד רב-לאומי - יתרונות לגודל - מינוף פיננסי - חברת פירמידה - סיכון מוסרי - מונופול טבעי - קשרי הון-שלטון - קפיטליזם של מקורבים‏ - שחיתות - לובי פוליטי - תעמולה - הפרטת המחקר - תרבות הצריכה - גלובליזציה - תביעת השתקה - התיישנות מכוונת - עוני - אי שוויון כלכלי - מלכודת עוני - ניידות חברתית

Movie poster the corporation.jpg

דוגמאות: הברונים השודדים - שוק הרכב העולמי - חברות הטבק - משפחות ההון בישראל - בנקאות בישראל - פנסיה בישראל - איי.די.בי. - האחים עופר - מונסנטו - נסטלה - משפט מקלייבל - חוק ההסדרים - גז טבעי בישראל

כלים לשינוי: הגבלים עסקיים - כלכלה דמוקרטית - כלכלה מקומית מקיימת - קואופרטיב - בנק שיתופי - מטבע משלים - מטבע קהילתי - כלכלה שיתופית - מכפיל מקומי 3 - מס טובין - פשטות מרצון - נתונים פתוחים - כנסת פתוחה - קוד פתוח - חומרה פתוחה

אישים וארגונים: אדם סמית - ארנסט פרידריך שומכר - יוזף שומפטר - ג'ון קנת גלבריית - אמרטיה סן - הא-ג'ון צ'אנג - דייוויד קורטן - ג'ושוע קארלינר - ונדנה שיווה - לואיג'י זינגלס - החלום האמריקאי החדש - SourceWatch

ספרים וסרטים: קטן זה יפה - הדינמיקה של הקפיטליזם - כשתאגידים שולטים בעולם - כלכלה בקומיקס - סופו של הליברליזם המפסידני - אומת המזון המהיר - מכונת הארגון - הלוגיקה של פעולה קבוצתית - נו לוגו - בולו'בולו - התאגיד - הפרסומת והאגו - סיפורם של הדברים - זה משנה הכל