נהוג לומר שהעיתונות היא הטיוטה הראשונה של ההיסטוריה, אולם המציאות המדאיגה היא שכלל לא בטוח כי החדשות של היום תהיינה זמינות בעתיד. ממחקר שערכתי בשיתוף עם אנג'לה וודאל, ובו בחנו פרקטיקות שימור וארכוב ובקרב גופי המדיה מובילים בארצות הברית, עולה כי ארגונים אלו אינם פועלים לשימור ארוך טווח של התוכן החדשותי שהם מייצרים ומפיצים.

המחקר נערך בבית הספר לעיתונות שבאוניברסיטת קולומביה וכלל ראיונות עומק עם 48 אנשי מקצוע מ-30 ארגונים שונים, ביניהם ארגוני חדשות מובילים בארצות-הברית וארגוני זיכרון ושימור מורשת, כגון ספריות וארכיונים. מהראיונות עולה כי מרבית ארגוני העיתונות שהשתתפו במחקר אינם פועלים לשימור התוצרים הדיגיטליים שמתפרסמים באתרי החדשות שלהם.

מבין 21 גופי מדיה שהשתתפו במחקר, 19 ארגונים כלל אינם פועלים לשימור וארכוב התוכן שמתפרסם בחסותם, לא דיגיטלי וגם לא דפוס, ובאף אחד מהארגונים הללו לא קיים נוהל מתועד כלשהו לשימור התכנים שמתפרסמים בשמם. נתונים אלו מדאיגים במיוחד בעידן של "פוסט אמת", ובתקופה שבה העיתונות נתונה למתקפה בלתי פוסקת. הדו"ח שחיברנו בעקבות המחקר, והתפרסם ב"קולומביה ג'ורנליזם ריוויו", מיועד להיות קריאת השכמה לתעשיית העיתונות ולארגוני שימור המורשת.

נעלם בין לילה: מודעות לזמניותו של התוכן

על מנת להעלות את המודעות לחשיבות שבשימור, בדקנו כיצד אנשי מקצוע בארגוני חדשות תופסים את המשימה של ארכוב תוכן חדשותי. "אם זה קיים על גוגל דוקס זה כנראה יישאר שם לנצח, נכון?", אמר לנו באחד מהראיונות עורך בכיר של עיתון מוביל, אבל ההנחה הזאת שגויה לחלוטין.

מהראיונות שערכנו עולה כי קיים בלבול בקרב העיתונאים בין גיבוי לבין ארכוב. גיבוי (שלרוב נעשה במערכת לניהול התוכן, CMS, או באמצעות שירותי ענן כמו גוגל דוקס או דרופבוקס) מבטיח שגם אם בטעות משהו יימחק כעת, קיים עותק ביטחון נוסף במקום אחר. לעומתו, ארכוב נועד להבטיח שהתכנים יהיו זמינים גם לטווח הארוך, כאשר המחשבים ותוכנות ההפעלה שלהם יהיו שונים מכפי שהם היום.

נקודת ציון משמעותית בהבנה שתכנים חדשותיים יכולים להיעלם בין לילה היא המקרה של האתר החדשותי "גוקר" (Gawker), שנסגר ללא התראה מוקדמת בשלהי 2016. עיתונאי האתר התעוררו לגלות שהתכנים שפורסמו תחת שמם נעלמו כלא היו

מעבר לזאת, נראה שקיימת סתירה בין האופן שבו עיתונאים תופסים את הארעיות של מידע דיגיטלי לבין האשליה שהאינטרנט אינו שוכח לעולם. כך, לדוגמה, תחקירן מארגון חדשות מוביל פירט בפנינו כיצד הוא מסתמך על תוכנות מעקב שמבטיחות שכל היסטוריית החיפוש שלו תישמר ואיך הוא מקפיד לשמור צילומי מסך של כל מקור ששימש אותו לכתיבת הסיפור החדשותי, מחשש שהמידע יימחק או ייעלם מהרשת. אבל כאשר שאלנו אותו בסיום ההסבר המפורט היכן שמור הסיפור הסופי שהתפרסם, הוא השיב: באתר החדשות שלנו.

נקודת ציון משמעותית בהבנה שתכנים חדשותיים יכולים להיעלם בין לילה היא המקרה של האתר החדשותי "גוקר" (Gawker), שנסגר ללא התראה מוקדמת בשלהי 2016. עיתונאי האתר התעוררו לגלות שהתכנים שפורסמו תחת שמם נעלמו כלא היו. נכון להיום, הארכיון של "גוקר" זמין ברשת, אבל המקרה הזה, לצד מקרה דומה של האתר Gothamist, יצרו בהלה בקרב עיתונאים אמריקאים, ולא רק אצלם. ולמרות זאת, לא נראה שהלקחים מאותן מחיקות הופנמו בענף העיתונות, לא בארגונים ולא אצל יחידים, והם עדיין לא מארכבים את הפרסומים שכתבו וערכו.

צרות בבית הקברות: אתגרים בשימור מידע

מודעות אינה מספיקה, שימור מידע חדשותי דיגיטלי מציב אתגרים חדשים. בעוד שבעידן הטרום דיגיטלי ניתן היה לשמר את המהדורה המודפסת בארכיון של ארגון החדשות (המרתף שבו נשמרים ה"קליפים", גזירי הכתבות, מכונה באנגלית "בית קברות", morgue) ורוב גופי המדיה העסיקו בעל תפקיד ייעודי לשימור, כמו ספרנים או אחראי ארכיון, כיום הדברים מתנהלים אחרת.

ראשית, בעקבות מעבר של התעשייה לדיגיטל והקיצוצים בענף העיתונות, הראשונים שפוטרו היו אותם בעלי תפקידים. בבת אחת ארגוני חדשות מובילים הפסיקו לשמור את גזירי הכתבות ונפטרו מארגזים שנשמרו במשך עשרות ואף מאות שנים. במקרה הטוב, אלו נתרמו לספרייה העירונית או עברו דיגיטציה, במקרה הפחות טוב הם פשוט נזרקו לרחוב.

שנית אירכוב דיגיטלי מצריך כישורים שונים מאלו שנדרשו לאירכוב דפוס ומעורר שאלות חדשות. כיצד לארכב ויזואליזציה, קישורים פנימיים בתוך הכתבה, וידיאו שמפנה ל-YouTube , פרסומות שמותאמות אישית לכל גולש וגולשת, או תגובות לכתבות. כך למשל הופתענו לגלות שתגובות לכתבות ישנות נמחקו כשארגונים החליפו ספקים שתפעלו את הטוקבקים.

כתבות שלמות נעלמו בזמן המעבר לתוכנות לניהול תוכן חדשות או שדרוגי הגרסאות, תכנים אחרים לא עברו בצורתם המקורית, פורמטים ישנים (כמו פלאש) הפסיקו לעבוד וכמויות עצומות של מידע חדשותי פשוט נעלמו

ולא רק תגובות – כתבות שלמות נעלמו בזמן המעבר לתוכנות לניהול תוכן חדשות או שדרוגי הגרסאות, תכנים אחרים לא עברו בצורתם המקורית, פורמטים ישנים (כמו פלאש) הפסיקו לעבוד וכמויות עצומות של מידע חדשותי פשוט נעלמו. כמעט כל ארגוני החדשות מפרסמים כיום פוסטים ברשתות החברתיות - אף לא אחד מהארגונים שראיינו שומר את התכנים הללו. מרבית הנשאלים השיבו שלא ניתן לדעת מה יעלה בגורלו של המידע הזה אם אחת הרשתות תיסגר ביום בהיר אחד.

אתגר נוסף ששב ועלה הוא ההתייחסות לתיקונים של כתבות שהתפרסמו ולאבולוציה של דיווח. כך לדוגמה כאשר מעדכנים דיווח חדשותי שהתעדכן לאחר הפרסום, לעיתים קרובות לא ניתן לשחזר את הגרסה הקודמת שלו. בנוגע לנקודה זו מרואיינים שבו ושאלו: גם אם נחליט לארכב את המידע הזה, כיצד נדע מהי הגרסה הקנונית שראוי לשמרה? זו אכן שאלה חשובה, ואיני בטוחה שיש לנו תשובות טובות עבורה, אבל מה שבטוח הוא שכדאי להתחיל איפשהו. במילותיה של אחד המרואיינות: "זה כמו למסמר עשן לריצפה, אף אחד לא יודע איך עושים את זה והם גם לא בטוחים אם הם בכלל צריכים או רוצים לעשות את זה".

מקום בספרייה: מי צריך לשמור ומה

כיום פועלים מספר שחקנים מרכזיים בתחום של שימור חדשות דיגיטליות, כמו למשל "PastPages", יוזמה שפותחה על ידי עיתונאי הדאטה של ה"אל איי טיימס", בן וולש; "NewsGrabber", שהוקמה למטרות דומות ו"ארכיון האינטרנט". כמעט כל העיתונאים והעיתונאיות שראיינו מסתמכים על "ארכיון האינטרנט" כמעט בעיניים עצומות. ולא רק כדי לאתר מקורות ישנים שנעלמו מהרשת, אלא גם כדי לשמר את החומרים שלהם עצמם. אלא  שבראיון נרחב שערכנו עם בעלי תפקידים בכירים בארכיון, הובהר לנו כי הם אינם משמרים כל מה שמתפרסם, פשוט בגלל שזה בלתי אפשרי לארכב את כל האינטרנט.

מעבר לאתגר הטכנולוגי, צריכות להישאל שתי שאלות מרכזיות בנוגע לשימור של מידע חדשותי: מה צריך לשמור ומי צריך לשמור אותו. וגם: האם האחריות לשימור היא על ארגוני החדשות שמייצרים את התוכן או על ארגוני שימור ומורשת? שכן מידע חדשותי הוא בעל ערך ציבורי בהווה ולעתיד. בסופו של דבר, מהמחקר שערכנו עולה מסקנה אחת מרכזית: שימור ואירכוב מידע חדשותי קשורים בראש ובראשונה לסדרי עדיפויות של בעלי תפקידים בכירים.

שתי שאלות מרכזיות: מה צריך לשמור ומי צריך לשמור אותו; ומסקנה אחת מרכזית: שימור ואירכוב מידע חדשותי קשורים בראש ובראשונה לסדרי עדיפויות של בעלי תפקידים בכירים

בחינה מעמיקה על המצב בישראל מחייבת מחקר נוסף, שיקח בחשבון את ההבדלים המהותיים בין שוק העיתונות האמריקאי לזה הישראלי. בישראל קיים חוק "חובת מסירה וציון פרטים", שמחייב את העיתונים להפקיד עותק מכל פרסום בספרייה הלאומית בישראל. בארצות הברית לא קיים חוק הפקדה. הסיבה לכך, כפי שהוסבר לנו באחד הראיונות שערכנו, היא שספריית הקונגרס אינה ערוכה לטפל בכמות העצומה של העיתונים המופצים בכל רחבי ארצות הברית.

עם זאת, קיימים מספר עיתונים מובילים שספריית הקונגרס דורשת את הפקדתם, וישנם מוציאים לאור ששולחים עותקים לספרייה על מנת לשמור על זכויות יוצרים. בהקשר הישראלי, מעניין לבחון כיצד חובת המסירה מתבטאת בפרסומים דיגיטליים ואם מתבצע שימור דיגיטלי כלשהו, מה מבין כל הפרסומים נבחר כגרסה קאנונית לשימור ארוך טווח ובמלים אחרות, איזה מידע חדשותי ישמר לעתיד.

ד"ר שרון רינגל היא פוסט-דוקטורנטית בבית ספר לעיתונות של אוניברסיטת קולומביה והחל מאוקטובר 2019 חברת סגל בחוג לתקשורת באוניברסיטת חיפה