کیفیت پویای اطلاعات وب
اگر لحظهای به انفجار »اطلاعات» توجه کنیم در مییابیم که وب محدودهی تولید، آمادهسازی، و استفاده از اطلاعات را متحول ساخته است.در عین حال، این مقوله غایت زنجیرهی تحولاتی است که محیطی برای امکانات شبکه فراهم کردهاند.
کنترل های بافتی بر محصولات کتابها و مجلات به این معناست که فرایند انتخاب مطلب برای کتابخانه و نگهداری آن خود بخشی از مجموعهای از عملکردها در این زمینه است.این امر میزان اطلاعات چاپی را در هر زمان محدود میکند یا در برمیگیرد.کاهش هزینهی تولید، تغییر فرآیندهای تولید، و فراگیر شدن هر چه بیشتر روشهای تولید، ابتدا با پیشرفت دستگاه فتوکپی و سپس با پرینتر لیزیری، این مدل را تغییر میدهد.ناشران با چالشهای (یا فرصت های) اقتصادی مواجه شدند و لذا مدلهای نشر خود را تغییر دادند.به عنوان مثال، برخی بهجای آنکه نسخههای زیادی از چند عنوان محدود بفروشند، نسخههای اندکی از عناوین بسیاری را فروختند.این شرایط انتشار سبب شد بسیاری نیز دریابند که میتوانند نویسندگانی ناشر باشند و آثارشان در چندین نسخه به فروش میرسد.این مسائل مشکلات جدیدی را برای کتابخانهها پدید آورد: چگونه باید به انفجار در دسترسی به منابع اطلاعاتی پاسخ داد(؟) پیشرفت وب و گسترش این فهم که ما هم میتوانیم نویسنده و هم ناشر باشیم، این مسأله را حادتر ساخته است.
ابعاد انقلاب الکترونیکی حیرت انگیز است.در ژانویهی سال 2001 ناسا اعلام کرد که 9/1 میلیون صفحه وب آن لاین وجود دارد.پرسنل ناسا تخمین زدهاند که اگر برای هر صفحه و عکس گرفتن از آن فقط ده ثانیه صرف کنیم، برای کل صفحهی وب ناسا 231 روز کار مداوم لازم است. فناوری در اینجا منجی ارزشمندی است چراکه، همانطور که ملاحضه شد، ایجاد عوامل هوشمندی که بتوانند اطلاعات را جمع آوری کنند چندان دشوار نیست، اما تا دسترسی به عوامل هوشمندی که بتوانند اطلاعات جمع آوری شده را همانند انسان مستندسازی کنند راه درازی در پیش داریم.البته ناسا در زمان و برآوردهای خود زمان لازم را برای ایجاد متاداده های اجرایی و بافتی لحاظ نکرد چراکه برآورد آن ها در واقع پاسخی به نیاز آرشیو ملی برای گرفتن تصویر کلی از وب سایت های دولتی بود.
مورخان از دیرباز به ارزش یادداشت های حاشیه ای اسناد، نظیر فهرست های ارسالی که پرسنل ادارات به هنگام بررسی اسناد به کار می بردند، واقف بوده اند (این یادداشت های حاشیه ای عمدتاً سندی محسوب می شوند که شخص خاصی آن را سندی خاص درنظر می گیرد).در اغلب فضاهای کامپیوتر محور حفظ این اسناد دشوار است، البته، پایگاه داده های مباحثاتی که در آن نشانه های جستجو وجود دارد مستثنا است.اغلب راه کارهای مربوط به نگهداری اطلاعات وب ناظر به محتوی بدون بافت و کاربرد است.نمونه آن دستگاه های Hollerith و ماشین های دسته بندی،گزینش،پالایش، و طبقه بندی اطلاعات Holocaust است،اگرچه این دستگاه ها نقش کلیدی در این فرایند ایفا می کنند اما کافی نیستند.در دنیای اینترنت فهم این فرایند مستلزم نگهداری دستگاه ها، نحوه ورود کاربران به سیستم، و نحوه استفاده آن ها از این منابع است (برای بحث قوم نگاری به مبحث پیشین بنگرید).اهمیت پرونده سازی برای کاربر به شیوه ای دقیق تر و ارتباط آن با منابع اینترنتی روز به روز بیشتر می شود خاصه درصورتی که بخواهیم اطلاعات اینترنتی را در اختیار مورخان آینده قرار دهیم.
در کل باید به خاطر داشته باشیم که ما نمیتوانیم همه چیز را نگهداری (حفظ) کنیم.این مسأله چند دلیل دارد:
1. اول آنکه نمی توان آن را به طور مقتضی مستندسازی نمود تا چنین کاربردی داشته باشد؛
2. دوم آنکه بسیاری از اطلاعات مازاد (حشو) است که خود سبب کمبود فضا برای نگهداری اطلاعات مفید دیگر میگردد؛ (اطلاعات مازاد در کاتالوگها، انبارهای کامپیوتری نگهداری می شوند و از این طریق به غربال بهتر اطلاعات کمک می کنند)؛ و،
3. بدون بهرهمندی از نگرش معاصر درخصوص آنچه اهمیت دارد جدا کردن مسائل و مطالب حائز اهمیت و معنادار از سایر مسائل برای محققان آینده فرایندی بسیار دشوار خواهد بود-به عنوان نمونه دشوار می توان کارآمدی آثار سنسا را از آثار شلدون تشخیص داد.بسیاری از راه کارهای رایج درخصوص نگهداری اطلاعات وب شامل طیفی از راه کارهای بی اهمیت، مغلوت و در عین حال دقیق، بنیادین و در عین حال کلی، و ساده و در عین حال پیچیده می شوند.
افراد زیادی وجود دارند که ادعا میکنند میتوانند از عهدهی انتخاب نوع اطلاعات برآیند اما این افراد واقعاً نمیدانند که »چه کسانی و به چه نحو خواهند توانست از تمام این اطلاعات استفاده کنند».ما نباید فرض کنیم که محققان در آینده مجبورند که از آرشیوهای دیجیتالی امروز ما استفاده کنند.وب یک منبع دیجیتالی عظیم است و ما دائماً میتوانیم اطلاعات آن را با ابزارهای مختلف تغییر دهیم و دستکاری کنیم.این اطلاعات روز به روز غنی تر می شوند.محققان آینده، خواه دانشمندان یا عوام، بیشک با ابزارهای پیشرفتهتر میتوانند معنا و اطلاعات جدیدتری را در دنیای دیجیتالی کشف کنند که ما آن ها را حفظ کرده ایم.
اگر بخواهیم موضوعی را در راستای حفظ و نگهداری از وب انتخاب کنیم باید مطمئن شویم که دادهها از انسجام درونی برخوردارند که از منابع چاپی انتظارمان می رود، نظیر نسخه 11 دائرالمعرف بریتانیکا: از طرفی اطلاعاتی که انتخاب میشوند باید:
• معتبر و آماده تایید و تصدیق باشند؛
• دقیق باشند؛
• از انسجام درونی برخوردار باشند؛
• کامل باشند؛
• قابل فهم و قابل دسترس باشند؛ و
• دائمی باشند.
بعلاوه باید امکان کارکردی کردن اطلاعات وجود داشته باشد-یعنی اطلاعات را یا باید بتوان به صورت صفحهی وب درآورد یا پایگاه داده ها کرد-و داده ها باید منحصر به فرد باشند.از آن جا که یکی از نقاط قوت اطلاعات دیجیتالی انتقال و نسخه برداری آسان در فضای کامپیوتر است نگهداری چند نسخه از یک مجموعه اطلاعاتی دیجیتالی مهم دشوار نخواهد بود.البته، ما تنها نباید اطلاعات را نگهداری کنیم، بلکه دسترسی آسان به اطلاعات نیز از دیگر نیازهای اساسی ما در این زمینه است.
فناوری، حقوق مالکیت معنوی، و فقدان سیاست [گذاری]؟
حفظ میراث دیجیتالی امان، (مثل وب، موارد ثبت شده یا سندهای الکترونیکی) مستلزم عبور از موانع فنی بسیاری است.کتاب Changing Trains at Wigan بسیاری از این چالشهای فنی را توصیف کرده و راهکارهای عبور از آنها را نیز آورده است. این کتاب خاطرنشان می سازد که اغلب رویکردها به پژوهشهای جدید در حوزه Magnetic Force Microscopy به کدهای هدفمند باینری، و رقابت بستگی دارند.مؤلفان بسیار دیگری نیز وجود دارند که مسائل فنی دیگری را بررسی کردهاند که در اینجا فرصت پرداختن به آنها را نداریم.
غلبه بر مشکلات سختافزاری و نرمافزاری، اختلالات رسانهای، حمایتها، و سندسازی همگی حفظ منابع الکترونیکی را گران میکنند.هزینهی این موارد به مرور زمان کم نمیشود.منابع الکترونیکی مستلزم توجه مستمر و مراقب دائم هستند، در صورتی که نسبت به آنها بی توجه باشیم، به سرعت غیرقابل دسترس می شوند.این که مطلبی در قالب الکترونیک در اختیار محققان آینده قرار گیرد به لحاظ هزینه در قیاس با انتقال پیام از یک رسانه به رسانه دیگر، مستندسازی مطلب و مشکلات مربوط به ایجاد فضاهای مجازی جهت استفاده مجدد از اطلاعات (به عنوان نمونه امکان استفاده مجدد از اطلاعات موجود در کامپیوتر) به حساب نمی آید.
گذشته از ابزارهای قانونی مانند کپیرایت و حفاظت اطلاعات اجازهی نگهداری انبوهی از اطلاعات موجود در وب را نمیدهند.بارگزاری کردن و نگهداری اطلاعات وب، حتی اطلاعاتی که رایگان هستند، ممکن است به قیمت نقض قانون حقوق مالکیت معنوی سازمانها یا افراد تمام شود.تیم سلیگل در پیامی به Risks-List (Riscks Forum Digest) در سال 1997 ابراز تعجب کرد که »آیا آرشیو اینترنت میتواند بزرگترین آرشیوی باشد که اصلاً قانون کپیرایت را در جهان رعایت نمیکند.من واقعاً علاقهای به پیگیری این تخلفات ندارم اما شرط میبندم شخص دیگری (یک ناشر، هنرمند، یک شرکت سختافزاری) این کار را خواهد کرد خاصه اگر بتواند به آرشیو اینترنت دسترسی داشته باشد».
شاید حرفهای سلیگل تا حد زیادی درست باشد، اما مسائل قانونی مرتبط با حقوق مالکیت معنوی نمیتواند تنها مسائلی باشند که برای پروژههای آرشیوی اینترنت مشکلساز باشد.در برخی کشورها حفاظت از اطلاعات یا قوانین و قواعد محرمانه بر آرشیو وب یا دستکم بر افرادی که میتوانند به آرشیوهای اطلاعاتی دسترسی داشته باشند و نحوهی کار با آن اطلاعات، تأثیر میگذارد.خطر زیرپا گذاشتن امتیازات و علائم تجاری نیز از دیگر موانع احتمالی به شمار می رود.
آنچه ما باید از آن پرهیز کنیم پاسخهای ضعیف یا بدون حساب و کتاب است.ایالات متحده اخیراً شرایط خوبی را ایجاد کرده است.در ژانویه سال 2001، هشت روز قبل از آنکه کلینتن کنار رود، لوئیس بلاردو دبیر آرشیو ملی یادداشتی برای افسران اطلاعات آژانسهای فدرال فرستاد و در آن از آنها خواست تا از وبسایتهای عمومی خود عکس تهیه کنند و قبل از 20 ژانویه آن را بفرستند. اینترانت و مواد ممنوعه کنار گذاشته شدند، در سند همراه آن یادداشت آمده بود که این عکس باید تمام اسناد و مدارک موجود در سرور وب را دربرگیرد. فرمت ذخیرهای که دایره اسناد و آرشیو ملی از آژانسهای خود خواست تا از آن بدین منظور استفاده کنند به کاستهای رسانهای و استانداردهای اطلاعاتی که به نظر غیرقابل استفاده میآیند بستگی دارد.
آنچه این اسناد نشان داد فهمی کاملاً محدود از فناوریای بود که اکنون در آژانسهای ایالات متحده بهکار میرود. نشریه Federal Computer Week گزارش داد: درخواست دایره اسناد و آرشیو ملی برای عکسهای وبسایتهای ملی از نگاه مدیران وب فدرال یک درخواست لازم الاجرا بود.یک مدیر وب گزارش داد، ما برآنیم که از تمام قوانین تبعیت کنیم، اما به نظر میرسد که اخیراً این قوانین توسط افرادی وضع میشود که واقعاً از وب سردرنمیآورند.
تنها تعداد معدودی از سازمانها از عهده مسأله حفظ وبسایتهای خود در سطح محلی برآمدهاند.به عنوان مثال، اتحادیه اروپا، (در سال 2001) فعالانه درحال ایجاد طرحی با عنوان مدیریت الکترونیکی اطلاعات وبسایت (WERM) است.راه کارهای بسیاری در سطح ملی در این مورد وجود دارند از آن جملهاند، سایت آرشیو ملی استرالیا، که در آن منابع وب را آرشیو کرده است. اتاق (فضا) مهم است، اما از آن مهم تر نیاز به کارگیری و عملیاتی کردن این راه کارها در سطح بین المللی است.اغلب کمپانیها بنابر راهکارهای مدیریت اطلاعات در حال حفظ وبسایتهای خود هستند و فعالیتهای آنها (قوانین حقوقی) باید مورد توجه سازمانهایی که قصد حفظ وبسایتهای خود را دارند قرار گیرد تا از تقلید روش پرهیز شود.
حفظ وبسایت کاری چند لایه است.هر سازمانی برای حفظ وبسایت خود فرمول و رسالت خاصی دارد، در عین حال هدف کلی گردآوری چتری داده ها (گردی آوری داده ها در سطح انبوه) حصول اطمینان از ذخیره میزان قابل توجه ای از اطلاعات برای آینده است.هر راه کار باید این لایهدار بودن را تقویت کند نه اینکه سبب آشفتگی و بههم خوردن انسجام در اطلاعات جمعآوری شده گردد.
در تعداد معدودی از پروژههای آرشیو وب مسائل مربوطه به دقت، قابل فهم بودن، معناداری، یا ارائهی اطلاعات لحاظ میشود.اغلب آنها به فکر جمع کردن هستند تا انتخاب کردن (Pandora در این مورد یک استثناست).به اعتقاد من این مسئله مشکل عمده ای ایجاد می کند.یکی از ویژگی های کتابخانه ها آن است که آن ها کوشیده اند تا اطلاعات را به نحو قابل قبول جمع آوری، ذخیره و قابل دسترس نمایند، هرچند که همواره در این راستا موفق نبوده اند.
آخرین ایدهها و گرایشهای آینده
یک اصل راهنمای حفظ وب باید مناسب مقصود باشد و در این مورد ما باید بپرسیم که محققان در آینده چه میخواهند و ما چه چیزی میتوانیم به آنها بدهیم.اگر هدف اولیه از حفظ [وب] حصول اطمینان از این مسأله باشد که فرایند تصمیمگیری معاصر را ثبت کنیم، رویکرد حفظ، با زمانیکه بخواهیم فضای اجتماعی اینترنت را حفظ کنیم بسیار متفاوت است.از سوی دیگر ما نباید از این واقعیت غافل باشیم که صفحات وب و منابع وب همه محصولات دنیای مجازیاند و تک تک متون ضمن جذاب بودن تنها موضوع مطالعات آینده نیستند.در مقام مقایسه باید در نظر بگیریم که، فیلسوفان ایدههای مطرح در سمپوزیوم افلاطون را بررسی میکنند در عین حال مورخان همین سند را به مثابه یک متن قوننگارانه بررسی میکنند تا آثار سمپوزیومهای یونانی را دریابند.
اگر ما صرفاً به اطلاعات صفحات وب علاقهمند باشیم، حفظ محتوای این صفحات تقریباً با همان چالشهایی مواجه است که سایر منابع الکترونیکی مواجهاند.فضای مجازی یک فضای سیالی است که جوامع در آن پدید میآیند و از میان میروند.این فضا بسیار متکی بر تعامل (برخورد) پیچیده بین هویت، اعتماد و تصویر(خیال) است.فضای مجازی فضایی است که در آن اطلاعات، مکان و هدف را تعیین میکنند.اطلاعات در این فضا تنها زمانیکه کارکرد داشته باشند یا تا زمانیکه شخصی آنها را به نحو هیجانانگیزی عرضه کند ارزش دارند.
بنابراین، در نهایت امر باید بپرسیم که دارایی فرهنگی ای که ما در پی مدیریت آن هستیم کدامند: محتوا؟ فضا؟ یا تجربه؟ به اعتقاد من هر سه اینها منبع فرهنگی است، اما در عین حال معتقدم که حفظ محتوا، با چالشهای قابل ملاحظهای مواجه است.
اگر بخواهیم مطمئن شویم که آیندگان ما به فرهنگ اینترنتی ما دسترسی خواهند داشت باید از هشت چالش عبور کنیم:
1. ایجاد راهکارهای مختلف برای انتخاب در سطح ملی، محلی، و بینالمللی برای حفظ محصولات فرهنگی به شکل منسجم و ساختارمند؛
2. تعیین و تعریف مشخصات مطالبی که »ارزش حفظ کردن» دارند و حصول اطمینان از این که این تعاریف ناظر به حفظ فرهنگ عمومی در کنار سایر موارد هستند؛
3. ایجاد یک گونهشناسی از محتوای وب که به ما امکان دهد تا بتوانیم به آسانی آن را جمعآوری، طبقهبندی، ذخیرهسازی و حفظ کنیم؛
4. انجام مطالعات قومنگارانه روی جوامع فضای مجازی؛
5. ایجاد یک آرشیو نرمافزاری، هدف از ایجاد این آرشیو فراهم نمودن تسهیلات برای آیندگان جهت یافتن راه های جدید ارائه اطلاعات است.این که درخصوص XML تا چه اندازه صحبت به میان آمده است چندان اهمیت ندارد مهم آن است که این ابزار یک فرمت ذخیره سازی آزاد و مستقل در اختیار ما می نهد؛
6. ساخت مکانیزمهایی که بتوانند به رسانههای دیجیتالی که مستقل از تمام سخت افزارها و نرمافزارها هستند دسترسی داشته باشند، هدف از این کار دسترسی آسان به نسخههای موجود در آرشیو در آینده است؛
7. رفع چالش واقعی که همانا حفظ تعامل، ضروریات و تجربیات اینترنتی است؛ و،
8. انجام اقداماتی که متسلزم سیاستهای مشترک و چند مرحلهای است.
حفظ (نگهداری) محتوا را از سه منظر میتوان بررسی کرد:
• مدلی مرکزی که در آن یک گروه در یک نقطه سعی میکنند هر چیزی را ذخیره کنند؛
• مدلی پراکنده که در آن گروههای مختلف مواد مورد نظر سازمان، مؤسسه، یا ملل خود را ذخیره میکنند؛ و،
• مدلی توزیع شده، که در آن سازمانها برای نگهداری و حفظ [محتوا] با هم همکاری میکنند.
مدل توزیع شده که در آن تولید کنندگان اطلاعات (مثلاً سازمانهای تجاری یا آژانسهای حکومتی) و کتابخانههای ملی، آرشیوها و موزهها با همکاری هم میراث فرهنگی و فکری را مستند میکنند، تنها راهحل قابل اجرا و عملی است.این مدل، تلاشها را مؤثرتر، انسجام استانداردها را بیشتر و از دوبارهکاری جلوگیری میکند.اینترنت فضایی چند بعدی است که در آن، همکاری، و رقابت نقش مهمی را ایفا میکند اما تنها از طریق همکاری است که جامعهی معاصر میتواند منابع فرهنگی خود را حفظ کند.
منابع:
Anderson, B., (1983), Imagined Communities: Reflections on the Origin and Spread of Nationalism, (London: Verso).
Appadurai, A., (1996), Modernity at Large: Cultural Dimensions of Globalization,
(Minneapolis: University of Minnesota Press).
Arms, W.Y., Adkins, R., Ammen, C., and Hayes, A., (2001), ‘Collecting and Preserving the Web: The Minerva Prototype,’ RLG DigiNews, 5.2.
Black, E., (2001), IBM and the Holocaust: The Strategic Alliance between Nazi Germany and America’s Most Powerful Corporation, (New York: Crown Publishers).
Ceruzzi, P.E., (1999), A History of Modern Computing, (Cambridge, MA: The MIT Press).
Curtis, P., (1996), ‘MUDding: Social Phenomena in Text-based Virtual Realities”, in Peter Ludlow (ed.), High Noon On The Electronic Frontier: Conceptual Issues in Cyberspace, (London: The MIT Press).
Dibble, J., (1998), ‘A Rape in Cyberspace’, in Richard Holeton (ed.), Composing Cyberspace: Identity, Community, and Knowledge in the Electronic Age, (Boston: McGraw-Hill)
Dibbell, J., (1996), ‘A Rape in Cyberspace; or How an Evil Clown, a Haitian Trickster Spirit, Two Wizards, and a Cast of Dozens Turned a Database into A Society’”, in Peter Ludlow (ed.), High Noon On The Electronic Frontier: Conceptual Issues in Cyberspace, (London: The MIT Press).
Donath, J.S., (1999), “Identity and Deception in the Virtual Community” in M.A. Smith and P. Kollock (eds.) (1999), Communities in Cyberspace, (London: Routledge).
NARA Guidelines, (2001), Guidelines To Agencies On Preserving A Snapshot Of Their Web Sites At The End Of The Clinton Administration, (Washington DC: NARA).
Holeton, R., (ed.), (1998), Composing Cyberspace: Identity, Community, and Knowledge in the Electronic Age, (Boston: McGraw- Hill).
Ito, M., (1996), ‘Virtually embodied: the Reality of Fantasy in a multi-user Dungeon’, in David Porter (ed.), Internet Culture, (London: Routledge).
Jones, C., (1995), ‘What Goes into an Information Warehouse?’ Computer (Aug), 84-5.
Kahle, B., (1997), ‘Archiving the Internet’, Scientific American (March),
http://www.archiving.org/sciam_article.html
Kuper, A., (1999), Culture: The Anthropologists’ Account, (Cambridge, MA: Harvard University Press).
Malinowski, B., ([1922], 1950), Argonauts of the Western Pacific, (New York: E.P.Dutton).
Malinowski, B., (1954), Magic, Science and Religion, and Other Essays, (New York: Doubleday Anchor Books).
Matthews, W., (2001), ‘Webmasters flinch at "snapshots"’, Federal Computer Week.
Millard, W. B., (1996), ‘I Flamed Freud: A Case Study in Teletextual Incendiarism’, in David Porter (ed.), Internet Culture, (London: Routledge).
NAA's Archiving Web Resources: A Policy for Keeping Records of Web-based Activity in the Commonwealth Government,
http://www.naa.gov.au/recordkeeping/er/web_records/intro.html
Nightingale, V., (1996), Studying Audiences: The Shock of the Real, (London: Routledge).
Relf, F.A., (1999), ‘PANDORA – Towards a national collection of Australian electronic publications’,
http://www.nla.gov.au/nla/staffpaper/ashrelf1.html
Reid, E. M., (1996), ‘Communication and Community on Internet Relay Chat: Constructing Communities’, in Peter Ludlow (ed.), High Noon on the Electronic Frontier: Conceptual Issues in Cyberspace, (London: The MIT Press).
Reid, E. M., (1999), “Hierarchy and Power: Social Control in Cyberspace”, in Smith, M.A. and Kollock, P., (eds.), Communities in Cyberspace, (
Ross, S., (2000), Changing Trains at
Ross, S., (1998), ‘The Expanding World of Electronic Information and the Past’s Future’, in Higgs, E, (ed.), Historians and Electronic Artefacts, (
Ross, S., (1995), ‘Introduction: Networking and Humanities Scholarship’, S. Kenna & S. Ross (eds.), Networking in the Humanities, (
Shore, B., (1996), Culture in Mind: Cognition, Culture, and the Problem of Meaning, (
Smith, M.A. and Kollock, P., (eds.), (1999), Communities in Cyberspace, (
Tepper, M., (1996), ‘Usenet Communities and the Cultural Politics of Information’, in David Porter (ed.), Internet Culture, (
Turkle, S., (1997 rpt), Life On the Screen, (