আপনি কি কখনও ভেবে দেখেছেন কত তথ্য একটি ট্রেস ছাড়া হারিয়ে যায়? সর্বোপরি, তথ্য হল হাবরের অস্তিত্ব। আপনি কি জানেন যে ব্যবহারকারীর পোস্টের উপর ভিত্তি করে সংস্থানগুলির সাথে প্রায়শই কী ঘটে? লেখকরা তৃতীয় পক্ষের সাইট থেকে ছবি, ছবি এবং ভিডিও সন্নিবেশ করান এবং কিছু সময়ের পরে সেগুলি আর পাওয়া যায় না। এটি একবারের জন্য তৈরি করা হয়েছিল। Habrastorage. অনুশীলন দেখিয়েছে যে কেউ (সম্পাদক এবং কিছু উত্সাহী ছাড়া) সেখানে তাদের নিজের ছবি আপলোড করে না। অতএব, কিছু সময়ে, হাবর প্রশাসন এই ফাংশনটিকে স্বয়ংক্রিয়ভাবে তৈরি করেছে - প্রকাশনায় প্রদর্শিত প্রতিটি চিত্র স্বয়ংক্রিয়ভাবে স্টোরেজে আপলোড হয়ে যায় এবং যতক্ষণ হাবর নিজেই বিদ্যমান থাকবে ততক্ষণ সেখান থেকে অদৃশ্য হবে না। অবশ্যই, ব্যতিক্রম আছে এবং কিছু ভুল হতে পারে, কিন্তু এখন তাদের সম্পর্কে না.
Habrastorage এ ছবি লোড করার সাথে এই পুরো স্কিমের সবচেয়ে বড় সমস্যাটি এটি বাস্তবায়নের সময় ঘটেছে। সেই সময়ের মধ্যে, কিছু পুরানো প্রকাশনার ইতিমধ্যে কোনও অঙ্কন ছিল না, এবং তাই সেভাবেই রয়ে গেছে। আজ আমরা জানার চেষ্টা করব হাবর তার জন্মের পর থেকে কতটা গ্রাফিক তথ্য হারিয়েছে। এছাড়া, হয়তো আমরা অনুপস্থিত ছিল কিছু খুঁজে পেতে পারেন? এই "চিত্র লোড করা যাবে না" স্টাব বিরক্তিকর, তাই না? আজকের গোয়েন্দা গল্পটি ঠিক এই বিষয়েই উৎসর্গ করা হয়েছে। চল শুরু করি!
Возможно, вас в эту статью привело упоминание в যে ব্যক্তি অনুসরণ করে? সম্ভবত, আপনার পুরানো প্রকাশনাগুলির একটি থেকে একটি ছবি অদৃশ্য হয়ে গেছে এবং আমি এটি খুঁজে পেয়েছি। আপনি যদি সম্পূর্ণ পোস্টটি পড়তে না চান তবে আপনি শুধুমাত্র একেবারে শেষে স্পয়লারে স্ক্রোল করতে পারেন (বিভাগ Результаты), যা পাওয়া সমস্ত প্রকাশনা এবং চিত্রের তালিকা করে। ধন্যবাদ!
ভূমিকা এবং পদ্ধতি
Наш детектив начнётся с самого начала (логично, правда?). С начала Хабра. Ведь чем раньше был опубликован какой-либо пост, тем больше шансов, что изображения из него затерялись где-то в истории. Именно потому начнём мы с 2006 года и пройдём немного вперёд.
বর্তমানে র্যাঙ্কিংয়ের শুরুতে থাকা 40টি হাবের সমস্ত প্রকাশনা বিবেচনায় অন্তর্ভুক্ত করা হয়েছে। এই হাবের সম্পূর্ণ তালিকা স্পয়লারের অধীনে উপস্থাপন করা হয়েছে। প্রকৃতপক্ষে, তাদের অনেকগুলি তখন বিদ্যমান ছিল না, কিন্তু যখন নতুন হাব যুক্ত করা হয়েছিল, তখন প্রকাশনাগুলি সেখানে স্থানান্তরিত হয়েছিল।
পিএইচপি স্ক্রিপ্টের একটি সেট ব্যবহার করে তথ্য সংগ্রহ করা হয়েছিল। প্রতিটি প্রকাশনা ডাউনলোড করা হয়েছিল, ট্যাগের বিষয়বস্তু নির্ধারণ করা হয়েছিল <div id="post-content-body" > এবং ট্যাগ জন্য চেক < img > ভিতরে প্রতিটি ছবির জন্য, ছবির লিঙ্কগুলি সংরক্ষণ করা হয়, Habré-এ প্রকাশনা আইডির সাথে লিঙ্ক করা হয়। এই তথ্য আরও বিশ্লেষণ করা হয়.
Что и когда публиковали
2006
হাবরের একেবারে শুরুতে এখনকার মতো এত প্রকাশনা ছিল না এবং সেগুলিতে আরও কম ছবি ছিল। 2006 সালে তালিকাভুক্ত হাবগুলিতে মোট 05.06.2006টি পোস্ট প্রকাশিত হয়েছিল (221/53/75 থেকে শুরু হয়েছে)। এই পোস্টের 10টিতে মোট XNUMXটি ছবি রয়েছে। একটি প্রকাশনায় সর্বাধিক ছবি (XNUMX টুকরা) "দশটি গ্যাজেট যা বিশ্বকে বদলে দিয়েছে". 50 рисунков уже находятся на Habrastorage. Ещё 25 потеряно. Все они уникальны и не повторяются.
একটি আকর্ষণীয় সত্য: দুটি চিত্রই হাবরের দিকে নিয়ে যায়, কিন্তু দীর্ঘ সময়ের জন্য উপলব্ধ নয়। এই ছবিগুলো হল http://www.habrahabr.ru/tmp/sup_blogs_preview.gif এবং http://www.habrahabr.ru/tmp/upgrade-chart.gif।
সুতরাং, 2006 এর জন্য হেরেছে 33.3% প্রকাশনায় ছবি।
2007
2007 সালে, প্রকাশনার সংখ্যা উল্লেখযোগ্যভাবে বৃদ্ধি পেয়েছে, যেমন ছবির সংখ্যা ছিল - 1 টি পোস্ট প্রকাশিত হয়েছিল। 713টি পোস্টে 599টি ছবি রয়েছে। 1টি ছবি হ্যাব্রাস্টরেজে স্থানান্তর করা হয়েছিল এবং 467টি হারিয়ে গেছে (16.2%).
একটি আকর্ষণীয় সত্য: প্রকাশনা শীর্ষ 100 ম্যাক ওএস অ্যাপ্লিকেশন содержит максимум за 2007 год — 100 изображений и не содержит авторского текста.
উপরন্তু, এই হারিয়ে যাওয়া ছবিগুলির মধ্যে কিছু সদৃশ। সুতরাং, তাদের মধ্যে একটি একের মধ্যে 6 বার ঘটে প্রকাশন মাত্র 6টি ছবি দিয়ে। এছাড়াও, একটি ডোমেইন থেকে "Up.gif" ছবিটি 21 বার, "Down.gif" 16 বার এবং "Same.gif" 8 বার পুনরাবৃত্তি হয়েছে৷ এবং এই সব থেকে 45 ইমেজ একটি পোস্ট, যা মাত্র 47 টি ছবি রয়েছে।
191টি অনন্য <img> বাকি আছে।
2008
যেহেতু হাব্রে-তে প্রকাশনার সংখ্যা বছরে বছরে বেড়েছে, তাই 2008 সালে আমাদের গোয়েন্দা 2টি প্রকাশনার পাশাপাশি 520টি ছবি পর্যালোচনা করবে। আমরা লক্ষ্য করেছি যে এটি 2 সালে ছিল যে প্রকাশনাগুলিতে ছবির সংখ্যা অবশেষে প্রকাশনার সংখ্যাকে ছাড়িয়ে গেছে। তাছাড়া, শুধুমাত্র 969টি পোস্টে ছবি রয়েছে এবং সর্বাধিক 2008টি গ্রাফিক তথ্য প্রকাশনায় উপস্থাপিত হয়েছে "История праздничных логотипов Google1টি ছবি ইতিমধ্যে হ্যাব্রাস্টোরেজে সংরক্ষিত হয়েছে এবং 943টি হারিয়ে গেছে (34.6%).
একটি আকর্ষণীয় সত্য: সবচেয়ে অপ্রত্যাশিত চিত্র (বা বরং, প্রকাশনার নকশায় সমস্যা) অবস্থিত এখানে. ফলস্বরূপ, হাবর http://#/ এর মাধ্যমে ছবিটি ডাউনলোড করার চেষ্টা করে।
ভাত। 1. বিবেচিত সাধারণ পরিসংখ্যান
এটা অন্তত কিছু পুনরুদ্ধার করা সম্ভব?
Частичное восстановление не составляет особого труда. К примеру, самым "ленивым" способом будет использование ইন্টারনেট আর্কাইভ সংরক্ষিত প্রকাশনা পৃষ্ঠাগুলি লোড করার প্রয়াসে৷ এছাড়াও, আপনি সরাসরি লিঙ্কগুলি ব্যবহার করে সংরক্ষণাগারে ছবিগুলিকে "খোঁজ" করার চেষ্টা করতে পারেন।
জীবন হ্যাক: আপনাকে কেবলমাত্র প্রাচীন এবং নতুন নয়, সংরক্ষণাগারে থাকা পৃষ্ঠার সমস্ত সংস্করণে চিত্রগুলির উপস্থিতি পরীক্ষা করতে হবে৷
দুর্ভাগ্যবশত, যদিও এই পদ্ধতিটি কিছু ক্ষেত্রে কাজ করে, অন্তত অর্ধেক ছবি পুনরুদ্ধার করা এত কঠিন। অতএব, পরবর্তী ধাপ হল ক্রস-পোস্টিং, মূল অনুবাদ এবং অবশ্যই, মূল পৃষ্ঠাগুলির আর্কাইভাল কপি পরীক্ষা করা।
এছাড়াও, আপনি হাবরের একটি অনানুষ্ঠানিক আয়না ব্যবহার করে পছন্দসই চিত্রগুলি খুঁজে বের করার চেষ্টা করতে পারেন, যা একবার কাজ করেছিল এবং এখনও কিছু অনুলিপি করা তথ্য সংরক্ষণ করে।
শেষ এবং সবচেয়ে কঠিন বিকল্প হল সার্চ ইঞ্জিন ব্যবহার করা। যদি আপনি জানেন যে ছবিতে কী থাকা উচিত (একটি বিবরণ এবং প্রসঙ্গ রয়েছে), তবে একই নামের ফাইলগুলি খুঁজে পাওয়ার সুযোগ রয়েছে যদি সেগুলি একবার অন্য সংস্থানে কেউ অনুলিপি করে থাকে।
Естественно, каждый следующий шаг увеличивает время поиска нелинейно.
যা পাওয়া গেল
আপনি এখন পর্যন্ত পাওয়া ছবির সংখ্যা দেখে খুব বেশি প্রভাবিত নাও হতে পারেন - তাদের মধ্যে 300টি (140 জন লেখকের 81টি প্রকাশনায় রয়েছে)। যদি আমরা "ক্ষতি" (1) এর সংখ্যা বিবেচনা করি তবে ফলাফল প্রায় 24.2%. কেন সেখানে ছিল তুলনায় কম অনুপস্থিত ইমেজ আছে? সমস্ত অকেজো ছবি (যেমন ভিউ কাউন্টার) এবং অস্তিত্বহীন ছবি (যেমন ইতিমধ্যে উল্লিখিত http://#/, পাশাপাশি http://fig.jpg/ এবং তাই)।
আপনি কিভাবে একটি বৃত্তাকার সংখ্যা সঙ্গে আসা? বাস্তবতা হল যে প্রায় 300 দিনের অনুসন্ধান শেষ হয়েছে। প্রথমে, আমি 333-এ যেতে যাচ্ছিলাম, কিন্তু 300 বেশ ভাল দেখাচ্ছে। উপরন্তু, এই মুহূর্তে সম্পর্কে 33% সমস্ত "অনুসন্ধানের শিকার।"
ভাত। 2. বর্তমান অনুসন্ধান ফলাফল
Все найденные изображение (кроме одного .bmp, с ним было бы 301) загружены на hsto.org, এবং সেগুলির লিঙ্ক এবং প্রকাশনাগুলি, সেইসাথে সেগুলির মধ্যে থাকা চিত্রগুলির সূচীগুলি পরবর্তী বিভাগে দেওয়া হয়েছে৷
Результаты
Итак, под спойлером приведены успешно найденные изображения, а также id публикаций, индекс рисунка внутри текста публикации (начиная с 1, не с 0) и автор публикации. Если вы — автор упомянутой публикаций, а найденные рисунки корректны, исправьте, пожалуйста, свои посты. Спасибо!
যাইহোক, কিছু ছবি আসলে এখনও প্রকাশনাগুলিতে দেখার জন্য উপলব্ধ, কিন্তু Habrastorage-এ স্থানান্তর করা হয়নি, এবং সেইজন্য কিছু সময়ে সেগুলি অনুপলব্ধও হতে পারে।
সম্ভবত কেউ বিবেচনা করবে যে এই ধরনের পুরানো তথ্য পুনরুদ্ধার করার কোন মানে হয় না। আর তাছাড়া পাওয়া কিছু ছবি প্রকাশের সময়ও অর্থহীন ছিল। এটা নিঃসন্দেহে সত্য।
Любая информация важна. Как минимум, с точки зрения исторического анализа. Не говоря уже о том, что в некоторых авторских материалах она имеет ключевую роль. Да, на данный момент Хабру нет и 15 лет и некоторые из источников всё ещё доступны, но со временем их будет становиться всё меньше и меньше, а потому стоит задуматься заранее, останется ли что-то на потом, либо же будет вечное "изображение не доступно".
ঠিক আছে, ভুলে যাবেন না যে দুর্গম চিত্রগুলির জন্য স্থানধারকগুলি কেবল বিরক্তিকর। অবশ্যই, খুব কম লোকই "কিছু পুরানো জিনিস" পড়বে, তবে এমন লোক থাকবে। অতএব, যেহেতু এই প্রকাশনাগুলি এখনও Habré-এ উপলব্ধ, সেগুলির বিষয়বস্তু যতটা সম্ভব সম্পূর্ণ হওয়া উচিত।
দুর্ভাগ্যবশত, Habrastorage এখনও সমস্ত ইমেজ ফরম্যাটের জন্য সরাসরি ডাউনলোড সমর্থন করে না, তবে হয়তো এটি একদিন ঠিক করা হবে।
শেষ সমস্যাটি যা আমি উল্লেখ করতে চাই, এবং যেটি আপনি সম্ভবত ভেবেছিলেন, "লেখক যদি দীর্ঘদিন ধরে হাবর ব্যবহার না করেন এবং পুরানো জিনিসগুলি সংশোধন করতে আগ্রহী না হন তবে কী হবে?" এই প্রশ্নটি আমার মাথায় একাধিকবার উঠেছে, তবে এখানে সমাধানটি এত কঠিন নয়। পুরানো প্রকাশনা সবসময় সংশোধন করা যেতে পারে যু-এফ-ত্তউ মডারেটরদের মধ্যে (আপনি পারেন, এক্সোস্ফিয়ার?) বা প্রশাসন (বুমবুরাম কাউকে একটি কাজ দিতে পারেন)।
আপনি কি মনে করেন, অন্তত কিছু পুনরুদ্ধার করার চেষ্টা করা মূল্যবান?
আজ যে জন্য সব. আপনার মনোযোগের জন্য আপনাকে ধন্যবাদ এবং আপনার সমস্ত ছবি কোনো সমস্যা ছাড়াই Habrastorage এ আপলোড করা যেতে পারে! এটা যেন না হয়
দ্রষ্টব্য আপনি যদি টেক্সটে টাইপ বা ত্রুটি খুঁজে পান, দয়া করে আমাকে জানান। এটি পাঠ্যের অংশ নির্বাচন করে এবং "টিপে দিয়ে করা যেতে পারেCtrl / ⌘ + এন্টার করুন" যদি আপনার কাছে Ctrl / ⌘ থাকে, বা এর মাধ্যমে ব্যক্তিগত বার্তাসমূহ. উভয় বিকল্প উপলব্ধ না হলে, মন্তব্যে ত্রুটি সম্পর্কে লিখুন. ধন্যবাদ!
PPS সম্ভবত আপনি আমার অন্যান্য হাবর গবেষণায় আগ্রহী হবেন বা আপনি পরবর্তী প্রকাশনার জন্য আপনার নিজের বিষয়ের পরামর্শ দিতে চান, বা এমনকি প্রকাশনার একটি নতুন সিরিজও।
কোথায় তালিকা পাবেন এবং কিভাবে একটি প্রস্তাব তৈরি করতে হবে
সমস্ত তথ্য একটি বিশেষ ভান্ডারে পাওয়া যাবে হাবরা গোয়েন্দা. সেখানে আপনি কোন প্রস্তাবগুলি ইতিমধ্যে ঘোষণা করা হয়েছে এবং কোনটি ইতিমধ্যে কাজ চলছে তাও খুঁজে পেতে পারেন।
এছাড়াও, আপনি আমাকে উল্লেখ করতে পারেন (লেখার মাধ্যমে ভাস্কিভস্কিইয়েগবেষণা বা বিশ্লেষণের জন্য আপনার কাছে আকর্ষণীয় বলে মনে হচ্ছে এমন একটি প্রকাশনার মন্তব্যে।