المساعد الشخصي الرقمي

مشاهدة النسخة كاملة : ما وراء ال reCAPTCHA ...ماهي حقيقتها



J O K E R
06-06-2013, 09:38 PM
السلام عليكم ..




reCAPTCHA (http://www.google.com/recaptcha)



جميعنا يضطر دوما لملئ حقل الreCAPTCHA اثناء خطأ في التسجيل او ليحصل على وصلات تحميل او للدخول إلى بريده ....الخ
الشيء المشترك هو اننا جميعا نراها مزعجة وخاصة عندما تكون الصورة غير واضحة او معقدة :28:

لكن هل سأل أحدنا نفسه ..ماهي ReCAPTCHA ومالهدف الحقيقي من وراء هذا التعقيد... كان يمكن اختصار الموضوع
بعملية جمع ونحن نكتب النتيجة أو باعادة نسخ المكتوب بالصورة داخل الحقل.
حقيقةً الهدف من ورائها هو التأكد من أن من يملأ الحقل هو انسان وليس عبارة عن برنامج مصمم لملئ وارسال البيانات ملايين المرات، وهذه التقنية فعّالة لأن البشر
ممن لا يعانون مشاكل في الرؤية لا يواجهون أي مشكلة في قراءة تلك الحروف والأرقام العشوائية المشوهة بينما البرامج لا تستطيع … إلى الآن.

هذه التقنية يستخدمها مدراء المواقع لمنع المخربين من كتابة برنامج يقوم بالتسجيل لعدد كبير من المستخدمين وتخريب قاعدة بيانات المستخدمين
أو لمنع تخريب وصلات التحميل واستهلاكها. مشروع الـ reCAPTCHA هو تطوير لمشروع سابق اسمه CAPTCHA الذي بدأ في بدايات
الألفية الثانية ثم تحول الى شركة مستقلة ، حيث اشترتها شركة جوجل منذ حوالي العام ونصف العام.



http://i.imgur.com/6yfCCLi.png





الآن سأحدثكم عن ما وراء الreCAPTCHAانطلاقا من الحقائق التالية :
تقريباً 200 مليون (CAPTCHA) تقرأ و تطبع يومياً من قبل أناس مختلفين حول العالم . حيث كان رأي Luis von Ahn (http://en.wikipedia.org/wiki/Luis_von_Ahn) مخترع هذه التقنية هو التالي

"عندما سمعت ذلك في البداية … شعرت بالفخر لمدى تأثير اختراعي على العالم ومن ثم شعرت بالسوء … فكل مرة تقرأ وتطبع (CAPTCHA) فأنت تضيع 10 ثواني من وقتك
وبضربها بـ 200 مليون ، فالبشرية تهدر (500,000) ساعة يومياً في طباعة تلك الـ (CAPTCHA) المزعجة. عندها زاد شعوري بالسوء وفكرت ، بالطبع لا يمكننا التخلص
من الـ (CAPTCHA) ببساطة ، فأمن الإنترنت بات يعتمد عليها... عندها فكرت … هل هناك من طريقة للإستفادة من ذلك المجهود المهدور ؟"

الواقع أنه أثناء قراءة وطباعة الـ (CAPTCHA) فإن الدماغ البشري يقوم بشيء مذهل ، لم تتمكن الحواسب من القيام به بعد ، لذا يمكننا استغلال تلك الثواني العشر.
بكلمات اخرى , تم استغلال خوارزمية التقسيم او مايعرف بفرق تسد وتطبيق مبدأها حيث يمكننا تقسيم مشكلة ما الى أجزاء مكونة من 10 ثواني وكلما قام أحدهم بحلّ الـ (CAPTCHA)
يحلّ جزء من هذه المشكلة والتي حددت بتحويل الكتب من النسخة الورقية إلى الرقمية .


وهذا ما نفعله اليوم ، فعندما تقوم بطباعة الـ (CAPTCHA) , أنت لا تعرّف نفسك كإنسان وحسب ، بل تقوم بالمساعدة في تحويل الكتب إلى نسخ رقمية (Digitize Books) .
واليكم الطريقة :


1- هناك محاولات كثيرة لتحويل الكتب الى تسخ رقمية ، (google) لديها أرشيف الإنترنت (internet archive)
كذلك أمازون لدعم جهاز الكيندل (Kindle) وهو لقراءة الكتب الإلكترونية.
2- تكون البداية بالكتاب الورقي ، نقوم بمسحه و تحويل الصفحات الى صور رقمية.
3- يقوم بعدها الحاسب بفك تشفير الصور (قراءة الكلمات وتحويلها الى نصوص ، تعرف تلك العملية بالـ (OCR – Optical Character Recognition)
أي التعرف البصري على الحروف.
4- مشكلة الـ OCR أنها ليست مثالية وخاصةً في حال كانت الكتب قديمة وصفحاتها مصفّرة وحبرها باهت ، فلا يمكن التعرف على كثير من الكلمات قد تصل الى 30%
ان كانت الكتب أقدم من 50 عاماً.
5- ما نفعله اليوم هو أننا نأخد الكلمات التي لم يتمكن الحاسب من التعرف عليها ونطلب من الناس قراءتها بينما يقومون بطباعة الـ (CAPTCHA) .


إذاً في المرة القادمة عندما تطبع الـ (CAPTCHA) اعرف أن تلك كلمات قادمة من كتب يتم تحويلها الى نسخ رقمية ولم يتمكن الحاسب من التعرف عليها .:33:
وسبب وجود كلمتين اليوم بدلاً من واحدة هو أن احداها كلمة جديدة من الكتاب و غير معروفة و لا يمكن للحاسب التأكد من أن جوابك صحيح أم خاطئ ، والثانية كلمة معروفة يتم تقييم جوابك عليها
ولا يتم اعلامك أيهما جديدة وأيهما معروفة وعليك طباعة كلتا الكلمتين. وعند كتابتك الكلمتين يتم التأكد من أنك إنسان مما يمنح بعض المصداقية لماهية الكلمة الثانية.

وتتكرر العملية مع 10 أشخاص مختلفين ، وعند الإجماع على الكلمة الجديدة تضاف الكلمة ككلمة جديدة تم التعرف عليها بشكل صحيح. ومنذ بدء المشروع من 3 أو 4 سنوات
تحوّل عدد كبير من المواقع من استخدام الـ (CAPTCHA) القديمة المضيّعة للوقت إلى الـ (reCAPTCHA) الجديدة التي تساعد على ترقيم الكتب
، منها Google, Facebook, Twitter و 350,000 موقع آخر مما ينتج عدد كبير جداً جداً من الكلمات التي تطبع يومياً , وهو حوالي (100,000,000) مئة مليون كلمة يوميا ً
أي ما يوازي تقريباً مليونين ونصف كتاب سنوياً.

عدد المشاركين في عملية تحويل الكتب الى نسخ رقمية هو (750,000,000) سبعمائة وخمسين مليون شخص أي 10% من عدد سكان الأرض.
ولو لاحظنا فعلاً أن أكبر منجزات البشرية الضخمة مثل بناء الإهرامات أو قناة السويس أو قناة بنما أو الصعود الى القمر ، تم انجازها بجهود نفس العدد من الناس (حوالي 100,000) .
وذلك لأنه وقبل عصر الإنترنت لإستحالة إدارة وتمويل عدد اكبر من ذلك عملياً . والمثير هو أننا تمكنّا من جمع جهود (750,000,000) سبعمائة وخمسين مليون شخص عبر الإنترنت ،
والسؤال الذي يطرح نفسه … لو تمكنّا من ارسال الإنسان الى القمر بجهود مئة الف شخص ، ما الذي يمكننا فعله بجهود (750,000,000) سبعمائة وخمسين مليون شخص ؟ :jap006:


هذا المقال كغيره من المواضيع التي قمت باضافتها مؤخرا وهي من كتابتي وحصرية لموقع المنتدى.

المراجع
wikipedia (http://en.wikipedia.org/wiki/Luis_von_Ahn) بالاضافة لمجلة الرقميات (http://www.alrakameiat.com/) و محاضرته الموجودة على موقع TED ويمكن تحميل الفيديو مترجما إلى عدة لغات من هنا (http://www.ted.com/talks/luis_von_ahn_massive_scale_online_collaboration.html)


لاتنسونا من الدعاء :ds015:

.corealia.
06-06-2013, 10:57 PM
لأول مره بعرف هالمعلومات :bigeyes:
مشكووور جوكر على المعلومة الجديدة والله يوفقك :biggthump

Iris
07-06-2013, 12:31 AM
معلومات نايس,
سو هذه الطريقه هي للحمايه + تفيد,
الطريقه نايس مثل ماقلت للتغلب على الروبوتات الي تسجل عشوائيا في المواقع بالنت وتخرب,
او لحماية الايميل او الحسابات من تكرار الدخول لكلمة السر مثل البرامج التي تجرب باكثر من كلمه,
فهذه الطريقه نايس لتقليل هذه الظاهر والتاكد من ان المستخدم انسان,
لكن معلومه جديده بالنسبه لي ان هذه الكلمات تساهم عمل كتب,

شكرا لمشاركتنا الموضوع,

_Oni_
07-06-2013, 11:07 AM
معلومات مفيدة وجديدة جوكر ..سبحان الله كيف يستثمروا كل لحظة بحياة الانسان
شكرا لك على مواضيعك والمقال الجميل والله يوفقك :smile2:

J O K E R
07-06-2013, 01:26 PM
_Oni_ (http://www.montada.com/member.php?u=205342), Iris (http://www.montada.com/member.php?u=597860), .corealia. (http://www.montada.com/member.php?u=314511) العفوو ولو .. منورين الموضوع
بالفعل هي طريقة رائعة لاستثمار الوقت والجهد لأهداف نبيلة :)

Oneaxz
07-06-2013, 04:31 PM
و عليكم السلام و رحمة الله و بركاته ,

الري كابتشا طريقة حماية مجدية خصوصا من الـWeb Bot التي تعيث خرابًا في المواقع و المنتديات
تقوم بنشر مجموعة من مواضيع و روابط السبام لتخريب المنتدى .. اعتبر هذه المعضلة ان لم تقي نفسك منها بالري كابتشا بمثابة السرطان الذي ينتشر في سائر الجسد و ما من دواء له سوى البتر !

اشكرك أخي الكريم على مجموعة المعلومات المفيدة و التي لم اعرف بعضها الا الآن ^^
واصل و بلا فواصل :)

J O K E R
07-06-2013, 11:16 PM
تماما Oneaxz كما تفضلت بالضبط .. دائما اضافاتك بمكانها وتثري الموضوع
سعيد جدا بمشاركاتك الدائمة والقيمة ومنور الموضوع كعادتك :)

*dark dragon*
08-06-2013, 05:15 AM
مشكووور أخي جوكر على المعلومات القيمة والجديدة كليا ومبرووك الرقابة :wink2:
تستاهل يا غالي :cool:

Mohammed
08-06-2013, 10:01 AM
وعليكم السلام ورحمة الله وبركاته

موضوعك جميل وقيم أخي جوكر
مشكله الكابتشا التي أعاني منها دائماً هي الكلمات غير المفهومة والتي تواجهني في كثير من الأحيان
http://4.bp.blogspot.com/-iW__RH72Ysk/TbfuhDeSxCI/AAAAAAAAAzM/HmmhAyXb1NY/s400/BadCaptcha2.png
اغلب المستخدمين يشكون منها ويدعون للتخلص منها أو لإستبدالها لشيء أسهل (http://areyouahuman.com/)

فكرة المساعدة في تحويل الكتب لصيغ رقمية جديد علي، شكراً على المعلومة
http://i.stack.imgur.com/pocCC.png

J O K E R
08-06-2013, 10:38 AM
العفو أخي dark dragon و الله يبارك فيك ..نورت الموضوع
ولاتنسانا من الدعاء :smile2:
----------------------------------------------------------------

تماما أخي محمد مثل ماتفضلت ..أحيانا نعيد كتابة الكابتشا أكثر من مرة وأحيانا تظهر كابتشا تعجيزية
وبالفعل أنا قبل ما اعرف هالمعلومة كنت أقول أنه ليش التمسك بهالطريقة ...ممكن تكون اكمال نص او اجراء عملية حسابية
لكن فيما بعد تبين السبب والصورة التي ارفقتها معبرة جدا.. الكلمات التي لم يتم تمييزها بال OCR تم اخذ سناب لها وتطبيق تقنية الكابتشا عليها
تشكر على مرورك و مشاركتك القيمة :ds015:

جوتيي
15-06-2013, 12:25 PM
مشكوووور أخي J O K E R على الموضوع القيم وجزاك الله كل خير