المساعد الشخصي الرقمي

مشاهدة النسخة كاملة : وكالة CIA تنقب في البيانات



holly_smoke
25-07-2001, 02:18 PM
وكالة CIA تنقب في البيانات
أداة تنقيب جديدة تستخدم أحدث التقنيات القادرة على التعامل مع الحجم الهائل للبيانات، لتحليل 1.2 مليون وثيقة حول العراق، تعود لعام 1979.
لمواجهة السيل العارم من المعلومات التي تردها يومياً، تستخدم وكالة المخابرات المركزية الأمريكية CIA، تقنية جديدة للتنقيب في البيانات، لكي تسهل البحث خلال هيئات المستندات المختلفة، مثل: النصوص المكتوبة على الورق، والنصوص الرقمية، والصور، والأشرطة الصوتية، التي ترد إليها بأكثر من 35 لغة.
وتركز إدارة العلوم والتقنية، التابعة للوكالة، على وضع حل للتحدي المتمثل في الحجم الكبير من المعلومات. وقال لاري فيرتشايلد، أحد المديرين المسؤولين، في مقابلة أجريت معه في أحد أقبية الوكالة: "المسألة ليست في أننا ننمو بمعدل مرتفع، بل في أن كمية المعلومات التي ترد لهذه الوكالة، تزداد بقفزات هائلة. والتحدي الذي نواجهه هو: كيف نقدم الحلول التقنية الملائمة، التي تساعد زملائنا على التعامل مع الزيادة الكبيرة في البيانات، التي يتعين عليهم التعامل معها؟" وأضاف قائلاً:
"ومن الأدوات التي نجحنا في تطويرها، أداة الكمبيوتر Oasis، القادرة على تحويل الإشارات الصوتية الناتجة عن بث تلفزيوني، أو إذاعي، إلى نص مكتوب. وتستطيع Oasis أن تميز الكلام الملفوظ بنبرات مختلفة من اللغة الإنجليزية، وذلك للحصول على مستوى أعلى من الدقة، عند كتابة النسخة الجديدة، بغض النظر عما إن كان المتحدث رجلاً، أو امرأة، وعن اختلاف الصوت بين المتحدثين، ذكوراً كانوا، أم إناثاً.
وتجد على يسار الشاشة المدون عليها النص المكتوب، علامات مثل "رجل رقم 1"، "امرأة رقم 1"، "رجل رقم 2"، ...، إلى جانب كل جملة مكتوبة.
وعند إعطاء علامة باسم معين، لصوت من الأصوات، يضع الكمبيوتر ذلك الاسم وتلك العلامة، منذ الآن فصاعداً، على أي تسجيل آخر يظهر فيه ذلك الصوت. فإذا كتبت نسخة لأي نص بصوت شخص متهم بالإرهاب، تصنفه وكالة المخابرات المركزية على أنه شديد الخطورة، فسيتعرف الكمبيوتر على صوته، وسيضع عليه علامة تلقائياً، في كل مرة يصادف فيها صوته. وإذا كانت الترجمة الآلية متعطلة، يمكن للمستخدم الاستماع للنص المذاع، بنقرة واحة على الماوس.
ويستطيع الكمبيوتر أن يخفض، وبكفاءة عالية، الوقت اللازم لنسخ النصوص المذاعة. ويحتاج الشخص العادي، مثلاً، لحوالي 90 دقيقة لكتابة نص مذاع مدته نصف ساعة، بينما يتمكن الكمبيوتر من القيام بذلك في عشر دقائق، فقط، حسبما قال موظف في الوكالة قام بتنفيذ عرض لهذه الأداة.
وتخطط وكالة CIA لتطوير Oasis لكي تتمكن من التعامل مع عدد من اللغات الأخرى، مثل العربية، والصينية. وتستخدم خدمة معلومات البث الأجنبي Foreign Broadcast Information Service، في وكالة المخابرات المركزية، هذه الأداة في إحدى المدن الآسيوية، وتعتزم تطبيقها هذا العام، في مناطق أخرى، مثل الشرق الأوسط.
ومن الأدوات الأخرى التي تستخدمها الوكالة، أداة Fluent، التي تتيح تنفيذ الأبحاث، في المستندات المكتوبة بلغة لا يفهمها المستخدم، بحيث يمكن أن يكتب كلمات البحث باللغة الإنجليزية في حقل البحث، ويتم بعدها ترجمة المستندات المكتوبة بلغات أخرى، مثل اللغة الروسية.
وطورت تلك الأدوات لمساعدة ضباط وكالة CIA، العاملين على تحليل "الملف العراقي"، والذين طلب منهم تحليل ما يقرب من 1.2 مليون وثيقة، تعود إلى العام 1979. واستطاعت أداة تنقيب المعلومات استخلاص، وفهرسة، جميع الكلمات الموجودة في تلك البيانات، بحيث يتمكن الباحثون إن سئلوا، عن استخدام العراق مادة آنثراكس، مثلاً، أن يفتحوا أداة البحث، وأن يبحثوا عن آنثراكس، في الفهرس الناتج تلقائياً.
وتحسب تلك الأداة أيضاً، عدد مرات تكرار استخدام الكلمات، ويمكنها التعامل مع مختلف طرق كتابة الأسماء، أو المواقع، العراقية ذاتها. وأشار فيرتشايلد أيضاً، إلى وجود تقنية تُسمى gifting technology، تستطيع أن تلخص في فقرة موجزة المعلومات الأساسية الموجودة في وثيقة معينة.