نابغون

إيهاب إلياس وأول تقنية لتنظيف البيانات

إيهاب إلياس هو عالم حاسوب مصري، ولد في 13 مايو 1973 هو أستاذ في كلية تشيريتون لعلوم الكمبيوتر ورئيس أبحاث NSERC-Thomson Reuters حول جودة البيانات. تركز أبحاثه على البيانات الضخمة وأنظمة قواعد البيانات، مع اهتمام خاص بجودة البيانات وتكاملها، وإدارة البيانات غير المؤكدة، والتعلم الآلي لمعالجة البيانات، واستخراج المعلومات.
حصل إيهاب إلياس على درجة الدكتوراه في الفلسفة، وماجستير في العلوم، وبكالوريوس العلوم.. كما حصل على لقب زميل ACM لعام 2020 لمساهماته في تنظيف البيانات وتكاملها.. وعلى درجة الدكتوراه من جامعة بوردو في عام 2004. وانضم إلى كلية تشيريتون لعلوم الكمبيوتر كعضو هيئة تدريس في وقت لاحق من ذلك العام، وهو عضو أساسي في مجموعة أنظمة البيانات بالمدرسة.

مساهمات في تكنولوجيا قواعد البيانات

قدم  إيهاب إلياس مساهمات أساسية في تكنولوجيا قواعد البيانات، ولا سيما معالجة الاستعلامات المدركة للرتبة، وإدارة البيانات غير المؤكدة، وتنظيف البيانات. في وقت مبكر من حياته المهنية، كان رائدًا في فكرة معالجة الاستعلامات المدركة للرتبة، وتوفير عمليات فحص جديدة ومشغلي الانضمام الذين يقومون بتصنيف نتائج الاستعلام. واقترح إطار عمل فعال للتحسين قائم على التكلفة يدمج مشغلي المعالجة في محركات قواعد البيانات العلائقية.

جودة البيانات والتحديات التقنية

منذ عام 2009، ركز البروفيسور إيهاب إلياس على جودة البيانات والتحديات التقنية في بناء أنظمة تنظيف البيانات. قدمت مجموعته خوارزميات عملية جديدة ونماذج أولية للنظام. يتحايل هذا العمل على القيود المفروضة على حلول تنظيف البيانات السابقة التي إما ركزت بشكل ضيق على أنواع فردية من أخطاء البيانات أو تجاهلت ببساطة العديد من الاعتبارات الواقعية التي حالت دون اعتمادها.
إيهاب إلياس وأول تقنية لتنظيف البيانات
إيهاب إلياس وأول تقنية لتنظيف البيانات

أول نظام لتنظيف البيانات

إنشاء إيهاب إلياس نظام NADEEF، وهو أول نظام لتنظيف البيانات قابل للتوسعة ومفتوح المصدر يسمح للمستخدمين بالإعلان عن مجموعة غير متجانسة من قيود السلامة على الواجهة الخلفية التي تكتشف بشكل شامل وتقترح إصلاحات لانتهاكات البيانات. قدمت مجموعته أيضًا FastDC، وهي خوارزمية متطورة للتعدين من أجل قيود الرفض من البيانات القذرة وتلتقط معظم قواعد العمل في الممارسة العملية. قام مع زملائه، ثيودوروس ريكاتسيناس وكريستوفر ري، وطالب الدكتوراه السابق شو تشو، بتقديم HoloClean، وهو محرك استدلال إحصائي مفتوح المصدر لحساب البيانات وتنظيفها وإثرائها. يقوم HoloClean بتجميع كل من الإشارات الإحصائية والقيود التصريحية كميزات تعليمية، وقد أثبت تفوقه على جميع مقترحات إصلاح البيانات السابقة.
تم تسويق العمل ونشره في العديد من المؤسسات الكبيرة كدليل قوي على التأثير الواقعي.
نشر البروفيسور إيهاب إلياس مساهماته في المجلات الرائدة، بما في ذلك ACM Transactions on Database Systems، وVLDB Journal، وProceedings of the VLDB Endowment، وفي أهم مؤتمرات قواعد البيانات، بما في ذلك ACM SIGMOD، وVLDB، ومؤتمر IEEE الدولي حول هندسة البيانات. شارك في تأليف كتاب “تنظيف البيانات”، وهو كتاب ACM نُشر في يوليو 2019 والذي يعد بمثابة مرجع للباحثين والممارسين المهتمين بجودة البيانات وتنظيف البيانات. وقد شارك أيضًا في تأليف العديد من الدراسات الاستقصائية المؤثرة – دراسة استقصائية لـ top-k

مقالات ذات صلة

زر الذهاب إلى الأعلى