السلام عليكم ورحمة الله وبركاته ...
كنت قد تلقيت دعوة من قبل شركة datability لحضور حدث EDMC 08 في بداية الشهر الماضي.
كان من أبرز المتحدثين في هذا الحدث السيد Larry English الذي امتعنا بحديثه الجميل و الشيق عن جودة البيانات Data Quality.
و بالمناسبة السيد English هو مؤلف كتاب : Improving Data Warehouse and Business Information Quality: Methods for Reducing Costs and Increasing Profits و الذي وزع مجاناً للحضور.
حقيقة استمتعت بقراءة الكتاب و الأمثلة الرائعة التي أوردنا السيد English في كتابه.
و سأذكر أحد هذه الأمثلة الواقعية التي أوردها و كيف انها تبين لنا أهمية البيانات المدخلة في أي نظام.
فمن المعروف أن استخدام اي نظام يولد لنا بيانات عبر الوقت في قاعدة البيانات، و ذلك يعتمد على النظام نفسه. و لكن البيانات هنا بيانات من الممكن أن تكون ليست بذات معنى. و لكن من الممكن أن تؤثر في طبيعة العمل لو طبقنا الـ Data Mining على هذه البيانات.
و لكن عندما تكون البيانات الأصلية، غير صحيحة أو غير دقيقة، فهنا لو طبقت الـ Data Mining سأخرج بمعلومات غير دقيقة عن طبيقة البيانات و لربما اتخذت قرارات خاطئة بناء عليها.
مثل و مع المثال يتضح المقال، فكما أورد السيد English في كتابة مثال عن شركة تأمين طبية، وجدو بعد سنوات أن تقريباً 70% من المطالبات الطبية هو بسبب كسر في القدم.
طبعاً هذه النسبة غير منطقية على الإطلاق، فكيف أن 70% من المرضى مكسوري الأقدام؟
و بعد البحث و التقصى اكتشفوا ان الخلل يكمن أنه في حقل"المشكلة" في النظام المستخدم كانت القيمة الافتراضية هي "كسر في القدم"!!!
طبعاً كثير من مستخدمي النظام بسبب الرغبة في سرعة ملئ النموذج كانو يدعون حقل المشكلة بالشكل الافتراضي. و هذا طبعاً فوت على شركة التأمين فرصة معرفة أكثر المشاكل المسجلة من قبلهم و اتخاذ قرار على ضوئها.
طبعاً هذا كان مثال واحد من أمثلة كثيرة، لذلك يجب على مطور النظام ترك القيمة الافتراضية خالية ليجبر الموظفين على ملئها، و طبعاً لابد من نوع من التوعية لدى الموظفين لأدراك أهمية الأمر.
و أنا متأكد أن كل منا قد صادف مشكلة تتعلق بالـ Data Quality في أحدى المنشئات التي عمل بها.
مع تحياتي ... طلال السبيعي.