مصادر البيانات الكبيرة في الطب

مصادر البيانات الكبيرة في الطب

التعريف البسيط للبيانات الضخمة في الطب هو "مجموع البيانات المتعلقة بالرعاية الصحية للمرضى والرفاه" (Raghupathi 2014). ولكن ما هي بالضبط هذه الأنواع من البيانات ، ومن أين أتت؟

فيما يلي عرض عام لأنواع ومصادر البيانات الكبيرة التي تهم مقدمي الرعاية الصحية والباحثين والدافعين وصانعي السياسات والصناعة.

هذه الفئات ليست حصرية ، لأن نفس البيانات يمكن أن تنشأ من مجموعة متنوعة من المصادر.

كما أن هذه القائمة ليست شاملة ، لأن التطبيق العملي لتحليلات البيانات الضخمة سيستمر بالتأكيد في التوسع.

نظم المعلومات السريرية

هذه هي المصادر التقليدية للبيانات السريرية التي اعتاد مقدمو الرعاية الصحية على مشاهدتها.

مطالبات البيانات من دافعي

لدى الجهات العامة (مثل Medicare) والدافعين الخاصين مستودعات كبيرة لبيانات المطالبات الخاصة بالمستفيدين. توفر بعض شركات التأمين الصحي الآن حوافز لمشاركة بياناتك الصحية.

دراسات بحثية

تحتوي قواعد بيانات البحث على معلومات حول المشاركين في الدراسة ، والعلاجات التجريبية ، والنتائج السريرية. عادة ما يتم تمويل دراسات كبيرة من قبل شركات الأدوية أو الوكالات الحكومية. تطبيق الطب الشخصي هو لمطابقة المرضى الأفراد مع العلاجات الفعالة ، استنادا إلى أنماط في بيانات التجارب السريرية.

يتخطى هذا النهج تطبيق مبادئ الطب القائم على الأدلة ، والتي يحدد من خلالها مقدم الرعاية الصحية ما إذا كان المريض يشترك في خصائص واسعة (مثل العمر والجنس والعرق والحالة السريرية) مع المشاركين في التجربة. باستخدام تحليلات البيانات الضخمة ، من الممكن اختيار علاج يعتمد على معلومات أكثر دقة ، مثل المظهر الوراثي لسرطان المريض (انظر أدناه).

كما أن أنظمة دعم القرار السريري (CDSS) تتطور بسرعة وتمثل الآن جزءًا كبيرًا من الذكاء الاصطناعي (AI) في الطب.

يستخدمون بيانات المرضى لمساعدة الأطباء في اتخاذ قراراتهم وغالبًا ما يتم دمجهم مع EHR.

قواعد البيانات الجينية

يستمر مستودع المعلومات الوراثية البشرية في التراكم بوتيرة سريعة. منذ اكتمال مشروع الجينوم البشري في عام 2003 ، تم تخفيض تكلفة تسلسل الحمض النووي البشري بمليون مرة. يسعى مشروع الجينوم الشخصي (PGP) ، الذي أطلقته كلية هارفارد الطبية عام 2005 ، إلى تتابع ونشر الجينوم الكامل لـ 100،000 متطوع من جميع أنحاء العالم. يُعد PGP نفسه مثالًا رئيسيًا على مشروع البيانات الضخمة نظرًا للحجم الهائل وتنوع البيانات.

يحتوي الجينوم الشخصي على حوالي 100 غيغابايت من البيانات. بالإضافة إلى تسلسل الجينوم ، يقوم PGP أيضًا بجمع البيانات من EHRs ، والدراسات الاستقصائية ، وملامح الميكروبيوم.

يقدم عدد من الشركات تسلسلًا جينيًا مباشرًا للمستهلك للصحة والسمات الشخصية وعلم الوراثة الدوائي على أساس تجاري.

يمكن إخضاع هذه المعلومات الشخصية لتحليلات البيانات الكبيرة. على سبيل المثال ، توقفت 23andMe عن تقديم تقارير وراثية ذات صلة بالصحة إلى عملاء جدد اعتبارًا من 22 نوفمبر 2013 ، للتوافق مع إدارة الغذاء والدواء الأمريكية. ومع ذلك ، في عام 2015 ، بدأت الشركة في تقديم بعض المكونات الصحية من اختبار اللعاب الجيني مرة أخرى ، وهذه المرة بموافقة إدارة الأغذية والعقاقير.

السجلات العامة

تحتفظ الحكومة بسجلات مفصلة للأحداث المتعلقة بالصحة ، مثل الهجرة والزواج والولادة والموت. جمع التعداد الأميركي كميات هائلة من المعلومات كل 10 سنوات منذ عام 1790. كان موقع إحصاء التعداد على الإنترنت يحتوي على 370 مليار خلية في عام 2013 ، مع ما يقرب من 11 مليار سنة إضافية.

عمليات بحث الويب

يمكن أن توفر معلومات بحث الويب التي جمعتها Google ومقدمو بحث الويب الآخرون إحصاءات في الوقت الفعلي تتعلق بصحة السكان. ومع ذلك ، يمكن تحسين قيمة البيانات الضخمة من أنماط بحث الويب من خلال دمجها مع المصادر التقليدية للبيانات الصحية.

وسائل الاعلام الاجتماعية

تولد فيسبوك وتويتر وغيرها من وسائل الإعلام الاجتماعية مجموعة غنية من البيانات على مدار الساعة ، وتعطي نظرة إلى المواقع ، والسلوكيات الصحية ، والعواطف ، والتفاعلات الاجتماعية للمستخدمين. وقد تمت الإشارة إلى تطبيق البيانات الضخمة على الشبكات الاجتماعية على الصحة العامة على أنها الكشف عن الأمراض الرقمية أو الوبائيات الرقمية. على سبيل المثال ، تم استخدام تويتر لتحليل أوبئة الأنفلونزا بين عامة السكان.

مشروع الرفاه العالمي الذي بدأ في جامعة بنسلفانيا هو مثال آخر على دراسة وسائل الإعلام الاجتماعية لفهم تجربة الناس وصحتهم بشكل أفضل. يجمع المشروع بين علماء النفس والإحصائيين وعلماء الكمبيوتر الذين يقومون بتحليل اللغة المستخدمة عند التفاعل عبر الإنترنت ، على سبيل المثال ، عند كتابة تحديثات الحالة على Facebook و Twitter. يلاحظ العلماء كيف ترتبط لغة المستخدمين بصحتهم وسعادتهم. تساعد التطورات في معالجة اللغات الطبيعية والتعلم الآلي في مساعيهما. بحث منشور حديث من جامعة بنسلفانيا في طرق التنبؤ بالمرض العقلي من خلال تحليل وسائل الإعلام الاجتماعية. يبدو أن أعراض الاكتئاب وغيرها من حالات الصحة العقلية يمكن اكتشافها من خلال دراسة استخدامنا للإنترنت. يأمل العلماء في المستقبل أن تكون هذه الطرق قادرة على تحديد ومساعدة الأفراد المعرضين للخطر بشكل أفضل.

إنترنت الأشياء (IoT)

كما يتم جمع كميات هائلة من المعلومات المتعلقة بالصحة وتخزينها على الأجهزة المتنقلة والأجهزة المنزلية .

المعاملات المالية

يتم تضمين معاملات بطاقات الائتمان الخاصة بالمرضى في النماذج التنبؤية المستخدمة من قبل نظام كاروليناس للرعاية الصحية لتحديد المرضى المعرضين لخطورة عالية لإعادة إدخالهم إلى المستشفى. يستخدم مقدم الرعاية الصحية في شارلوت بيانات كبيرة لتقسيم المرضى إلى مجموعات مختلفة ، على سبيل المثال ، بناءً على المرض والموقع الجغرافي.

الآثار الأخلاقية والخصوصية

يجب التأكيد على أنه ، في بعض الحالات ، قد تكون هناك آثار أخلاقية مهمة على الخصوصية عند جمع البيانات والوصول إليها في مجال الرعاية الصحية. يمكن لمصادر البيانات الكبيرة الجديدة أن تحسن فهمنا لما يؤثر على صحة الأفراد والسكان ، ومع ذلك ، فإن المخاطر المختلفة تحتاج إلى دراسة ومراقبة دقيقة. وقد تم الآن الاعتراف أيضًا بأن البيانات التي سبق أن تم اعتبارها مجهولة الهوية ، يمكن إعادة تحديدها. على سبيل المثال ، قام البروفسور لاتانيا سويني من مختبر خصوصية بيانات هارفارد بمراجعة 1،130 متطوعًا مشاركًا في مشروع الجينوم الشخصي. تمكنت هي وفريقها من تسمية 42٪ من المشاركين بشكل صحيح استنادًا إلى المعلومات التي شاركوها (الرمز البريدي وتاريخ الميلاد والجنس). يمكن أن تزيد هذه المعرفة من وعينا بالمخاطر المحتملة وتساعدنا في اتخاذ قرارات أفضل بشأن مشاركة البيانات.

> المصادر:

> Conway M ، O'Connor D. وسائل الاعلام الاجتماعية ، والبيانات الكبيرة ، والصحة النفسية: التقدم الحالي والآثار الأخلاقية. الرأي الحالي في علم النفس 2016 ؛ 9: 77-82.

> Fernandes L، O'Connor M، Weaver V. Big data، bigger results. Journal of The American Health Information Management Association 2012؛ 83 (10): 38-43

> Guntuku S، Yaden D، Kern M، Ungar L، Eichstaedt J. Detecting depression and mental illness on social media: an integrative review . الرأي الحالي في العلوم السلوكية 2017 ؛ 18: 43-49.

> Lazer D، Kennedy R، King G، Vespignani A. The Parable of Google Flu: Traps in Big Data Analysis . العلوم 2014 ؛ 343 (6176): 1203-1205.

> Raghupathi W، Raghupathi V. تحليلات البيانات الكبيرة في الرعاية الصحية: الوعد و potenti al. علوم ونظم المعلومات الصحية 2014 ؛ 2: 3.

> سويني ، وأبو ، و. ج. تحديد المشاركين في مشروع الجينوم الشخصي بالاسم . جامعة هارفرد. مختبر الخصوصية للبيانات ورقة بيضاء 1021-1. 24 أبريل 2013.