مصادر البيانات الكبيرة في الطب

by كيفن هوانج ، دكتوراه في الطب ، ميل بالساعة راجعه Richard N. Fogoros، MD

التعريف البسيط للبيانات الضخمة في الطب هو "مجموع البيانات المتعلقة بالرعاية الصحية للمرضى والرفاه" (Raghupathi 2014). ولكن ما هي بالضبط هذه الأنواع من البيانات ، ومن أين أتت؟

فيما يلي عرض عام لأنواع ومصادر البيانات الكبيرة التي تهم مقدمي الرعاية الصحية والباحثين والدافعين وصانعي السياسات والصناعة.

هذه الفئات ليست حصرية ، لأن نفس البيانات يمكن أن تنشأ من مجموعة متنوعة من المصادر.

كما أن هذه القائمة ليست شاملة ، لأن التطبيق العملي لتحليلات البيانات الضخمة سيستمر بالتأكيد في التوسع.

نظم المعلومات السريرية

هذه هي المصادر التقليدية للبيانات السريرية التي اعتاد مقدمو الرعاية الصحية على مشاهدتها.

تقوم السجلات الصحية الإلكترونية (EHR) بجمع وتخزين وعرض المعلومات مثل المعلومات السكانية والتاريخ الطبي السابق والمشكلات الطبية النشطة والتحصينات والحساسية والأدوية والعلامات الحيوية والنتائج من اختبارات المختبر والأشعة وتقارير علم الأمراض وملاحظات التقدم التي تم إنشاؤها بواسطة الرعاية الصحية مقدمي الخدمات ، والمستندات الإدارية والمالية
السجلات الطبية الإلكترونية (EMRs) ليست متطابقة مع EHRs وعادة ما تتعلق بالبيانات المخزنة مع طبيب معين.
تبادل المعلومات الصحية بمثابة محاور بين أنظمة المعلومات السريرية المتباينة

سجلات المرضى ، التي تحتفظ بها منظمات الرعاية الصحية على مرضاهم ، ترتبط في كثير من الأحيان إلى EHR. السجلات الأخرى تتبع التحصينات ، السرطان ، الصدمات ، وغيرها من قضايا الصحة العامة على نطاق جغرافي أوسع.

تسمح بوابات المرضى للمرضى بالوصول إلى المعلومات الصحية الشخصية المخزنة في EHR لمنظمة الرعاية الصحية. كما تسمح بعض بوابات المرضى للمستخدمين بطلب إعادة تعبئة الوصفات الطبية وتبادل الرسائل الإلكترونية الآمنة مع فريق الرعاية الصحية.

تقوم مستودعات البيانات الإكلينيكية بتجميع البيانات على مستوى المريض من أنظمة معلومات سريرية متعددة ، مثل EHRs والمصادر الأخرى المذكورة أعلاه

مطالبات البيانات من دافعي

لدى الجهات العامة (مثل Medicare) والدافعين الخاصين مستودعات كبيرة لبيانات المطالبات الخاصة بالمستفيدين. توفر بعض شركات التأمين الصحي الآن حوافز لمشاركة بياناتك الصحية.

دراسات بحثية

تحتوي قواعد بيانات البحث على معلومات حول المشاركين في الدراسة ، والعلاجات التجريبية ، والنتائج السريرية. عادة ما يتم تمويل دراسات كبيرة من قبل شركات الأدوية أو الوكالات الحكومية. تطبيق الطب الشخصي هو لمطابقة المرضى الأفراد مع العلاجات الفعالة ، استنادا إلى أنماط في بيانات التجارب السريرية.

يتخطى هذا النهج تطبيق مبادئ الطب القائم على الأدلة ، والتي يحدد من خلالها مقدم الرعاية الصحية ما إذا كان المريض يشترك في خصائص واسعة (مثل العمر والجنس والعرق والحالة السريرية) مع المشاركين في التجربة. باستخدام تحليلات البيانات الضخمة ، من الممكن اختيار علاج يعتمد على معلومات أكثر دقة ، مثل المظهر الوراثي لسرطان المريض (انظر أدناه).

كما أن أنظمة دعم القرار السريري (CDSS) تتطور بسرعة وتمثل الآن جزءًا كبيرًا من الذكاء الاصطناعي (AI) في الطب.

يستخدمون بيانات المرضى لمساعدة الأطباء في اتخاذ قراراتهم وغالبًا ما يتم دمجهم مع EHR.

قواعد البيانات الجينية

يستمر مستودع المعلومات الوراثية البشرية في التراكم بوتيرة سريعة. منذ اكتمال مشروع الجينوم البشري في عام 2003 ، تم تخفيض تكلفة تسلسل الحمض النووي البشري بمليون مرة. يسعى مشروع الجينوم الشخصي (PGP) ، الذي أطلقته كلية هارفارد الطبية عام 2005 ، إلى تتابع ونشر الجينوم الكامل لـ 100،000 متطوع من جميع أنحاء العالم. يُعد PGP نفسه مثالًا رئيسيًا على مشروع البيانات الضخمة نظرًا للحجم الهائل وتنوع البيانات.

يحتوي الجينوم الشخصي على حوالي 100 غيغابايت من البيانات. بالإضافة إلى تسلسل الجينوم ، يقوم PGP أيضًا بجمع البيانات من EHRs ، والدراسات الاستقصائية ، وملامح الميكروبيوم.

يقدم عدد من الشركات تسلسلًا جينيًا مباشرًا للمستهلك للصحة والسمات الشخصية وعلم الوراثة الدوائي على أساس تجاري.

يمكن إخضاع هذه المعلومات الشخصية لتحليلات البيانات الكبيرة. على سبيل المثال ، توقفت 23andMe عن تقديم تقارير وراثية ذات صلة بالصحة إلى عملاء جدد اعتبارًا من 22 نوفمبر 2013 ، للتوافق مع إدارة الغذاء والدواء الأمريكية. ومع ذلك ، في عام 2015 ، بدأت الشركة في تقديم بعض المكونات الصحية من اختبار اللعاب الجيني مرة أخرى ، وهذه المرة بموافقة إدارة الأغذية والعقاقير.

السجلات العامة

تحتفظ الحكومة بسجلات مفصلة للأحداث المتعلقة بالصحة ، مثل الهجرة والزواج والولادة والموت. جمع التعداد الأميركي كميات هائلة من المعلومات كل 10 سنوات منذ عام 1790. كان موقع إحصاء التعداد على الإنترنت يحتوي على 370 مليار خلية في عام 2013 ، مع ما يقرب من 11 مليار سنة إضافية.

عمليات بحث الويب

يمكن أن توفر معلومات بحث الويب التي جمعتها Google ومقدمو بحث الويب الآخرون إحصاءات في الوقت الفعلي تتعلق بصحة السكان. ومع ذلك ، يمكن تحسين قيمة البيانات الضخمة من أنماط بحث الويب من خلال دمجها مع المصادر التقليدية للبيانات الصحية.

وسائل الاعلام الاجتماعية

تولد فيسبوك وتويتر وغيرها من وسائل الإعلام الاجتماعية مجموعة غنية من البيانات على مدار الساعة ، وتعطي نظرة إلى المواقع ، والسلوكيات الصحية ، والعواطف ، والتفاعلات الاجتماعية للمستخدمين. وقد تمت الإشارة إلى تطبيق البيانات الضخمة على الشبكات الاجتماعية على الصحة العامة على أنها الكشف عن الأمراض الرقمية أو الوبائيات الرقمية. على سبيل المثال ، تم استخدام تويتر لتحليل أوبئة الأنفلونزا بين عامة السكان.

مشروع الرفاه العالمي الذي بدأ في جامعة بنسلفانيا هو مثال آخر على دراسة وسائل الإعلام الاجتماعية لفهم تجربة الناس وصحتهم بشكل أفضل. يجمع المشروع بين علماء النفس والإحصائيين وعلماء الكمبيوتر الذين يقومون بتحليل اللغة المستخدمة عند التفاعل عبر الإنترنت ، على سبيل المثال ، عند كتابة تحديثات الحالة على Facebook و Twitter. يلاحظ العلماء كيف ترتبط لغة المستخدمين بصحتهم وسعادتهم. تساعد التطورات في معالجة اللغات الطبيعية والتعلم الآلي في مساعيهما. بحث منشور حديث من جامعة بنسلفانيا في طرق التنبؤ بالمرض العقلي من خلال تحليل وسائل الإعلام الاجتماعية. يبدو أن أعراض الاكتئاب وغيرها من حالات الصحة العقلية يمكن اكتشافها من خلال دراسة استخدامنا للإنترنت. يأمل العلماء في المستقبل أن تكون هذه الطرق قادرة على تحديد ومساعدة الأفراد المعرضين للخطر بشكل أفضل.

إنترنت الأشياء (IoT)

كما يتم جمع كميات هائلة من المعلومات المتعلقة بالصحة وتخزينها على الأجهزة المتنقلة والأجهزة المنزلية .

الهواتف الذكية : تقوم آلاف تطبيقات mHealth بتجميع المعلومات حول النشاط البدني للمستخدم والمآخذ التغذوي وأنماط النوم والعواطف وغيرها من المعلمات. يمكن لتطبيقات الهاتف الخلوي الأصلية (مثل نظام تحديد المواقع والبريد الإلكتروني والرسائل النصية) أن تقدم أيضًا أدلة حول الحالة الصحية للفرد.
أجهزة المراقبة والأجهزة القابلة للارتداء: تعمل أيضًا العدادات ومقاييس السرعة والنظارات والساعات والرقائق المضمنة تحت الجلد على جمع المعلومات المتعلقة بالصحة ويمكن أيضًا إرسالها إلى السحابة.
تسمح أجهزة التطبيب عن بعد لمقدمي الرعاية الصحية بمراقبة بارامترات المرضى مثل ضغط الدم ومعدل ضربات القلب ومعدل التنفس والأوكسجين ودرجة الحرارة وتتبعات تخطيط القلب والوزن.

المعاملات المالية

يتم تضمين معاملات بطاقات الائتمان الخاصة بالمرضى في النماذج التنبؤية المستخدمة من قبل نظام كاروليناس للرعاية الصحية لتحديد المرضى المعرضين لخطورة عالية لإعادة إدخالهم إلى المستشفى. يستخدم مقدم الرعاية الصحية في شارلوت بيانات كبيرة لتقسيم المرضى إلى مجموعات مختلفة ، على سبيل المثال ، بناءً على المرض والموقع الجغرافي.

الآثار الأخلاقية والخصوصية

يجب التأكيد على أنه ، في بعض الحالات ، قد تكون هناك آثار أخلاقية مهمة على الخصوصية عند جمع البيانات والوصول إليها في مجال الرعاية الصحية. يمكن لمصادر البيانات الكبيرة الجديدة أن تحسن فهمنا لما يؤثر على صحة الأفراد والسكان ، ومع ذلك ، فإن المخاطر المختلفة تحتاج إلى دراسة ومراقبة دقيقة. وقد تم الآن الاعتراف أيضًا بأن البيانات التي سبق أن تم اعتبارها مجهولة الهوية ، يمكن إعادة تحديدها. على سبيل المثال ، قام البروفسور لاتانيا سويني من مختبر خصوصية بيانات هارفارد بمراجعة 1،130 متطوعًا مشاركًا في مشروع الجينوم الشخصي. تمكنت هي وفريقها من تسمية 42٪ من المشاركين بشكل صحيح استنادًا إلى المعلومات التي شاركوها (الرمز البريدي وتاريخ الميلاد والجنس). يمكن أن تزيد هذه المعرفة من وعينا بالمخاطر المحتملة وتساعدنا في اتخاذ قرارات أفضل بشأن مشاركة البيانات.

> المصادر:

> Conway M ، O'Connor D. وسائل الاعلام الاجتماعية ، والبيانات الكبيرة ، والصحة النفسية: التقدم الحالي والآثار الأخلاقية. الرأي الحالي في علم النفس 2016 ؛ 9: 77-82.

> Fernandes L، O'Connor M، Weaver V. Big data، bigger results. Journal of The American Health Information Management Association 2012؛ 83 (10): 38-43

> Guntuku S، Yaden D، Kern M، Ungar L، Eichstaedt J. Detecting depression and mental illness on social media: an integrative review . الرأي الحالي في العلوم السلوكية 2017 ؛ 18: 43-49.

> Lazer D، Kennedy R، King G، Vespignani A. The Parable of Google Flu: Traps in Big Data Analysis . العلوم 2014 ؛ 343 (6176): 1203-1205.

> Raghupathi W، Raghupathi V. تحليلات البيانات الكبيرة في الرعاية الصحية: الوعد و potenti al. علوم ونظم المعلومات الصحية 2014 ؛ 2: 3.

> سويني ، وأبو ، و. ج. تحديد المشاركين في مشروع الجينوم الشخصي بالاسم . جامعة هارفرد. مختبر الخصوصية للبيانات ورقة بيضاء 1021-1. 24 أبريل 2013.