Saltar al contenido principal
LibreTexts Español

20.2: Antes de comenzar a recopilar datos

  • Page ID
    124167
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    Todos los ensayos necesitan recursos adecuados para recopilar datos e información, verificar la consistencia y calidad de los datos, y organizar los datos en una forma adecuada para su análisis. Es importante que todos los pasos del ensayo y el flujo de datos asociados se planifiquen antes de iniciar el ensayo, y se definan los recursos necesarios en cada paso. En esta sección se describen los diferentes hardware, software, personal y sistemas necesarios para procesar los datos en un ensayo. Al considerar el presupuesto de prueba, se deben asignar recursos para todos estos aspectos, y muchas veces los componentes tienen que ser capaces de multitarea, por ejemplo, computadoras que puedan ser utilizadas tanto para la entrada de datos como para funciones administrativas, y software que pueda administrar diferentes formatos de datos.

    Hay cuatro componentes para la descripción del procesamiento de datos para un ensayo:

    1. hardware, es decir, cualquier entidad física utilizada para el procesamiento de datos. Esto puede incluir computadoras, impresoras y hardware electrónico, pero también incluye papel, bolígrafos y otros equipos utilizados para recopilar, transferir y archivar los datos
    2. software, es decir, los programas necesarios para hacer que el hardware manipule y procese los datos para el estudio
    3. personal necesario para el procesamiento de datos
    4. los sistemas y la organización que deben existir para reunir todos los diferentes componentes.

    2.1 Hardware

    El hardware más común utilizado en una prueba pequeña sigue siendo cuestionarios y formularios en papel. Gran parte de lo que se hace se registra en papel y, en todas las etapas, se guardan copias en papel como registro definitivo. La ventaja de usar papel es que se trata de una entidad física, que conserva el contenido de los datos. La desventaja es que es difícil de procesar y analizar, particularmente en grandes cantidades. Los datos recopilados o almacenados electrónicamente son mucho más fáciles de manipular y usar en una variedad de formas diferentes.

    Si se utilizan sistemas de papel para recopilar datos, es importante incluir, en la planeación, la provisión de todos los accesorios necesarios para la recolección de papel como bolígrafos, portapapeles y cajas de almacenamiento. La gestión del trabajo también es un tema que debe pensarse hasta el final del juicio y más allá, con sistemas de archivo y archivos adecuados para el almacenamiento de datos. Los sistemas de papel deben integrarse con el hardware y software de computadora utilizados en el estudio, primero para hacer la impresión de los cuestionarios y otros formularios, y segundo para tomar los datos de los formularios e ingresarlos en un paquete de computadora para su verificación y análisis electrónicos.

    El uso de computadoras para recopilar, procesar y analizar datos es omnipresente hoy en día. Hay tantas computadoras diferentes, y continuamente están mejorando y más rápido que es imposible dar una orientación muy específica sobre cuál sería la mejor para estudios particulares. Mucho depende de la forma en que se haya planificado la gestión de datos para el estudio y con qué software ya esté familiarizado el analista. Una forma de dividir las muchas opciones de hardware de computadora es a través de la distinción entre computadoras de escritorio, computadoras portátiles, dispositivos móviles y servidores. Los escritorios son útiles para la entrada de datos y cuando hay muchas personas que desean compartir una computadora por períodos cortos de tiempo, por ejemplo, supervisores de campo que necesitan ingresar un informe al final del día. También se necesitan escritorios para algunas de las funciones administrativas, pero, en general, es bueno mantener los datos de investigación físicamente separados de las computadoras administrativas que el proyecto necesita.

    Las computadoras portátiles proporcionan una potencia informática comparable a las computadoras de escritorio y se pueden usar para recopilar y administrar datos en el campo, incluso cuando la electricidad de la red no está ampliamente disponible. Los dispositivos más pequeños, como PDA o computadoras personales ultra-móviles (UMPC) o incluso teléfonos móviles 'inteligentes', son más fáciles de usar y transportar en el campo que las computadoras portátiles. Con las computadoras portátiles y los dispositivos informáticos móviles más pequeños, hay que considerar dos temas; primero, cuanto más pequeño es el dispositivo, más fácil es perder o ser robados, y segundo, estos dispositivos tienen baterías que necesitan recargarse y reemplazarse periódicamente. Al comprar computadoras portátiles y dispositivos más pequeños, comprar un cable de seguridad para cada máquina, en su caso, suele ser una buena inversión. También es importante asegurarse de que el responsable de la computadora utilice el cable de seguridad y los procedimientos sean bien conocidos por todos, ya que solo toma un minuto perder grandes cantidades de datos si se roba una computadora. Si se usa continuamente, recargar computadoras portátiles, PDA, UMPC o teléfonos móviles puede ser una tarea que consume mucho tiempo. Se pueden usar baterías de larga duración para extender el tiempo que las máquinas se pueden usar entre la carga y, si la red eléctrica está disponible, la recarga se puede hacer en las pausas para las comidas y durante la noche. De lo contrario, los inversores se pueden utilizar para cargar desde baterías de automóviles o desde paneles solares.

    Los PDA, tabletas, teléfonos móviles y otros dispositivos se pueden programar para aceptar cuestionarios electrónicos y también se pueden comprar con software GPS, cámaras, lectores de códigos de barras y capacidades automáticas de Internet, siendo el único inconveniente el costo de las funciones adicionales. En general, es importante precisar qué es lo que se necesita para el juicio y evitar gastos en funciones que no sean necesarias.

    Todas las pruebas menos las más pequeñas se beneficiarán de tener un servidor, con el fin de almacenar los datos y administrar los recursos. Un servidor puede ser una computadora especial con una gran cantidad de capacidad de almacenamiento de datos o un escritorio estándar configurado para organizar el almacenamiento de datos y los procedimientos administrativos. Sin embargo, los servidores necesitan ser atendidos cuidadosamente, con control de la temperatura, polvo y humedad en la sala de servidores. Si el juicio opera fuera de un instituto establecido, es probable que sea posible utilizar el servidor y la red de la institución, tal vez a través de la creación de un servidor virtual para el uso del juicio. La red del servidor puede ser a través de cables físicos o podría establecerse como una simple red de área local (LAN) usando un enrutador inalámbrico, pero tenga en cuenta que, si bien los portátiles suelen tener capacidad inalámbrica incorporada, este no suele ser el caso de los escritorios y PDA. Un buen servidor y una red pueden simplificar muchas operaciones, como el acceso a Internet y el intercambio de datos, y deben ocupar un lugar destacado en la lista de prioridades para todos menos para el estudio más pequeño.

    También se necesita equipo auxiliar ('periféricos'). Esto puede incluir impresoras, escáneres, fotocopiadoras, cámaras, lectores de códigos de barras y dispositivos de respaldo. Estos se pueden instalar y conectar a una computadora, pero una simple red facilitará que diferentes miembros del equipo de investigación accedan a los diferentes periféricos. El más amplio

    también es necesario planificar el acceso a Internet. Si el servicio de Internet es deficiente, puede ser necesario tener más de una forma de acceder a Internet, tal vez a través de líneas fijas o a través de redes de telefonía móvil.

    2.2 Software

    En esta sección, no consideraremos software general, como procesamiento de textos o antivirus, que suelen estar disponibles para todas las computadoras, sino que nos concentraremos en las opciones específicas disponibles para el procesamiento de datos. El software de procesamiento de datos comprende paquetes especializados que facilitan la recopilación, gestión y organización de los datos de los ensayos. Se pueden utilizar para preparar datos para su análisis por paquetes de análisis de datos especializados. Consideramos tres categorías amplias de software: freeware (paquetes de software libre), software propietario (que debe comprarse) y software de código abierto, y damos algunos ejemplos de los diferentes paquetes disponibles, pero la elección es amplia. La consideración más importante es planificar cómo se realizará el procesamiento de datos para el ensayo y usar el paquete adecuado para cada paso del flujo de datos. Debe ser sencillo transferir datos de un paquete a otro y es un desperdicio de tiempo y recursos para realizar cualquier operación de datos en un paquete que no esté diseñado para ese propósito. En muchos sentidos, la selección del software es más importante que el hardware, y una buena selección puede ahorrar mucho tiempo.

    Para el tipo de datos que se recogen en estudios y ensayos epidemiológicos, Epi-Info (<wwwn.cdc.gov/epiinfo>) es un paquete gratuito muy útil que puede ser utilizado para muchos tipos de estudio. Un paquete de software gratuito similar Epi-Data (< http://www.EpiData.dk >) proporciona capacidades de administración, análisis y transferencia de datos. Estos paquetes son fáciles de aprender y usar y son ideales para estudios pequeños.

    Para estudios más grandes, suele ser mejor usar un paquete de software propietario como Microsoft AccessTM o MS-SQLTM. Se trata de software fácil de usar, con buenos materiales de aprendizaje para ayudar en el desarrollo y uso de la base de datos. Estos paquetes de software se pueden utilizar para limpiar y administrar datos, y es fácil transferir datos de ellos a paquetes de análisis. Las versiones gratuitas, pero limitadas, de estos paquetes de software están disponibles para aquellos con presupuestos limitados.

    Los paquetes de software de código abierto suelen ser también gratuitos para el usuario, y es posible acceder al código fuente y desarrollar aplicaciones que se adapten a estudios específicos. Un desafío, sin embargo, es aprender a manipular el código fuente y hacer que el software funcione adecuadamente para un estudio específico. Los ejemplos incluyen RedCap, que está dirigido a investigadores que no tienen acceso a mucho soporte informático pero que desean configurar y gestionar rápidamente estudios clínicos, incluidos los longitudinales, mientras que OpenClinica se dirige a investigadores que realizan ensayos clínicos que deben cumplir con los requisitos reglamentarios de EE. UU. Administración de Alimentos y Medicamentos. Open Data Kit (ODK) es un conjunto de aplicaciones de código abierto que permiten la creación de cuestionarios para la recolección de datos en dispositivos móviles habilitados para Android y facilitan la administración de datos en línea. Force.com es una poderosa plataforma de gestión de datos, para la cual se otorga un número limitado de licencias gratuitas a organizaciones sin fines de lucro e instituciones de educación superior. Todos estos paquetes son de uso gratuito y son altamente personalizables, y todos menos Force.com se pueden configurar sin conocimientos de programación informática altamente especializados. Los cuatro sistemas están respaldados por comunidades en línea informadas por el usuario final.

    2.3 Personal

    El personal necesario para la gestión de datos dependerá del tamaño del ensayo y de los sistemas informáticos y de software que se utilicen. Para un estudio pequeño, el uso de formularios en papel y un paquete de software simple, como Epi-Info, para el procesamiento de datos, puede ser suficiente un administrador de datos a tiempo parcial y un empleado de entrada de datos. Para estudios más grandes que utilicen formularios en papel, es posible que se necesite un equipo de empleados de entrada de datos y varios administradores de datos. Aunque los requisitos para los empleados de entrada de datos pueden reducirse o eliminarse en gran medida para los estudios que utilizan captura electrónica de datos, es posible que se necesiten administradores de datos calificados y programadores expertos para programar algunos de los dispositivos de recolección para validar los sistemas y diseñar la base de datos.

    El manejo exitoso de datos requiere una variedad de habilidades diferentes en diferentes momentos durante el estudio. Al inicio del estudio, a excepción de paquetes de software simples como Epi-Info, se necesitará alguien con habilidades técnicas para configurar la base de datos y escribir los programas de verificación de datos. Si el personal del estudio no está capacitado en la programación de bases de datos, puede ser mejor contratar a un consultor para que lo haga. Cuando el estudio esté en marcha, será necesario que el personal ingrese los datos (a menos que todos los datos se capturen electrónicamente), administre la verificación de datos y limpie los datos diariamente. Al finalizar el estudio, se deben preparar archivos de datos para el análisis estadístico y la redacción del informe, y nuevamente comprar la pericia puede ser apropiado si no hay personal en el equipo con las habilidades necesarias. Dependiendo del tamaño del estudio, algunos de estos roles pueden combinarse en un solo individuo, mientras que, en grupos de investigación más grandes, los individuos pueden ser especialistas que trabajan a tiempo completo en un área de gestión de datos como el desarrollo de bases de datos o la redacción de comprobaciones de datos.

    El personal debe ser reclutado antes del inicio del juicio para poder desarrollar y capacitarse en el uso de los sistemas de procesamiento de datos. Es importante asignar tiempo suficiente para la capacitación. Incluso el personal que tenga experiencia previa en el manejo de datos en otros estudios necesitará ser capacitado para utilizar el sistema que se está utilizando en el ensayo y familiarizarse con el protocolo de estudio. Los atributos más importantes para el personal de entrada de datos son la conciencia, la confiabilidad y la atención al detalle. Las habilidades informáticas existentes pueden ser menos importantes, ya que el personal puede ser capacitado para usar una computadora e ingresar datos. A veces, el personal que originalmente se empleó para recopilar datos en el campo puede ser capacitado para ser buenos empleados de entrada de datos. Esto tiene la ventaja de que estarán familiarizados con el tipo de datos que se recopilan y los formularios en uso. También estarán al tanto de los problemas que puedan surgir en la recolección de datos en el campo. Sin embargo, los empleados de entrada de datos y sus supervisores se están reduciendo gradualmente en número en muchos grupos de investigación, a medida que pasan de la recolección de datos en papel a la captura electrónica de datos.

    Es probable que se necesite un supervisor por cada cuatro a seis empleados de entrada de datos para controlar la calidad de su trabajo, para asegurar una distribución y un flujo de trabajo adecuados y equitativos, y para garantizar que todos los datos y formularios se procesen y almacenen correctamente. Es posible que el supervisor pueda realizar algunas de las comprobaciones y limpieza iniciales de los datos y tomar algunas de las tareas de administración de datos del administrador de datos del estudio. Una buena manera de identificar a las personas que podrían estar capacitadas como supervisores puede ser seleccionarlas de entre los empleados de entrada de datos, en función de su desempeño y aptitud para este trabajo, aunque la capacidad de escribir datos de manera rápida y confiable no necesariamente proporciona una buena indicación de que un individuo hará una buen supervisor.

    Pueden ser necesarios estudios piloto para determinar la cantidad de datos que puede procesar un empleado de datos en un día, para saber cuántas personas de este tipo deben incluir en el presupuesto de prueba. Esto debería ser parte de las pruebas piloto, las cuales se tratan con más detalle en el Capítulo 13. Como el trabajo es repetitivo, pero requiere un cuidado considerable, es recomendable planear que un empleado no debe estar ingresando datos por más de 5 o 6 horas diarias. La entrada de datos se puede intercalar con tareas de archivo para mantener la variedad en el trabajo.

    Si un juicio es grande, un número sustancial de formularios puede acumularse rápidamente, y el diseño de un sistema apropiado de archivo y seguimiento, de manera que los formularios individuales puedan ser recuperados, si es necesario, es importante. El empleo de secretarios archivadores también puede ser necesario en juicios grandes. La entrada y archivo de datos son tareas que deben realizarse de la misma manera, día tras día. Por lo que es importante idear formas de mantener la moral del personal, para garantizar un trabajo de alta calidad. Para ensayos más grandes realizados a lo largo de varios años, puede ser importante elaborar estructuras de desarrollo profesional dentro del proyecto (por ejemplo, la progresión de empleado de archivo o trabajador de campo a empleado de entrada de datos a supervisor). También, la capacitación en nuevas técnicas y el uso de paquetes informáticos puede ser apropiado. Los individuos deben ser conscientes de que su trabajo se considera importante y que se vigila su calidad, de manera que se detecte el mal trabajo y se necesite corregir, mientras que el buen trabajo se nota y se premia adecuadamente.

    El personal de gestión de datos debe sentirse como parte integral del proyecto. Se deben instalar las medidas adecuadas para permitir que el personal de campo y de gestión de datos pueda comunicarse entre sí, de manera que se considere parte del mismo equipo. Consulte el Capítulo 16 para más detalles de las operaciones de campo. El personal de campo debe comprender los problemas que causan los errores en la recolección de datos en el procesamiento y análisis de datos, y el personal de gestión de datos debe apreciar los obstáculos para la recolección de datos de alta calidad en el campo. Las visitas del personal de datos al campo pueden ayudar mucho a tal entendimiento mutuo, al igual que el personal de campo pasa cortos períodos trabajando u observando en la oficina de datos.

    2.4 Supervisión de datos

    No importa cuán buenos sean los sistemas de datos, siempre hay beneficio en conseguir que alguien fuera del estudio los vea para ver si se pueden mejorar. El mejor momento para esto es antes de comenzar a recopilar datos reales, a tiempo para que se cambien los sistemas, si es necesario. Para estudios pequeños, esto puede ser cuestión de conseguir que un colega revise los sistemas de datos. En estudios más amplios, podrían contratarse asesores externos para observar el sistema de datos.

    En la mayoría de los ensayos clínicos, los requisitos de la buena práctica clínica (GCP) son tales que los datos de los ensayos deben ser recabados y procesados, de conformidad con las guías ICH-GCP (ver Capítulo 16, Sección 7.1). Las implicaciones prácticas de estos requisitos son que el proceso de administración de datos debe ser documentado y los sistemas informáticos utilizados para recopilar, almacenar y procesar los datos deben ser validados. Las regulaciones que rigen el manejo de los datos de los ensayos clínicos pueden clasificarse ampliamente en: (1) datos clínicos; (2) relacionados con la tecnología; y (3) relacionados con la privacidad. El principio rector detrás de todas estas regulaciones es la necesidad de estar seguros de que los datos fueron recolectados como se define en el protocolo de estudio, son de participantes reales, y pueden ser verificados de manera independiente. Es posible que no se requieran estudios pequeños para implementar GCP, pero, para todos los estudios, debe haber conciencia de que deben existir buenas prácticas y procedimientos, asegurando que los sistemas de datos sean verificados para detectar errores o descuidos.

    El cumplimiento de GCP requiere que todas las fases de los procesos de gestión de datos estén controladas por procedimientos operativos estándar (SOP). El personal de gestión de datos debe estar capacitado en cada proceso, y la capacitación debe ser documentada. ICH-GCP no requiere doble entrada de datos, pero requiere que se implementen procesos para garantizar que los datos en la base de datos reflejen con precisión lo que se registró en campo en cuestionarios o por otros medios.

    El sistema informático utilizado para almacenar y administrar los datos deberá ser validado, lo que requiere un plan de validación, especificación del usuario, pruebas y control de cambios. En la forma más simple, un SOP que describa los pasos necesarios para construir, probar y liberar una base de datos puede servir como plan de validación. La base de datos y las pantallas de entrada de datos deberán ser probadas para asegurar que funcionan correctamente, y las pruebas y sus resultados deben ser documentados.

    Otro requisito de GCP es que todos los cambios que se realicen a los datos en la base de datos del estudio estén documentados y que no se eliminen los datos originales. Este requisito se interpreta generalmente en el sentido de que se debe crear una pista de auditoría electrónica, en la que el sistema de software registra automáticamente cualquier cambio que se realice en la base de datos, incluso cuándo se realizaron y quién los realizó. Sin embargo, existen diferencias en cómo se interpreta e implementa el término 'pista de auditoría' y en qué etapa se “enciende” la pista de auditoría. Algunos registros de auditoría pueden registrar cambios después de la primera entrada a la base de datos, otros después de la segunda entrada cuando se han verificado los datos y otros no hasta después de que se haya realizado la limpieza inicial de los datos. Construir una base de datos con una pista de auditoría electrónica requiere habilidades y conocimientos especializados; sin embargo, los paquetes de software diseñados específicamente para ensayos clínicos, como OpenClinica, tienen una pista de auditoría como una característica incorporada.

    En un pequeño ensayo que no implique la licencia de un producto farmacéutico, es posible documentar los cambios de datos por otros medios para demostrar el cumplimiento de GCP, por ejemplo, mantener una copia de la base de datos original después de la segunda entrada, una base de datos separada que contenga todas las actualizaciones de los datos, y un documento registro de todos los cambios que se realicen.

    GCP también requiere que se mantenga un sistema de seguridad que impida el acceso no autorizado a los datos. Esto generalmente significaría tener una contraseña separada para acceder a la base de datos y que los usuarios tengan diferentes niveles de acceso permitido, dependiendo de su rol en el proceso de gestión de datos. Los códigos de aleatorización (ver el Capítulo 11 para más detalles) siempre deben tener acceso restringido, de manera que el personal no autorizado no pueda averiguar qué tratamiento se ha asignado a qué participantes.

    GCP también requiere que los datos sean respaldados adecuadamente. Incluso en un estudio que no se está ejecutando a GCP, es fundamental desarrollar un sistema para copias de seguridad regulares de datos. De no hacerlo puede resultar en la pérdida de datos. Se pueden usar varios tipos de medios para copias de seguridad, incluyendo cintas, CD o discos duros externos. Cualquiera que sea el uso, las copias de seguridad deben hacerse regularmente (al menos semanalmente y posiblemente diariamente), una vez que se haya iniciado la entrada de datos. Siempre deben existir al menos dos copias de respaldo de la base de datos, y se deben hacer 'restauraciones' periódicas de los datos respaldados para verificar la integridad de los datos. Las copias deben actualizarse de manera regular y frecuente, aunque es una buena idea conservar también algunas versiones antiguas, ya que a veces se encuentran errores en las más recientes que hacen necesario reiniciar la entrada de datos de una copia anterior. Algunas de las copias deben almacenarse en un lugar geográficamente separado en un ambiente seco y relativamente libre de polvo (por ejemplo, en una bolsa de plástico sellada). Se deben mantener registros completos de los datos que se almacenan en todas las copias de seguridad, con una copia almacenada con la copia de seguridad y al menos otra copia almacenada en un lugar separado.


    20.2: Antes de comenzar a recopilar datos is shared under a CC BY-NC license and was authored, remixed, and/or curated by LibreTexts.