Enfoque de eliminación secuencial trifásica para el rechazo de desechos
El esquema de eliminación trifásica propuesto elimina secuencialmente los desechos de la prueba de papanicolaou si se considera poco probable que sea una célula del cuello uterino. Este enfoque es beneficioso, ya que permite tomar una decisión de dimensiones inferiores en cada etapa.
Análisis de tamaño
El análisis de tamaño es un conjunto de procedimientos para determinar un rango de medidas de tamaño de partículas . El área es una de las características más básicas utilizadas en el campo de la citología automatizada para separar las células de los desechos. El análisis de papanicolaou es un campo bien estudiado con mucho conocimiento previo sobre las propiedades celulares . Sin embargo, uno de los cambios clave con la evaluación del área del núcleo es que las células cancerosas experimentan un aumento sustancial en el tamaño nuclear . Por lo tanto, determinar un umbral de tamaño superior que no excluya sistemáticamente las células de diagnóstico es mucho más difícil, pero tiene la ventaja de reducir el espacio de búsqueda. El método presentado en este trabajo se basa en un umbral de tamaño inferior y superior de las células cervicales. El pseudo código para el enfoque se muestra en la Ec. 3.
$$ $ Si\;Area_{min} \le Area_{roi} \le Area_{max} \;a continuación,\;\left\langle {primer plano} \right\rangle \;else\;\left\langle {Background} \right\rangle ,$$
(3)
donde \(Area_{max} = 85,267\,{\upmu \text{m}}^{2}\) y \(Area_{min} = 625\,{\upmu \text{m}}^{2}\) que se derivan de la Tabla 2.
Los objetos del fondo se consideran escombros y, por lo tanto, se descartan de la imagen. Las partículas que se encuentran entre \(Area_{min}\) y \(Area_{max}\) se analizan más a fondo durante las siguientes etapas del análisis de textura y forma.
Análisis de formas
La forma de los objetos en un frotis de papanicolaou es una característica clave en la diferenciación entre células y desechos . Existen varios métodos para la detección de la descripción de formas, que incluyen enfoques basados en regiones y contornos . Los métodos basados en regiones son menos sensibles al ruido pero más intensivos computacionalmente, mientras que los métodos basados en contornos son relativamente eficientes para calcular pero más sensibles al ruido . En este trabajo, se ha utilizado un método basado en la región (perimetro 2/área (P2A)). El descriptor P2A se eligió por el mérito de describir la similitud de un objeto con un círculo. Esto lo hace muy adecuado como descriptor de núcleos celulares, ya que los núcleos son generalmente circulares en su apariencia. El P2A también se conoce como forma compacta y se define por Ec. 4.
$$c = \frac{{p^{2} }}{A},$$
(4)
donde c es el valor de la figura de compacidad, a es el área y p es el perímetro del núcleo. Se suponía que los desechos eran objetos con un valor de P2A superior a 0,97 o inferior a 0,15 según las características de entrenamiento (descritas en el cuadro 2).
Análisis de texturas
La textura es una característica muy importante que puede diferenciar entre núcleos y desechos. Textura de imagen es un conjunto de métricas diseñadas para cuantificar la textura percibida de una imagen . Dentro de un frotis de papanicolaou, la distribución de la intensidad media de la mancha nuclear es mucho más estrecha que la variación de la intensidad de la mancha entre los desechos . Este hecho se utilizó como base para eliminar los residuos en función de sus intensidades de imagen e información de color utilizando momentos Zernike (ZM) . Los momentos Zernike se utilizan para una variedad de aplicaciones de reconocimiento de patrones y se sabe que son robustos con respecto al ruido y tienen una buena potencia de reconstrucción. En este trabajo, el ZM presentado por Malm et al. de orden n con repetición I de función \(f\left ({r, \ theta } \ right)\), en coordenadas polares dentro de un disco centrado en una imagen cuadrada \(I\left( {x, y} \right)\) de tamaño \(m \times m\) dada por la Ec. se utilizó el 5.
$$A_{nl} = \frac{n + 1}{\pi }\mathop \sum \limits_{x} \mathop \sum \limits_{y} v_{nl}^{*} \left( {r,\theta } \derecho)I\left( {x,y} \derecho),$$
(5)
\(v_{nl }^{*} \left( {r,\theta } \right)\) denota el complejo conjugado de la Zernike polinomio \(v_{nl} \left( {r,\theta } \right)\). Para producir una medida de textura, se promedian las magnitudes de \(A_{nl}\) centradas en cada píxel de la imagen de textura .
El éxito de un algoritmo de clasificación depende en gran medida de la corrección de las entidades extraídas de la imagen. Las células de las pruebas de papanicolaou en el conjunto de datos utilizado se dividen en siete clases basadas en características como el tamaño, el área, la forma y el brillo del núcleo y el citoplasma. Las características extraídas de las imágenes incluían características morfológicas utilizadas anteriormente por otros . En este trabajo también se extrajeron del núcleo tres características geométricas (solidez, compacidad y excentricidad) y seis características textuales (media, desviación estándar, varianza, suavidad, energía y entropía), resultando en un total de 29 características, como se muestra en la Tabla 3.
Tabla 3 Entidades extraídas de las imágenes de frotis de papanicolaou
Selección de entidades es el proceso de selección de subconjuntos de las entidades extraídas que dan los mejores resultados de clasificación. Entre esas características extraídas, algunas pueden contener ruido, mientras que el clasificador elegido puede no utilizar otras. Por lo tanto, se debe determinar un conjunto óptimo de características, posiblemente probando todas las combinaciones. Sin embargo, cuando hay muchas características, las posibles combinaciones explotan en número y esto aumenta la complejidad computacional del algoritmo. Los algoritmos de selección de características se clasifican ampliamente en los métodos de filtro, envoltura y embebido .
El método utilizado por la herramienta combina el recocido simulado con un enfoque de envoltura. Este enfoque se ha propuesto en pero, en este documento, el rendimiento de la selección de características se evalúa utilizando un algoritmo de bosque aleatorio de doble estrategia . El recocido simulado es una técnica probabilística para aproximar el óptimo global de una función dada. El enfoque es adecuado para garantizar que se selecciona el conjunto óptimo de características. La búsqueda del conjunto óptimo se guía por un valor de aptitud física . Cuando se termina el recocido simulado, se comparan todos los diferentes subconjuntos de características y se selecciona el más apto (es decir, el que tiene el mejor rendimiento). La búsqueda de valor de aptitud se obtuvo con un envoltorio donde se utilizó validación cruzada k-fold para calcular el error en el algoritmo de clasificación. Se preparan, evalúan y comparan diferentes combinaciones de las características extraídas con otras combinaciones. A continuación, se utiliza un modelo predictivo para evaluar una combinación de características y asignar una puntuación basada en la precisión del modelo. El error de aptitud dado por la envoltura se utiliza como error de aptitud por el algoritmo de recocido simulado. Un algoritmo de medias C difusas se envolvió en una caja negra, de la cual se obtuvo un error estimado para las diversas combinaciones de características, como se muestra en la Fig. 4.
Fig. 4
La media C difusa se envuelve en una caja negra de la que se obtiene un error estimado
La media C difusa permite puntos de datos en el conjunto de datos para pertenecer a todos los clústeres, con membresías en el intervalo (0-1) como se muestra en la Ec. 6.
m m_ {ik} = \ frac {1} {{\mathop \sum \ nolimits_ {j = 1} ^ {c} \left( {\frac{{d_{ik} }}{{d_{jk} }}} \right)^{{2/\left ({q – 1} \right)}} }} ,$$
(6)
donde \(m_{ik}\) es la pertenencia del punto de datos k al centro del clúster i, \(d_{jk}\) es la distancia del centro del clúster j al punto de datos k y q € es un exponente que decide qué tan fuertes deben ser las membresías. El algoritmo de medias C difusas se implementó utilizando fuzzy toolbox en Matlab.
La defuzzificación
Un algoritmo de medias C difusas no nos dice qué información contienen los clústeres y cómo se utilizará esa información para la clasificación. Sin embargo, define cómo se asigna la pertenencia a los puntos de datos de los diferentes clústeres y esta pertenencia difusa se usa para predecir la clase de un punto de datos . Esto se supera a través de la defuzzificación. Existen varios métodos de defuzzificación . Sin embargo, en esta herramienta, cada clúster tiene una pertenencia difusa (0-1) de todas las clases de la imagen. Los datos de entrenamiento se asignan al clúster más cercano. El porcentaje de datos de entrenamiento de cada clase que pertenece al clúster A da la pertenencia al clúster, clúster A = a las diferentes clases, donde i es la contención en el clúster A y j en el otro clúster. La medida de intensidad se agrega a la función de pertenencia para cada clúster mediante un algoritmo de defuzzificación de agrupamiento difuso. Un enfoque popular para la defuzzificación de particiones difusas es la aplicación del principio de grado de pertenencia máximo donde el punto de datos k se asigna a la clase m si, y solo si, su grado de pertenencia \(m_{ik}\) al clúster i, es el mayor. Chuang et al. propuso ajustar el estado de membresía de cada punto de datos utilizando el estado de membresía de sus vecinos.
En el enfoque propuesto, se utiliza un método de defuzzificación basado en la probabilidad bayesiana para generar un modelo probabilístico de la función de pertenencia para cada punto de datos y aplicar el modelo a la imagen para producir la información de clasificación. El modelo probabilístico se calcula de la siguiente manera:
Convertir las distribuciones de posibilidades en la matriz de particiones (clústeres) en distribuciones de probabilidad.
Construir un modelo probabilístico de las distribuciones de datos como en .
Aplique el modelo para producir la información de clasificación para cada punto de datos utilizando la Ec. 7.
$${\text{P}}\left( {A_{i} |B_{j} } \right) = \frac{{P\left( {B_{j} |A_{i} } \right)*P\left( {A_{i} } \right)}}{{B_{j} }} ,$$
(7)
donde \(P\left( {A_{i} } \derecho),i = 0 \ldots .c\) es la probabilidad previa de \(A_{i}\) que se puede calcular utilizando el método en el que la probabilidad previa es siempre proporcional a la masa de cada clase.
Se determinó el número de clústeres a utilizar para garantizar que el modelo construido pueda describir los datos de la mejor manera posible. Si se eligen demasiados clústeres, existe el riesgo de sobreajustar el ruido en los datos. Si se eligen muy pocos clústeres, el resultado podría ser un clasificador pobre. Por lo tanto, se realizó un análisis del número de clústeres contra el error de la prueba de validación cruzada. Se alcanzó un número óptimo de 25 grupos y se produjo un sobreentrenamiento por encima de este número de grupos. Un exponente de defuzzificación de 1.0930 se obtuvo con 25 clústeres, diez veces la validación cruzada y 60 repeticiones y se utilizó para calcular el error de aptitud para la selección de características, donde se seleccionaron un total de 18 características de las 29 características para la construcción del clasificador. Las características seleccionadas fueron: área del núcleo; nivel de gris del núcleo; diámetro más corto del núcleo; núcleo más largo; perímetro del núcleo; máximos en el núcleo; mínimos en el núcleo; área del citoplasma; nivel de gris del citoplasma; perímetro del citoplasma; relación núcleo a citoplasma; excentricidad del núcleo, desviación estándar del núcleo, varianza del nivel de gris del núcleo; entropía del nivel de gris del núcleo; posición relativa del núcleo; media del nivel de gris del núcleo y valores de energía del núcleo gris.
Evaluación de clasificación
En este trabajo, el modelo jerárquico de la eficacia de los sistemas de diagnóstico por imagen propuesto por Fryback y Thornbury fue adoptado como principio rector para la evaluación de la herramienta, como se muestra en la Tabla 4.
Tabla 4 Criterios de evaluación de herramientas
La sensibilidad mide la proporción de positivos reales que se identifican correctamente como tales, mientras que la especificidad mide la proporción de negativos reales que se identifican correctamente como tales. La sensibilidad y la especificidad se describen mediante la Ec. 8.
Sensitivity Sensibilidad\; \left( {TPR} \right) = \ frac {TP} {TP + FN},\; Especificidad\; \left( {TNR} \right) = \frac{TN}{TN + FP},$$
(8)
donde TP = Verdaderos positivos, FN = Falsos negativos, TN = Verdaderos negativos y FP = Falsos positivos.
Diseño e integración de GUI
Los métodos de procesamiento de imágenes descritos anteriormente se implementaron en Matlab y se ejecutan a través de una interfaz gráfica de usuario (GUI) Java que se muestra en la Fig. 5. La herramienta tiene un panel donde se carga una imagen de frotis de papanicolaou y el citotécnico selecciona un método apropiado para la segmentación de la escena (basado en el clasificador TWS), la eliminación de escombros (basado en el enfoque de eliminación secuencial de tres) y la detección de límites (si se considera necesario, utilizando el método de detección de bordes Canny), después de lo cual las características se extraen utilizando el botón extraer características.
Fig. 5
Interfaz gráfica de usuario PAT
La herramienta escanea a través de la prueba de papanicolaou para analizar todos los objetos que quedaron después de la eliminación de escombros. Las 18 características descritas en selección de características se extraen de cada objeto y se utilizan para clasificar cada celda utilizando el algoritmo de medias C difusas descrito en el método de clasificación. Las características extraídas aleatoriamente de una celda superficial y una celda intermedia se muestran en el panel de resultados del análisis de imágenes. Una vez que se han extraído las características, el citotécnico (usuario) presiona el botón clasificar y la herramienta emite un diagnóstico (positivo a malignidad o negativo a malignidad) y clasifica el diagnóstico en una de las 7 clases/etapas del cáncer de cuello uterino según el conjunto de datos de capacitación.