Articles

Uno strumento di analisi pap-striscio (PAT) per il rilevamento del cancro cervicale da immagini pap-striscio

Analisi delle immagini

La pipeline di analisi delle immagini per lo sviluppo di uno strumento di analisi pap-striscio per il rilevamento del cancro cervicale da pap-strisci presentato in questo articolo è raffigurato in Fig. 1.

Fig. 1
figura 1

L’approccio per ottenere il cancro cervicale rilevamento dal pap-test di immagini

acquisizione di Immagini

L’approccio è stata valutata utilizzando tre set di dati. Dataset 1 è costituito da 917 singole celle di Harlev pap-striscio immagini preparate da Jantzen et al. . Il set di dati contiene immagini pap-striscio scattate con una risoluzione di 0,201 µm / pixel da citopatologi esperti utilizzando un microscopio collegato a un frame grabber. Le immagini sono state segmentate utilizzando il software commerciale CHAMP e quindi classificate in sette classi con caratteristiche distinte come mostrato nella Tabella 2. Di queste 200 immagini sono state utilizzate per la formazione e 717 immagini per i test.

Tabella 2 Alcune caratteristiche delle cellule cervicali dal set di dati di training (N = nucleo C = citoplasma)

set di dati 2 si compone di 497 completo della presentazione pap-test immagini preparato da Norup et al. . Di queste 200 immagini sono state utilizzate per la formazione e 297 immagini per i test. Inoltre, le prestazioni del classificatore sono state valutate sul set di dati 3 di campioni di pap-strisci 60 (30 normali e 30 anormali) ottenuti dall’ospedale regionale di riferimento di Mbarara (MRRH). I campioni sono stati fotografati utilizzando un microscopio Olympus BX51 a campo luminoso dotato di un obiettivo 40×, 0,95 NA e una fotocamera monocromatica Hamamatsu ORCA-05G 1,4 Mpx, con una dimensione in pixel di 0,25 µm con profondità di grigio a 8 bit. Ogni immagine è stata poi divisa in 300 aree con ogni area contenente tra 200 e 400 celle. Sulla base delle opinioni dei citopatologi, sono stati selezionati 10.000 oggetti in immagini derivate dai 60 diversi vetrini pap-striscio, di cui 8000 erano cellule epiteliali cervicali libere (3000 cellule normali da strisci normali e 5000 cellule anormali da strisci anormali) e i restanti 2000 erano oggetti detriti. Questa segmentazione pap-smear è stata ottenuta utilizzando il toolkit di segmentazione Weka addestrabile per costruire un classificatore di segmentazione a livello di pixel.

Miglioramento dell’immagine

All’immagine in scala di grigi è stata applicata un’equalizzazione dell’istogramma adattivo locale a contrasto (CLAHE) per il miglioramento dell’immagine . In CLAHE, la selezione di clip-limit che specifica la forma desiderata dell’istogramma dell’immagine è fondamentale, in quanto influenza criticamente la qualità dell’immagine migliorata. Il valore ottimale del limite di clip è stato selezionato empiricamente utilizzando il metodo definito da Joseph et al. . Un valore limite di clip ottimale di 2.0 è stato determinato come appropriato per fornire un adeguato miglioramento dell’immagine preservando le caratteristiche scure per i set di dati utilizzati. La conversione in scala di grigi è stata ottenuta utilizzando una tecnica in scala di grigi implementata utilizzando Eq. 1 come definito in .

New New \;Scala di grigi \;Image = \left( {\left( {0.3*R} \right) + \left( {0.59*G} \right) + \left( {0.11*B} \right)} \right), where
(1)

dove R = Rosso, G = Verde e B = contributi di colore blu alla nuova immagine.

L’applicazione di CLAHE per il miglioramento dell’immagine ha comportato notevoli cambiamenti alle immagini regolando le intensità dell’immagine in cui l’oscuramento del nucleo, così come i confini del citoplasma, sono diventati facilmente identificabili utilizzando un limite di clip di 2.0.

Segmentazione delle scene

Per ottenere la segmentazione delle scene, è stato sviluppato un classificatore a livello di pixel utilizzando il toolkit Weka Segmentation (TWS) addestrabile. La maggior parte delle cellule osservate in un pap-striscio non sono sorprendentemente cellule epiteliali cervicali . Inoltre, il numero variabile di leucociti, eritrociti e batteri è generalmente evidente, mentre a volte si osservano piccoli numeri di altre cellule e microrganismi contaminanti. Tuttavia, il pap-striscio contiene quattro tipi principali di cellule cervicali squamose-superficiali, intermedie, parabasali e basali—di cui le cellule superficiali e intermedie rappresentano la stragrande maggioranza in uno striscio convenzionale; quindi questi due tipi sono solitamente utilizzati per un’analisi pap-striscio convenzionale . Una segmentazione Weka addestrabile è stata utilizzata per identificare e segmentare i diversi oggetti sulla diapositiva. In questa fase, un classificatore a livello di pixel è stato addestrato su nuclei cellulari, citoplasma, identificazione di sfondo e detriti con l’aiuto di un citopatologo esperto utilizzando il toolkit di segmentazione Weka (TWS) addestrabile . Ciò è stato ottenuto disegnando linee / selezione attraverso le aree di interesse e assegnandole a una particolare classe. I pixel sotto le linee / selezione sono stati presi per essere il rappresentante dei nuclei, del citoplasma, dello sfondo e dei detriti.

I contorni disegnati all’interno di ogni classe sono stati utilizzati per generare un vettore di funzionalità, \(\mathop F\limits^{ \to }\) che è stato derivato dal numero di pixel appartenenti a ciascun contorno. Il vettore di funzionalità di ogni immagine (200 dal set di dati 1 e 200 dal set di dati 2) è stato definito da Eq. 2.

$ $ \vec{F} = \left, where
(2)

dove Ni, Ci, Bi e Di sono il numero di pixel dal nucleo, citoplasma, sfondo e detriti dell’immagine \(i\) come mostrato in Fig. 2.

Fig. 2
figura2

Generazione della funzione vettoriale dalla formazione di immagini

Ogni pixel estratti dall’immagine rappresenta non solo la sua intensità, ma anche una serie di caratteristiche dell’immagine che contengono un sacco di informazioni, tra cui consistenza, confini e colori all’interno di un’area di pixel di 0.201 µm2. La scelta di un vettore di funzionalità appropriato per addestrare il classificatore è stata una grande sfida e un compito nuovo nell’approccio proposto. Il classificatore di livello pixel è stato addestrato utilizzando un totale di 226 funzioni di allenamento da TWS. Il classificatore è stato addestrato utilizzando una serie di funzioni di addestramento TWS che includevano: (i) Riduzione del rumore: I filtri Kuwahara e bilaterali nel toolkit TWS sono stati utilizzati per addestrare il classificatore sulla rimozione del rumore. Questi sono stati segnalati come filtri eccellenti per rimuovere il rumore preservando i bordi , (ii) Rilevamento dei bordi: un filtro Sobel, una matrice di Hessian e un filtro Gabor sono stati utilizzati per addestrare il classificatore sul rilevamento dei bordi in un’immagine e (iii) Filtraggio delle texture: I filtri media, varianza, mediana, massima, minima e entropia sono stati utilizzati per il filtraggio delle texture.

Rimozione dei detriti

La ragione principale per le attuali limitazioni di molti dei sistemi di analisi pap-striscio automatizzati esistenti è che lottano per superare la complessità delle strutture pap-striscio, cercando di analizzare la diapositiva nel suo complesso, che spesso contengono più celle e detriti. Ciò ha il potenziale di causare il fallimento dell’algoritmo e richiede una maggiore potenza computazionale . I campioni sono coperti da artefatti – come cellule del sangue, cellule sovrapposte e piegate e batteri—che ostacolano i processi di segmentazione e generano un gran numero di oggetti sospetti. È stato dimostrato che i classificatori progettati per differenziare tra cellule normali e cellule precancerose di solito producono risultati imprevedibili quando esistono artefatti nel pap-test . In questo strumento, una tecnica per identificare le cellule della cervice utilizzando uno schema di eliminazione sequenziale trifase (raffigurato in Fig. 3) è usato.

Fig. 3
figure3figure3

Approccio di eliminazione sequenziale trifase per il rifiuto dei detriti

Lo schema di eliminazione trifase proposto rimuove sequenzialmente i detriti dal pap-striscio se ritenuto e ‘ improbabile che sia una cellula cervicale. Questo approccio è vantaggioso in quanto consente di prendere una decisione dimensionale inferiore in ogni fase.

Analisi delle dimensioni

L’analisi delle dimensioni è un insieme di procedure per determinare una gamma di misurazioni delle dimensioni delle particelle . L’area è una delle caratteristiche più basilari utilizzate nel campo della citologia automatizzata per separare le cellule dai detriti. L’analisi pap-striscio è un campo ben studiato con molta conoscenza pregressa per quanto riguarda le proprietà delle cellule . Tuttavia, uno dei cambiamenti chiave con la valutazione dell’area del nucleo è che le cellule cancerose subiscono un sostanziale aumento delle dimensioni nucleari . Pertanto, determinare una soglia di dimensione superiore che non escluda sistematicamente le cellule diagnostiche è molto più difficile, ma ha il vantaggio di ridurre lo spazio di ricerca. Il metodo presentato in questo documento si basa su una dimensione inferiore e una soglia di dimensione superiore delle cellule cervicali. Lo pseudo codice per l’approccio è mostrato in Eq. 3.

$$Se\;Area_{min} \le Area_{roi} \le Area_{max} \;poi\;\left\langle {piano} \right\rangle \;else\;\left\langle {Background} \right\rangle ,$$
(3)

dove \(Area_{max} = 85,267\,{\upmu \text{m}}^{2}\) e \(Area_{min} = 625\,{\upmu \text{m}}^{2}\) ricavato dalla Tabella 2.

Gli oggetti sullo sfondo sono considerati detriti e quindi scartati dall’immagine. Le particelle che rientrano tra \ (Area_ {min}\) e \(Area_{max}\) vengono ulteriormente analizzate durante le fasi successive dell’analisi della texture e della forma.

Analisi della forma

La forma degli oggetti in un pap-striscio è una caratteristica fondamentale nella differenziazione tra cellule e detriti . Esistono diversi metodi per il rilevamento della descrizione della forma, tra cui approcci basati su regione e contorno . I metodi basati sulla regione sono meno sensibili al rumore ma più computazionalmente intensivi, mentre i metodi basati sul contorno sono relativamente efficienti da calcolare ma più sensibili al rumore . In questo documento, è stato utilizzato un metodo basato sulla regione (perimetro2/area (P2A)). Il descrittore P2A è stato scelto in base al merito che descrive la somiglianza di un oggetto con un cerchio. Questo lo rende adatto come descrittore del nucleo cellulare poiché i nuclei sono generalmente circolari nel loro aspetto. Il P2A inoltre si riferisce a come compattezza di forma ed è definito da Eq. 4.

c c = \frac{{p^{2} }}{A}, where
(4)

dove c è il valore della compattezza della forma, A è l’area e p è il perimetro del nucleo. Si è ipotizzato che i detriti fossero oggetti con un valore P2A maggiore di 0,97 o inferiore a 0,15 secondo le caratteristiche di allenamento (illustrate nella Tabella 2).

Analisi della trama

La trama è una caratteristica molto importante che può distinguere tra nuclei e detriti. Texture immagine è un insieme di metriche progettate per quantificare la texture percepita di un’immagine . All’interno di un pap-striscio, la distribuzione dell’intensità media della macchia nucleare è molto più stretta della variazione dell’intensità della macchia tra gli oggetti detriti . Questo fatto è stato utilizzato come base per rimuovere i detriti in base alle loro intensità di immagine e informazioni sul colore utilizzando momenti Zernike (ZM) . I momenti Zernike sono utilizzati per una varietà di applicazioni di riconoscimento di pattern e sono noti per essere robusti per quanto riguarda il rumore e per avere un buon potere di ricostruzione. In questo lavoro, lo ZM come presentato da Malm et al. di ordine n con ripetizione I della funzione \ (f \ left ({r,\theta } \right)\), in coordinate polari all’interno di un disco centrato in immagine quadrata \(I\left ({x,y} \right)\) di dimensione \(m \volte m\) data da Eq. 5 è stato utilizzato.

$$A_{nl} = \frac{n + 1}{\pi }\mathop \sum \limits_{x} \mathop \sum \limits_{y} v_{nl}^{*} \left( {r,\theta } \right)I\left( {x,y} \right),$$
(5)

\(v_{nl }^{*} \left( {r,\theta } \right)\) indica il complesso coniugato di Zernike polinomio \(v_{nl} \left( {r,\theta } \right)\). Per produrre una misura di texture, le grandezze da \(A_{nl}\) centrate su ciascun pixel dell’immagine texture vengono calcolate in media .

Feature extraction

Il successo di un algoritmo di classificazione dipende molto dalla correttezza delle feature estratte dall’immagine. Le cellule nei pap-strisci nel set di dati utilizzato sono suddivise in sette classi in base a caratteristiche quali dimensioni, area, forma e luminosità del nucleo e del citoplasma. Le caratteristiche estratte dalle immagini includevano caratteristiche morfologiche precedentemente utilizzate da altri . In questo articolo sono state estratte dal nucleo tre caratteristiche geometriche (solidità, compattezza ed eccentricità) e sei caratteristiche testuali (media, deviazione standard, varianza, scorrevolezza, energia ed entropia), risultando in 29 caratteristiche in totale come mostrato nella Tabella 3.

Tabella 3 Caratteristiche estratte dalle immagini pap-smear

Selezione delle caratteristiche

La selezione delle caratteristiche è il processo di selezione dei sottoinsiemi delle caratteristiche estratte che danno i migliori risultati di classificazione. Tra queste caratteristiche estratte, alcune potrebbero contenere rumore mentre il classificatore scelto potrebbe non utilizzarne altre. Quindi, un insieme ottimale di caratteristiche deve essere determinato, possibilmente provando tutte le combinazioni. Tuttavia, quando ci sono molte caratteristiche, le possibili combinazioni esplodono in numero e questo aumenta la complessità computazionale dell’algoritmo. Gli algoritmi di selezione delle funzionalità sono ampiamente classificati nei metodi filtro, wrapper e embedded .

Il metodo utilizzato dallo strumento combina la ricottura simulata con un approccio wrapper. Questo approccio è stato proposto in ma, in questo documento, le prestazioni della selezione caratteristica viene valutata utilizzando un algoritmo foresta casuale a doppia strategia . La ricottura simulata è una tecnica probabilistica per approssimare l’optimum globale di una data funzione. L’approccio è adatto per garantire che sia selezionato il set ottimale di funzionalità. La ricerca del set ottimale è guidata da un valore di fitness . Quando la ricottura simulata è terminata, vengono confrontati tutti i diversi sottoinsiemi di caratteristiche e selezionato il più adatto (cioè quello che esegue il meglio). La ricerca del valore di fitness è stata ottenuta con un wrapper in cui è stata utilizzata la convalida incrociata k-fold per calcolare l’errore sull’algoritmo di classificazione. Diverse combinazioni dalle caratteristiche estratte vengono preparate, valutate e confrontate con altre combinazioni. Un modello predittivo viene quindi utilizzato per valutare una combinazione di funzionalità e assegnare un punteggio in base all’accuratezza del modello. L’errore di fitness dato dal wrapper viene utilizzato come errore di fitness dall’algoritmo di ricottura simulato. Un algoritmo fuzzy C-means è stato avvolto in una scatola nera, da cui è stato ottenuto un errore stimato per le varie combinazioni di funzionalità come mostrato in Fig. 4.

Fig. 4
figura4

fuzzy C-means è avvolto in una scatola nera da cui un errore di stima è ottenuta

Fuzzy C-significa consente di punti di dati nel set di dati appartenenti a tutti i cluster, iscritti nell’intervallo (0-1), come mostrato in Eq. 6.

$$m_{ik} = \frac{1}{{\mathop \sum \nolimits_{j = 1}^{c} \left( {\frac{{d_{ik} }}{{d_{jk} }}} \right)^{{2/\left( {q – 1} \right)}} }} ,$$
(6)

dove \(m_{ik}\) è l’appartenenza per i dati del punto k di cluster center i, \(d_{jk}\) è la distanza dal centro dell’ammasso j a punto di dati k e q € è un esponente che decide quanto è forte l’appartenenza dovrebbe essere. L’algoritmo fuzzy C-means è stato implementato utilizzando fuzzy toolbox in Matlab.

La defuzzificazione

Un algoritmo fuzzy C-means non ci dice quali informazioni contengono i cluster e come tali informazioni devono essere utilizzate per la classificazione. Tuttavia, definisce il modo in cui ai punti dati viene assegnata l’appartenenza ai diversi cluster e questa appartenenza fuzzy viene utilizzata per prevedere la classe di un punto dati . Questo è superato attraverso la defuzzificazione. Esistono diversi metodi di defuzzificazione . Tuttavia, in questo strumento, ogni cluster ha un’appartenenza fuzzy (0-1) di tutte le classi nell’immagine. I dati di allenamento vengono assegnati al cluster più vicino ad esso. La percentuale di dati di allenamento di ogni classe appartenente al cluster A fornisce l’appartenenza del cluster, cluster A = alle diverse classi, dove i è il contenimento nel cluster A e j nell’altro cluster. La misura di intensità viene aggiunta alla funzione di appartenenza per ogni cluster utilizzando un algoritmo di defuzzificazione del clustering fuzzy. Un approccio popolare per la defuzzificazione della partizione fuzzy è l’applicazione del principio del grado massimo di appartenenza in cui il punto dati k è assegnato alla classe m se, e solo se, il suo grado di appartenenza \(m_{ik}\) al cluster i, è il più grande. Chuang et al. proposto di regolare lo stato di appartenenza di ogni punto dati utilizzando lo stato di appartenenza dei suoi vicini.

Nell’approccio proposto, un metodo di defuzzificazione basato sulla probabilità bayesiana viene utilizzato per generare un modello probabilistico della funzione di appartenenza per ciascun punto dati e applicare il modello all’immagine per produrre le informazioni di classificazione. Il modello probabilistico è calcolato come di seguito:

  1. Convertire le distribuzioni di possibilità nella matrice di partizione (cluster) in distribuzioni di probabilità.

  2. Costruisci un modello probabilistico delle distribuzioni di dati come in .

  3. Applicare il modello per produrre le informazioni di classificazione per ogni punto dati utilizzando Eq. 7.

$${\text{P}}\left( {A_{i} |B_{j} } \right) = \frac{{P\left( {B_{j} |A_{i} } \right)*P\left( {A_{i} } \right)}}{{B_{j} }} ,$$
(7)

dove \(P\left( {A_{i} } \right),i = 0 \ldots .c\) è la probabilità precedente di \(A_{i}\) che può essere calcolata usando il metodo in cui la probabilità precedente è sempre proporzionale alla massa di ogni classe.

Il numero di cluster da utilizzare è stato determinato per garantire che il modello costruito possa descrivere i dati nel miglior modo possibile. Se vengono scelti troppi cluster, c’è il rischio di sovralimentare il rumore nei dati. Se vengono scelti troppo pochi cluster, il risultato potrebbe essere un classificatore scadente. Pertanto, è stata eseguita un’analisi del numero di cluster rispetto all’errore di test di convalida incrociata. È stato raggiunto un numero ottimale di cluster 25 e il sovrallenamento si è verificato al di sopra di questo numero di cluster. Un esponente di defuzzificazione di 1.0930 è stato ottenuto con 25 cluster, dieci volte cross-validation e 60 repliche ed è stato utilizzato per calcolare l’errore di idoneità per la selezione delle caratteristiche in cui un totale di 18 caratteristiche delle 29 caratteristiche sono state selezionate per la costruzione del classificatore. Le caratteristiche selezionate erano: area del nucleo; livello di grigio del nucleo; diametro più corto del nucleo; nucleo più lungo; perimetro del nucleo; massimi nel nucleo; minimi nel nucleo; area del citoplasma; livello di grigio del citoplasma; perimetro del citoplasma; rapporto nucleo-citoplasma; eccentricità del nucleo, deviazione standard del nucleo, varianza del livello di grigio del nucleo; entropia del livello di grigio del nucleo; posizione relativa del nucleo; media del livello di grigio del nucleo e valori di grigio del nucleo energia.

Valutazione della classificazione

In questo lavoro, il modello gerarchico dell’efficacia dei sistemi di diagnostica per immagini proposto da Fryback e Thornbury è stato adottato come principio guida per la valutazione dello strumento come mostrato nella Tabella 4.

Tabella 4 Criteri di valutazione degli strumenti

La sensibilità misura la percentuale di positivi effettivi correttamente identificati come tali mentre la specificità misura la percentuale di negativi effettivi correttamente identificati come tali. La sensibilità e la specificità sono descritte da Eq. 8.

Sensitivity Sensitivity\; \left ({TPR} \right) = \frac {TP} {TP + FN},\; Specificity\; \left ({TNR} \ right) = \frac{TN}{TN + FP}, where
(8)

dove TP = Veri positivi, FN = falsi negativi, TN = Veri negativi e FP = Falsi positivi.

GUI design and integration

I metodi di elaborazione delle immagini sopra descritti sono stati implementati in Matlab e vengono eseguiti tramite un’interfaccia utente grafica Java (GUI) mostrata in Fig. 5. Lo strumento ha un pannello in cui viene caricata un’immagine pap-striscio e il citotecnico seleziona un metodo appropriato per la segmentazione della scena (basata sul classificatore TWS), la rimozione dei detriti (basata sull’approccio a tre eliminazioni sequenziali) e il rilevamento dei confini (se ritenuto necessario, utilizzando il metodo Canny edge detection), dopo di che le funzionalità vengono estratte utilizzando il pulsante estrai funzionalità.

Fig. 5

Interfaccia utente grafica PAT

Lo strumento esegue la scansione attraverso il pap-striscio per analizzare tutti gli oggetti rimasti dopo la rimozione dei detriti. Le 18 caratteristiche descritte nella selezione delle caratteristiche vengono estratte da ciascun oggetto e utilizzate per classificare ogni cella utilizzando l’algoritmo fuzzy C-means descritto nel metodo di classificazione. In modo casuale, le caratteristiche estratte di una cella superficiale e una cella intermedia vengono visualizzate nel pannello dei risultati dell’analisi delle immagini. Una volta estratte le caratteristiche, il citotecnico (utente) preme il pulsante classify e lo strumento emette una diagnosi (positiva a malignità o negativa a malignità) e classifica la diagnosi in una delle 7 classi/fasi del cancro cervicale secondo il set di dati di allenamento.